十堰微网站建设价格,武当王也拜见老天师,在线设计平台哪个好用,商城页面《基于智能计算的降维技术研究与应用》皋军著#xff08;2013#xff09; 前言特征降维的需求随着社会信息化的发展#xff0c;在具体的只能识别过程中需要处理的数据越来越多地呈现出高位特征#xff0c;比如图像处理、文本分类、视频检索、计算机视觉、微阵列数据基因选择… 《基于智能计算的降维技术研究与应用》皋军著2013 前言特征降维的需求 随着社会信息化的发展在具体的只能识别过程中需要处理的数据越来越多地呈现出高位特征比如图像处理、文本分类、视频检索、计算机视觉、微阵列数据基因选择和基于生物特征的身份识别等。造成这种现象的主要原因在于在智能识别过程中只有当样本已经包含了足够多的模式分类信息时才能得到较好的智能识别效果。然而如何确定特征中是否已经包含了足够多的类别信号本身就是一个很难解决的问题。因此为了提高模式识别的效果在通常情况下人们通常采集尽可能多的特征去提现样本的类别信息这导致原始样本空间的维数可能达到几千维甚至上万维而如果在如此高维的原始空间直接使用模式识别方法那么所得到的只能识别效果将受到较大的影响。这是因为在如此高维的特征中存在大量的冗余特征使得特征之间的相关性较强从而增加了模式分类算法的负担降低了算法的效率。同时由于随着样本特征维数的增加使得对样本的统计特性更加难以估计从而会影响分类算法的泛化能力呈现所谓的过学习的现象。 面临的问题和挑战 目前特征降维技术作为一种关键的数据预处理技术被广泛加一研究并在不同的实际应用领域得到了较为成功的应用但随着新理论和新技术的不断发展特别是大量新兴的只能识别应用领域的需求对特征降维技术提出了更高的要求使得现有的特征降维技术面临了更大的挑战。比如 1如何提高基于支持向量机的特征选择方法的泛化能力和鲁棒性 2如何更好地实现特征提取技术与模糊聚类技术的有机结合以提高特征降维方法的鲁棒性 3如何提高特征降维方法中的距离度量学习的有效性 4如何将特征降维方法中的关键技术和理论运用到支持向量机中以提高支持向量机的泛化能力和鲁棒性 5如何结合张量理论提高特征降维的效果 6如何在具有明显不同分布的源域和目标域实现提取技术等。 第一章 绪论 特征降维的方法在过去的几十年中呗广泛地加一研究但总体上可以将已有的方法分为两大类即特征选择Feature Select和特征提取Feature Extraction。 特征选择技术 定义特征选择是在原始的特征集中选取最有代表性的特征子集重新构造一低维的样本空间。显而易见最直观的特征选择就是枚举法通过遍历原始特征集从所有的特征子集中寻找出最有利于只能识别的特征子集得到全局最优解。从这一层面上来讲枚举法更适用于低维的原始样本空间而在处理具有高维特征的数据时枚举法将消耗大量的时间和空间资源甚至在可计算状态下并不能获得全局最优。 近几年来具有时间和空间复杂度低、局部最优解或次优解特点的特征选择方法被大量地提出比如 基于支持向量机SVM的特征选择方法[2-5]一般依赖结构风险最小化原理具有较强的泛化能力。在特征选择问题上较于基于经验风险最小的众多方法具有更好的鲁棒性。 支持向量机的回归特征消除法the SVM Recurisive Feature Elimination,SVM-RFE时间复杂度与样本特征数目成正比。 势支持向量机Potential Support Vector MachineP-SVM通过定义新的木匾函数和相应的边界条直接选取支持特征从而提高特征选择的效率。同时由于定义了新的边界条件在一定程度上减小了边缘误差的传播。 基于概率密度估计的特征选择方法[6-7] 基于信息论的特征选择方法[8-10] 基于特征加权的特征选择方法[11-13]通过对每一特征赋予相应的权值来表征不同特征对模式分类的贡献大小。 加权K-均值类型聚类Weighting in K-Means Type ClusteringW-K——Means通过无监督的模式分类聚类来得到每个特征所对应的权值并对相应的权值进行排序使用聚类的有效性来作为特征选择的标准。 RELIEF特征选择方法根据识别相邻模式的区分能力来迭代产生相应特征的权值算法简单有效。 I-RELIEF依据最大期望原理重新构造迭代目标函数提出新的迭代RELIEF算法该方法在一定程度上继承了RELIEF的有点同时可以实现多类模型分类的特征选择提高算法的适应性。 这些特征选择方法根据各自不同的评测标准来实现特征选择而一般来说基于支持向量机、基于特征加权的特征选择方法相对于其他的方法较为直观和简单。 特征提取技术(也叫特征变换) 定义对原始特征空间采用采用某种具体的变换映射操作已获取低维的投影空间。总体山更可分为线性方法和非线性方法。 特征提取方法 线性方法基于主成分分析PCA无监督方法以方差大小作为衡量信息量大小来作为衡量信息量多少的标准实现特征提取。线性判别分析LDA有监督方法在充分使用一直训练样本类别信息的前提下通过构造所谓的类内散度和类间散度并极大化类间散度和类内散度的冠以Rayleigh熵以得到类间最大类内最小的特征投影矢量实现特征提取。该方法物理意义明确、几何意义直观然而存在小样本问题处理高维小样本数据时类内散度矩阵容易发生异变。非线性方法 核方法KPCA、KLDA、LPP 流形 第二章 广义的势支持特征选择方法第三章 具有特征排序功能的鲁棒性模糊聚类第四章基于语境距离测量的拉普拉斯最大间距判决准则第五章 基于模糊最大散度差判别准则的聚类方法第六章 具有模糊聚类功能的双向二维监督特征提取方法第七章 基于局部加权均值的领域适应学习框架第八章 基于矩阵模式的最小类内散度支持向量机第九章 基于全局和局部保持的半监督支持向量机