基于距离和径向基核函数的加权KPCA分析
罗小平,沈徐辉,杜鹏英
浙江大学电气工程学院,浙江杭州
浙江大学城市学院智能系统重点实验室,浙江杭州
摘 要:针对利用核主成分分析方法处理非线性问题存在对干扰点的敏感性和特征空间中的主成分缺乏明确的物理意义等缺点,提出了一种改进的模糊KPCA(ImprovedFuzzyKernelPrincipalComponentAnalysis,IFKPCA)算法,对每个样本点进行加权处理,并利用基于距离的特征核函数和径向基核函数,把特征空间中的重构误差和输入空间的误差对应起来。用算法对2个无干扰和有干扰的数据集进行了仿真实验。同时,对药物代谢的数据进行主成分提取。结果表明,IFKPCA弱化了干扰点对样本分布的影响,表现出较好的鲁棒性;基于距离的特征核函数对样本分布具有较大的依赖性,而径向基核函数对样本分布具有良好的鲁棒性,对药物代谢的应用结果也进一步表明了IFKPCA的有效性和可行性。
关 键 词:核主成分;IFKPCA;核函数;敏感性
1 引 言
Scholkopf于1998年首次提出基于核函数的非线性主成分分析, 简称为核主成分分析(KPCA)[1]。该方法在模式识别、信号处理,函数逼近和图像处理等方面取得了良好的效果。但是,常规的KPCA方法是利用特征空间中较小方差的较优来实现的,对样本数据点的分布具有很大的敏感性。同时,如果样本中存在个别误差较大的值,那么对KPCA的结果也会造成影响。针对这些问题,有学者通过在一个大的样本集中选择一个合适的子样本集来进行分析,如Rousseeuw提出了较小协方差决定子方法[2],Gabrys,Baruque和Corchado提出了基于子集的方法[3]; 而Lu,Zhang,Zhang,andZhang(2003)[4]和Lu,Zhang,Du,andLi(2004)等[5],则通过排除异常值的方法对样本集进行预处理。值得注意的是,这类方法并不适合用于小样本集。基于以上问题,提出了一种基于模糊的改进KPCA(IFKPCA)方法,通过改进各样本点的加权值,很好地解决了样本点敏感性问题以及RKFPCA方法中存在的干扰点分布限制问题。
相关阅读:
- ...· Efinix® 全力驱动AI边缘计算,成功推出Trion™ T20 FPGA样品, 同时将产品扩展到二十万逻辑单元的T200 FPGA
- ...· 英飞凌亮相进博会,引领智慧新生活
- ...· 三电产品开发及测试研讨会北汽新能源专场成功举行
- ...· Manz亚智科技跨入半导体领域 为面板级扇出型封装提供化学湿制程、涂布及激光应用等生产设备解决方案
- ...· 中电瑞华BITRODE动力电池测试系统顺利交付北汽新能源
- ...· 中电瑞华FTF系列电池测试系统中标北京新能源汽车股份有限公司
- ...· 中电瑞华大功率高压能源反馈式负载系统成功交付中电熊猫
- ...· 中电瑞华国际在电动汽车及关键部件测评研讨会上演绎先进测评技术