bat365中文官方网站陈争光教授指导的2020级硕士研究生张晓文以第一作者,陈争光教授为通讯作者在中科院分区二区期刊《SpectrochimicaActa Part A: Molecular and BiomolecularSpectroscopy》在线发表了题为“Applicationof the combination method based on RF and LE in near infraredspectral modeling”的研究论文(DOI:https://doi.org/10.1016/j.saa.2022.122247,文章链接:Applicationof the combination method based on RF and LE in near infraredspectral modeling - ScienceDirect)。
拉普拉斯特征映射算法(LE)是一种非线性降维算法,能够保持样本的局部结构特征,具有较好的鲁棒性,且计算简单。但是LE算法在将数据从高维映射到低维空间过程中,容易受到光谱数据中存在的无关信息和多重共线性的影响,至使模型预测性能降低。随机蛙跳(RF)算法具有消除光谱中噪声和共线性问题能力。因此,本文在使用LE算法前,使用随机蛙跳算法消除光谱中的无关信息,降低光谱间的相关性将有利于提高LE算法的效果。利用两组公开的近红外光谱数据集(土壤数据集和药片数据集),使用RF+LE算法降维,并与单独使用RF、LE算法比较,建立偏最小二乘回归(PLSR)和支持向量机回归(SVR)模型。实验结果表明,相比RF和LE算法,采用RF+LE组合的方法能够在降低光谱变量维数和模型复杂度的同时,提高回归模型的预测精度和稳定性,是一种有效的近红外光谱降维方法。