bat365中文官方网站陈争光教授指导的2020级硕士研究生万岩同学以第一作者,陈争光教授为通讯作者在《分析试验室》(EI检索)录用了题为“两阶段相关系数波长选择方法”的研究论文。(DOI:10.13595/j.cnki.issn1000-0720.2022.082004)
论文摘要:为降低建立模型的复杂度,提高近红外光谱预测模型的预测精度,提出一种两阶段相关系数(TSCC)波长选择方法,先计算各波长点向量和浓度向量之间的相关系数,选择相关系数较大的波长点作为第一阶段波长选择结果。在此基础上计算各个波长点之间的相关系数,选择与其他波长点之间相关系数较小的波长作为建模波长。采用两组公开数据集对算法进行验证,在第一阶段波长选择结果和两阶段波长选择结果上分别建立偏最小二乘回归模型(PLSR)和多元线性回归(MLR)模型。结果表明,基于TSCC波长选择算法建立的MLR模型(TSCC-MLR)性能优于基于全谱的PLSR模型(Full-PLSR)、优于基于第一阶段波长选择结果建立的PLSR模型(CC-PLSR)和基于连续投影算法(SPA)选择的数据建立的MLR模型(SPA-MLR)。玉米数据SPA-MLR模型预测集R2为0.8353。同一数据进行第一阶段波长选择后,选出的519个特征波长建立CC-PLSR模型,预测集R2为0.8652。TSCC-MLR波长选择后的玉米数据集只需从700个光谱数据中选择13个特征波长建立TSCC-MLR模型,预测集R2为0.8951。土壤样本的近红外光谱数据集基于TSCC算法提取变量后,得到18个特征波长并建立MLR模型,预测集R2达到0.9688,相较于CC-PLSR模型和SPA-MLR模型,模型预测性能有所提升。通过两个数据集得到的结果证明了本文所提出的两阶段相关系数波长选择方法是一种有效的变量选择方法。