基于SiPLS- CARS 算法的百香果糖度无损检测

田永国1,吕都2,3*,唐健波3,黄珊3,陈超2,卢扬2,4*

(1.贵州省铜仁市沿河 土家族自治县农业技术推广中心,贵州 铜仁 565300;2.贵州省农业科学院 生物技术研究所,贵州贵阳 550025;3.贵州省农业科学院 食品加工研究所,贵州 贵阳 550025;4.贵州省农业生物技术重点实验室,贵州 贵阳 550025)

摘 要:为建立一种无损快速检测百香果糖度的技术,以百香果为研究对象,利用近红外光谱技术,并结合联合区间偏最小二乘算法和竞争适应重加权采样算法对近红外光谱进行特征波长筛选,采用偏最小二乘法和支持向量机方法建立百香果糖度预测模型。结果表明:采用多元线性回归方法建立的模型优于多元非线性回归方法建立的模型,联合区间偏最小二乘算法和竞争适应重加权采样算法筛选出的特征波长点数为67 个,占全光谱的2.90%,预测模型的相关系数R2c 为0.972 7,校正集预测均方根误差(root mean square error of calibration,RMSEC)值为0.333 8,验证集的相关系数R2p 为0.967 2,验证集预测均方根误差(root mean square error of prediction,RMSEP)值为0.366 0,模型相对分析误差(relative prediction deviation,RPD)为4.506 6。研究结果能够实现百香果糖度的无损快速检测,并且可以将百香果糖度无损检测便携检设备中的模型进行简化。

关键词:百香果;糖度;特征波长;近红外光谱;无损检测

百香果(Passiflora edulis Sims)又名西番莲、巴西果和鸡蛋果等,生长于热带地区,原产地为巴西,在我国的种植地区主要分布在广西、广东、福建等。百香果营养价值非常高,含有人体所需的17 种氨基酸、多种维生素和类胡萝卜素,还有丰富的钙、磷、铁等矿物质[1-3]。水果品质检测是指根据水果的颜色、硬度、水分、含糖量、硬度等物理和化学特性来评定水果的质量[4]。糖度能反映水果的糖含量,是决定水果品质的一个重要指标[5]。传统的糖度检测方法有折光法、旋光法、蒽酮比色法和高效液相色谱法等。然而,传统的检测方法对样品有一定的破坏性,且操作步骤繁琐、耗时长、效率低[6-7],在水果品质无损检测方面的效果并不理想,已不能满足当前人们对水果按质论价快速检测的需求。

近红外光谱技术(near infrared spectrometry,NIRS)是一种非破坏性分析方法,主要通过测定样品的近红外吸收光谱结合化学计量学知识,对样品中物质进行定性和定量分析[8-9]。与传统的检测分析方法相比,近红外光谱分析具有快速、无损、安全、简便等特点[10]。近年来,该技术已广泛应用于农产品分级、食品成分快速检测、品种鉴定、产地溯源和医药及化工等领域[11-14]。近红外光谱包含的化学信息非常丰富,除了包含有效信息,还含有噪音、杂散光和对建立预测模型无贡献的信息,甚至还含有一些干扰预测模型能力的冗余信息[15]。因此,为了提升模型的运算效率、预测能力和稳健性,提取近红外光谱中的有效信息并且剔除掉无效信息和干扰信息尤为重要。特征波长筛选的方法主要有联合区间偏最小二乘(synergic interval partial least squares,SiPLS)[16]算法、竞争适应重加权采样(competitive adaptive reweighted sampling,CARS)[17] 算法和连续投影(successive projections algorithm,SPA)[18]算法等。孔庆明等[19]采用SiPLS 算法筛选出了特征波长,建立的玉米秸秆粗蛋白含量预测模型有良好的预测能力,其预测模型的相关系数R2 为0.955 0、验证集决定系数R2p为0.978 4,验证集均方根误差为0.221 1。江水泉等[20]研究表明,CARS 算法筛选出的波长建立脐橙可溶性固形物含量预测模型,其效果优于SPA 算法的筛选结果。孟珊等[21]采用CARS 算法可以将建立预测模型的输入波长数量压缩至全波长总量的2.76%,极大地提升了模型的运算速度。

本研究以百香果为研究对象,利用近红外光谱技术建立百香果糖度预测模型,并使用SiPLS 算法筛选特征波长。由于筛选出的特征波长具有连续性,特征波长的数量较多,因此在SiPLS 算法筛选出的特征波长的基础上继续使用CARS 算法进行特征波长的二次筛选。同时,采用多元线性回归方法偏最小二乘(partial least square,PLS)法和多元非线性回归方法支持向量机(support vector regression,SVR)建立百香果糖度预测模型,并对其预测能力进行对比分析,以期为百香果糖度无损检测提供理论依据,为糖度无损检测便携检设备中的模型简化提供技术支持。

1 材料与方法

1.1 材料与试剂

百香果:收集来自广西、云南和贵州3 个地区,不同成熟度的百香果样品共计261 个果实。

1.2 仪器与设备

MPA 型傅里叶变换近红外光谱仪(分辨率最小为1.0 cm-1):德国Bruker 公司;PAL-1 型数显糖度计(测量精度为±0.2 °Brix):日本ATAGO 公司。

1.3 方法

1.3.1 百香果糖度的测定

取百香果果肉,用纱布挤压出果汁,将果汁摇晃均匀后吸取0.3 mL 置于数显糖度计棱镜测量区进行测量。测量完毕后,用蒸馏水冲洗棱镜测量区,再次用蒸馏水进行调零后进行新一轮测量。每个样品检测3 次,取平均值作为百香果的糖度。

1.3.2 百香果近红外光谱图的采集

近红外光谱仪开机后预热30 min,波数范围为12 970.3~3 594.9 cm-1,分辨率为4.0 cm-1,扫描次数为64,扫描背景光谱后,分别在百香果顶部、底部和果体赤道部位间隔120 各取1 个光谱采集点,共计5 个光谱采集点。采集百香果样品的近红外光谱图,并用平均光谱图代表百香果样品的近红外光谱图。

1.3.3 SiPLS 结合CARS 算法筛选特征波长

联合区间偏最小二乘算法是在间隔偏最小二乘(interval partial least squares,iPLS) 算法的基础上改进提出的,先将光谱划分成若干个区间,SiPLS 算法则是将建立预测模型精度高的若干个区间联合在一起建立预测模型,直到选出最佳的联合区间。但是SiPLS 算法筛选出的特征波长为整个光谱的若干个区间,其中仍然含有一些冗余信息和干扰信息。因此,本研究在SiPLS 算法筛选结果的基础上,使用CARS 算法继续筛选特征波长。

1.3.4 预测模型的建立和评价方法

本研究采用多元线性回归方法偏最小二乘法和多元非线性回归方法支持向量机以建立百香果糖度预测模型。以相关系数(R2)、均方根误差(root mean square error,RMSE) 和相对分析误差(relative percent deviation,RPD) 为预测模型的评价指标,R2 越接近1,RMSE 值越接近0,RPD 值大于2,预测模型的预测能力越强[22-23]

1.4 数据处理

采用Excel 2010 进行基础数据统计分析,采用Unscrambler 10.4 和Matlab 2019a 软件进行样品集的划分、光谱预处理、光谱特征波长的选择和预测模型的建立,采用OriginPro 2022 进行绘图。糖度测定试验,每个样品进行3 次重复试验。

2 结果与分析

2.1 百香果糖度统计分析和样品集的划分

对收集自3 个地区的261 个百香果进行糖度测定,并采用光谱-理化值共生距离(sample set partitioning based on joint x-y distances,SPXY)法,按照4:1 的比例将样品划分为校正集和验证集。将208 个校正集样品用于校正模型的建立,53 个验证集样品用于校正模型的外部验证。261 个样品的糖度、校正集样品的糖度和验证集样品的糖度统计分析结果见表1 和图1。

图1 不同样本集中百香果糖度分布直方图
Fig.1 Fructose degree distribution of passion fruits in different sample sets

A.261 个百香果样品;B.校正集样品;C.验证集样品。

表1 百香果样品糖度结果统计
Table 1 Sugar content in passion fruits

样本类型 样本数量 糖度/°Brix最小261 6.9值 最大值 平均值 标准差整体样本 1 19.84 14.81 2.18校正集 208 6.91 19.84 14.93 2.02验证集 53 7.49 19.40 14.31 2.69

由表1 可知,261 个百香果糖度为6.91~19.84 °Brix,平均值为14.81 °Brix,校正集样品的糖度范围包含了验证集样品的糖度范围,校正集样品建立的预测模型可以很好地预测验证集样品的糖度。由图1 可知,3 个样品集的百香果糖度都集中在12.00~18.00 °Brix,且样品糖度分布直方图与正态分布曲线吻合,表明收集的样品、校正集样品和验证集样品都具有广泛的代表性,可以用于预测模型的建立和验证。

2.2 百香果样品的近红外光谱图和光谱预处理

百香果样品的近红外光谱图见图2。由于近红外光谱含有的化学信息非常丰富,且在同一吸收谱带中含有多种对应的化学基团信息,因此需要对近红外光谱进行进一步处理。将不同预处理方法处理后的光谱数据,采用PLS 法建立百香果预测模型,结果见表2。

图2 百香果样品原始近红外光谱图
Fig.2 Near-infrared spectra of passion fruit samples

表2 不同预处理方式对预测模型的影响
Table 2 Influences of different preprocessing methods on the prediction models

校正集 验证集R2c R2p RMSEP RPD无预处理 8 0.811 6 0.786 0 1.321 8 2.035 5平滑 8 0.808 0 0.783 3 1.327 8 2.026 3一阶导数 8 0.795 7 0.704 0 1.539 2 1.748 1二阶导数 8 0.702 7 0.518 9 1.974 0 1.363 0标准正态变量变换 8 0.682 4 0.741 4 1.510 0 1.781 9多元散射校正 8 0.680 5 0.750 1 1.478 3 1.820 0正交信号校正 8 0.983 8 0.976 1 0.312 1 4.820 7归一化处理 8 0.796 7 0.799 3 1.234 9 2.178 8预处理方式 因子数RMSEC 0.876 2 0.884 5 0.912 3 1.100 1 1.137 6 1.141 0 0.257 0 0.910 1

由图2 可知,百香果样品的近红外光谱图在10 267、8 381、6 896、5 603、5 192 cm-1 处有明显吸收峰,10 267 cm-1 处的波峰可能是由于百香果中糖类物质的—OH 基团三倍频和水或者—CH3 基团合频振动引起的,8 381 cm-1 处的波峰可能是由于—CH3 基团和水二倍合频振动引起的,6 896 cm-1 处的波峰可能是百香果中氨基酸的酰胺键和糖类中的—OH 基团倍频振动引起的,5 603 cm-1 和5 192 cm-1 处的波峰可能是C—H 伸缩振动和百香果中有机酸的—COOH 和C O基团倍频振动引起的[24]。由表2 可知,最佳预处理方法为正交信号校正方法,预处理后的光谱数据建立的预测模型,其预测模型的R2c 为0.983 8,RMSEC 值为0.257 0,验证集的R2p 为0.976 1,RMSEP 值为0.312 1,RPD 为4.820 7,预测模型的预测能力强。

正交信号校正预处理方法主要用于消除光谱矩阵与目标值矩阵无关的信息[25],正交信号校正预处理方法处理后的近红外光谱图见图3。

图3 预处理后的百香果样品原始近红外光谱图
Fig.3 Orthogonal signal-corrected near-infrared spectra of passion fruits

2.3 SiPLS 结合CARS 算法特征波长的筛选

使用SiPLS 算法筛选进行特征波长筛选,将算法参数区间划分数量分别设置成12、14、16、18 和20,区间组合数参数设置为2、3 和4,将筛选出的特征波长采用PLS 法建立百香果预测模型,以RMSEP 值和特征波长点数量为考察指标确定算法的最佳参数,结果见图4 和表3。

图4 区间划分数量和区间组合数对SiPLS 算法波长筛选的影响
Fig.4 Effects of number of interval divisions and number of combined intervals on wavelengths screening by the SiPLS algorithm

表3 不同参数SiPLS 算法筛选出的特征彼长
Table 3 Wavelengths selected by the SiPLS algorithm with different parameters

区间划分数量 区间组合数量 最佳区间组合 特征波长范围/cm-1 12 2 [6,12] 8 778.728~8 042.024、4 335.365~3 598.661 3[6,7,12] 8 778.728~7 301.464、4 335.365~3 598.661 4 [3,6,10,12] 11 004.270~10 263.710、8 778.728~8 042.024、5 816.486~5 079.782、4 335.365~3 598.661

续表3 不同参数SiPLS 算法筛选出的特征彼长
Continue table 3 Wavelengths selected by the SiPLS algorithm with different parameters

区间划分数量 区间组合数量 最佳区间组合 特征波长范围/cm-1 14 2 [9,14] 7 401.748~6 769.186、4 227.366~3 598.661 3[7,13,14] 8 674.586~8 042.024、4 859.929~3 598.661 4[6,7,11,14] 9 311.006~8 042.024、6 128.910~5 496.348、4 227.366~3 598.661 16 2 [10,16] 7 482.747~6 931.184、4 150.225~3 598.661 3[7,10,16] 9 149.008~8 597.445、7 482.747~6 931.184、4 150.225~3 598.661 4[5,8,13,16] 10 259.850~9 708.285、8 593.588~8 042.024、5 816.486~5 264.922、4 150.225~3 598.661 18 2 [9,18] 8 531.874~8 042.024、4 088.512~3 598.661 3[8,11,18] 9 025.581~8 535.731、7 544.460~7 054.610、4 088.512~3 598.661 4 [8,11,17,18] 9 025.581~8 535.731、7 544.460~7 054.610、4 582.218~3 598.661 20 2 [10,20] 8 474.018~8 034.310、4 038.369~3 598.661 3[9,12,20] 8 917.583~8 477.875、7 586.888~7 147.181、4 038.369~3 598.661 4 [9,12,14,20] 8 917.583~8 477.875、7 586.888~7 147.181、6 699.758~6 260.051、4 038.369~3 598.661

由图4 可知,采用SiPLS 算法进行特征波长筛选时,RMSEP 值的变化趋势为4 个区间组合<3 个区间组合<2 个区间组合。RMSEP 值越小表明建立的预测模型的预测能力越好,因此,区间组合数量参数采用4 个区间组合。采用4 个区间组合,区间的划分数量为16、18 和20 时,其RMSEP 值差异不显著,但是其特征波长点分别为576、512 个和460 个,特征波长点的数量越少,预测模型的运算速度越快,因此,区间划分数量参数采用20 个区间。由表3 可知,SiPLS 算法程序采用20 个区间和4 个区间组合时,百香果糖度预测模型的特征表波长的最佳组合为[9,12,14,20],对应的近红外光谱波数段为8 917.583~8 477.875 cm-1、7 586.888~7 147.181 cm-1、6 699.758~6 260.051 cm-1 和4 038.369~3 598.661 cm-1,在样品近红外光谱中的位置见图5。

图5 SiPLS 算法筛选的特征波长
Fig.5 Characteristic wavelengths screened by the SiPLS algorithm

在SiPLS 筛选出的特征波长的基础上,利用CARS 算法进一步进行特征波长的筛选。CARS 算法参数蒙特卡罗迭代次数设置为500,运行算法程序20次,选择最优的一次结果作为最终结果,CARS 算法筛选特征波长的过程见图6。

图6 CARS 算法筛选特征波长的过程
Fig.6 Process of screening characteristic wavelengths by the CARS algorithm

由图6 可知,随着蒙特卡罗迭代次数的增加,特征波长的总数量迅速减少,当蒙特卡罗迭代次数为100 时,特征波长的总数量趋于平稳。但是随着蒙特卡罗迭代次数的增加,RMSEP 值和变量系数都总体呈现出先下降后上升的趋势,当蒙特卡罗迭代次数为40 次时,RMSEP值为4.506 6,且最小,特征波长的总数量为67 个,筛选出的特征波长点在样品近红外光谱中的位置见图7。

图7 SiPLS 结合CARS 算法筛选的特征波长
Fig.7 Characteristic wavelengths screened by SiPLS combined with CARS

2.4 百香果糖度预测模型的优选

将百香果样品的近红外光谱图的全光谱、SiPLS算法筛选的特征波长和SiPLS-CARS 算法筛选的特征波长分别采用多元线性回归PLS 法和多元非线性回归SVR 法建立百香果糖度预测模型。在使用SVR 法建立百香果糖度预测模型时,分别采用Linear、Polynomial、Radial basis function 和Sigmoid 4 种核函数,并使用网格全局寻优算法确定核函数参数,预测模型结果见表4。

表4 百香果糖度预测模型的优选
Table 4 Selection of prediction models for the sugar content in passion fruits

注:L 表示SVR 法采用的是Linear 核函数;P 表示SVR 法采用的是Polynomial 核函数;R 表示SVR 法采用的是Radial basis function 核函数;S 表示SVR 法采用的是Sigmoid 核函数。

建模方法 变量数 校正集 验证集R2c R2p RMSEP RPD全光谱-PLS 2 307 0.983 8 0.976 1 0.312 1 4.820 7 SiPLS-PLS 460 0.967 3 0.959 1 0.408 0 3.687 1 SiPLS-CARS-PLS 67 0.972 7 0.967 2 0.366 0 4.506 6全光谱-SVR(L) 2 307 0.967 5 0.957 7 0.425 5 4.014 1 SiPLS-SVR(L) 460 0.967 8 0.961 6 0.400 0 4.113 2 SiPLS-CARS-SVR(L) 67 0.972 6 0.966 1 0.371 5 4.211 8全光谱-SVR(P) 2 307 0.813 3 0.686 8 1.149 0 1.691 7 SiPLS-SVR(P) 460 0.902 0 0.635 8 1.562 9 2.362 6 SiPLS-CARS-SVR(P) 67 0.783 1 0.659 7 1.200 0 1.592 6全光谱-SVR(R) 2 307 0.949 4 0.816 0 0.901 9 3.121 0 SiPLS-SVR(R) 460 0.959 5 0.917 0 0.589 6 3.607 7 SiPLS-CARS-SVR(R) 67 0.9639 0.946 6 0.466 5 3.912 2全光谱-SVR(S) 2 307 0.4903 0.476 4 1.519 5 1.003 0 SiPLS-SVR(S) 460 0.577 6 0.557 3 1.421 7 1.086 0 SiPLS-CARS-SVR(S) 67 0.631 2 0.646 3 1.276 4 1.175 1 RMSEC 0.257 0 0.365 1 0.333 8 0.374 8 0.365 8 0.333 9 0.889 4 0.636 8 0.944 7 0.482 1 0.417 0 0.384 6 1.499 5 1.384 8 1.280 3

由表4 可知,PLS 法建立的模型优于SVR 法建立的模型,主要是因为PLS 法抗干扰能力强[26],另一方面也有可能是样品集中百香果糖度含量符合多元线性回归,这与SVR 法建立的模型其核函数为Linear 的结果一致。SVR 法建立的模型其核函数为Linear 和Radial basis function 时,模型的预测效果较好;其核函数为Polynomial 时,模型的预测效果较差;其核函数为Sigmoid 时,模型的预测效果最差。

当使用PLS 法建立百香果糖度预测模型时,样品全光谱波长点数为2 307 个,预测模型的R2c 为0.983 8,RMSEC 值为0.257 0,验证集的R2p 为0.976 1,RMSEP值为0.312 1,RPD 为4.820 7;SiPLS 特征波长点数为460 个,占全光谱的19.94%,PLS 预测模型的R2c 为0.967 3,RMSEC 值为0.365 1,验证集的R2p 为0.959 1,RMSEP 值为0.408 0,RPD 为3.687 1;SiPLS-CARS 特征波长点数为67 个,占全光谱的2.90%,PLS 预测模型的R2c 为0.972 7,RMSEC 值为0.333 8,验证集的R2p为0.967 2,RMSEP 值为0.366 0,RPD 为4.506 6。样品全光谱建立的预测模型性能最佳,SiPLS-PLS 预测模型的性能较样品全光谱建立的预测模型略有降低,但是差异不明显,预测能力依然优秀,可能是由于在筛选特征波长的过程中,不光剔除了干扰信息,也有可能剔除一些有用信息。SiPLS-CARS-PLS 预测模型的性能较SiPLS-PLS 预测模型有所提升,这可能是SiPLS-CARS 算法进一步较为精准地剔除了样品光谱中的不相关信息和干扰信息。

3 结论

本研究以来自广西、云南和贵州3 个地区不同成熟度的百香果样品为研究对象,采用近红外光谱技术对百香果的糖度进行无损快速检测。结果表明,百香果样品近红外光谱的最佳预处理方式为正交信号校正方法。采用多元线性回归方法建立的模型优于多元非线性回归方法建立的模型。SiPLS 算法筛选的特征表波长的最佳组合为[9,12,14,20],对应的近红外光谱波数段为8 917.583~8 477.875 cm-1、7 586.888~7 147.181 cm-1、6 699.758~6 260.051 cm-1 和4 038.369~3 598.661 cm-1,特征波长点数为460 个,且具有连续性仍含有一些冗余信息。采用CARS 算法筛选出的特征波长点数为67个,占全光谱的2.90%,PLS 预测模型的R2c 为0.972 7,RMSEC 值为0.333 8,验证集的R2p 为0.967 2,RMSEP 值为0.3660,RPD 为4.506 6,能够实现百香果糖度的无损快速检测,并且对预测模型中的近红外光谱数据进行了简化,可以为百香果糖度无损检测便携检设备的开发提供技术支持。

参考文献:

[1] 梁倩, 李咏富, 龙明秀, 等.百香果化学成分及药理活性研究进展[J].食品工业科技, 2018, 39(20): 343-347.LIANG Qian, LI Yongfu, LONG Mingxiu, et al.Research progress on chemical constituents and pharmacological effects of Passiflora edulis Sims[J].Science and Technology of Food Industry, 2018, 39(20): 343-347.

[2] 周红玲, 郑云云, 郑家祯, 等.百香果优良品种及配套栽培技术[J].中国南方果树, 2015, 44(2): 121-124.ZHOU Hongling, ZHENG Yunyun, ZHENG Jiazhen, et al.Excellent varieties of passion fruit and their supporting cultivation techniques[J].South China Fruits, 2015, 44(2):121-124.

[3] 杜婵娟, 杨迪, 叶云峰, 等.广西百香果采后果腐病病原的鉴定[J].植物病理学报, 2022, 52(1): 109-113.DU Chanjuan, YANG Di, YE Yunfeng, et al.Identification of pathogen of postharvest rot of passion fruit in Guangxi[J].Acta Phytopathologica Sinica, 2022, 52(1): 109-113.

[4] 郝麒麟.巫山脆李品质评价研究[D].重庆: 西南大学, 2021.HAO Qilin.Study on quality evaluation of Wushan crispy plum[D].Chongqing: Southwest University, 2021.

[5] XU J L, CHEN M, WANG Y C, et al.Study on non-destructive detection method of kiwifruit sugar content based on hyperspectral imaging technology[J].Spectroscopy and Spectral Analysis, 2021, 41(7): 2188-2195.

[6] 窦文卿, 柴春祥, 鲁晓翔.无损检测技术在水果品质评价中应用的研究进展[J].食品工业科技, 2020, 41(24): 354-359.DOU Wenqing, CHAI Chunxiang, LU Xiaoxiang.Research progress of non-destructive detection technique in fruit quality evaluation[J].Science and Technology of Food Industry, 2020, 41(24): 354-359.

[7] LI S P, LUO H P, HU M H, et al.Optical non-destructive tech -niques for small berry fruits: A review[J].Artificial Intelligence in Agriculture, 2019, 2: 85-98.

[8] PASQUINI C.Near infrared spectroscopy: A mature analytical technique with new perspectives-A review[J].Analytica Chimica Acta,2018, 1026: 8-36.

[9] ZHANG M Q, ZHAO C, SHAO Q J, et al.Determination of water content in corn stover silage using near-infrared spectroscopy[J].International Journal of Agricultural and Biological Engineering, 2019,12(6): 143-148.

[10] AGULHEIRO-SANTOS A C, RICARDO-RODRIGUES S, LARANJO M, et al.Non -destructive prediction of total soluble solids in strawberry using near infrared spectroscopy[J].Journal of the Science of Food and Agriculture, 2022, 102(11): 4866-4872.

[11] DING Y H, YAN Y L, LI J, et al.Classification of tea quality levels using near-infrared spectroscopy based on CLPSO-SVM[J].Foods,2022, 11(11): 1658.

[12] PRIETO N, PAWLUCZYK O, DUGAN M E R, et al.A review of the principles and applications of near-infrared spectroscopy to char -acterize meat, fat, and meat products[J].Applied Spectroscopy, 2017,71(7): 1403-1426.

[13] 李嘉仪, 余梅, 李脉泉, 等.近红外光谱和模式识别的菊花品种无损鉴别[J].光谱学与光谱分析, 2022, 42(4): 1129-1133.LI Jiayi, YU Mei, LI Maiquan, et al.Nondestructive identification of different Chrysanthemum varieties based on near -infrared spec -troscopy and pattern recognition methods[J].Spectroscopy and Spectral Analysis, 2022, 42(4): 1129-1133.

[14] RAGHAVACHARI R.Near-infrared applications in biotechnology[M].Boca Raton: CRC Press, 2020.

[15] 李艳坤, 董汝南, 张进, 等.光谱数据解析中的变量筛选方法[J].光谱学与光谱分析, 2021, 41(11): 3331-3338.LI Yankun, DONG Runan, ZHANG Jin, et al.Variable selection methods in spectral data analysis[J].Spectroscopy and Spectral Analysis, 2021, 41(11): 3331-3338.

[16] CHEN Q S, CHEN M, LIU Y, et al.Application of FT-NIR spectroscopy for simultaneous estimation of taste quality and taste-related compounds content of black tea[J].Journal of Food Science and Technology, 2018, 55(10): 4363-4368.

[17] NIE L X, DAI Z, MA S C.Enhanced accuracy of near-infrared spectroscopy for traditional Chinese medicine with competitive adaptive reweighted sampling[J].Analytical Letters, 2016, 49(14): 2259-2267.

[18] TANG R N, CHEN X P, LI C.Detection of nitrogen content in rubber leaves using near-infrared (NIR) spectroscopy with correlationbased successive projections algorithm (SPA)[J].Applied Spec -troscopy, 2018, 72(5): 740-749.

[19] 孔庆明, 谷俊涛, 高睿, 等.基于组合偏最小二乘的特征波段优选方法在氨、碱化处理玉米秸秆粗蛋白检测中的研究[J].分析测试学报, 2020, 39(11): 1334-1343.KONG Qingming, GU Juntao, GAO Rui, et al.Study on detection of crude protein in ammonified and alkalized corn straw by spectrum characteristic band selection method based on synergy interval partial least squares[J].Journal of Instrumental Analysis, 2020, 39(11):1334-1343.

[20] 江水泉, 孙通.基于可见/近红外光谱和变量选择的脐橙可溶性固形物含量在线检测[J].食品与机械, 2020, 36(2): 89-93.JIANG Shuiquan, SUN Tong.Online detection of soluble Solid content in navel orange based on visible/near infrared spectroscopy and variable selection[J].Food & Machinery, 2020, 36(2): 89-93.

[21] 孟珊, 李新国, 焦黎.基于CARS 算法的湖滨绿洲土壤表层有机碳估算[J].环境科学与技术, 2022, 45(8): 218-225.MENG S, LI X G, JIAO L.Estimation of surface soil organic carbon in lakeside oasis based on CARS algorithm[J].Environmental Science & Technology, 2022, 45(8): 218-225.

[22] WOLD S, SJÖSTRÖM M, ERIKSSON L.PLS-regression: A basic tool of chemometrics[J].Chemometrics and Intelligent Laboratory Systems, 2001, 58(2): 109-130.

[23] 崔蕴涵, 许金钗, 方智毅, 等.莲子含水率近红外光谱检测模型构建[J].食品研究与开发, 2021, 42(18): 130-135.CUI Yunhan, XU Jinchai, FANG Zhiyi, et al.Detection model of lotus seed water content based on near-infrared spectroscopy[J].Food Research and Development, 2021, 42(18): 130-135.

[24] WORKMAN J, WEYER L.Practical guide and spectral atlas for interpretive near-infrared spectroscopy[M].2nd ed.Boca Raton: CRC Press, 2012.

[25] PORNPRASIT R, PORNPRASIT P, BOONMA P, et al.A study on prediction performance of the mechanical properties of rubber using Fourier-transform near infrared spectroscopy[J].Journal of Near Infrared Spectroscopy, 2018, 26(6): 351-358.

[26] CHU J Q, WANG D X, ZHANG L M, et al.Green layer-by-layer assembly of porphyrin/G-quadruplex-based near-infrared nanocomposite photosensitizer with high biocompatibility and bioavailability[J].ACS Applied Materials & Interfaces, 2020, 12(6): 7575-7585.

Nondestructive Measurement of Passion Fruit Sugar Content Based on SiPLS and CARS Algorithms

TIAN Yongguo1,LÜ Du2,3*,TANG Jianbo3,HUANG Shan3,CHEN Chao2,LU Yang2,4*
(1.Agricultural Technology Extension Center of Yanhe Tujia Autonomous County,Tongren 565300,Guizhou,China;2.Institute of Biotechnology,Guizhou Academy of Agricultural Sciences,Guiyang 550025,Guizhou,China;3.Institute of Food Processing,Guizhou Academy of Agricultural Sciences,Guiyang 550025,Guizhou,China;4.Guizhou Key Laboratory of Agricultural Biotechnology,Guiyang 550025,Guizhou,China)

Abstract:A non-destructive method for rapidly measuring the sugar content in passion fruits was established.The near-infrared spectroscopy was combined with the synergy interval partial least squares(SiPLS)and the competitive adaptive reweighted sampling(CARS)algorithms to screen the characteristic wavelengths of the near-infrared spectroscopy.The partial least squares and support vector machine were used to establish the prediction model of sugar content in passion fruits.The results showed that the model established by multivariate linear regression outperformed that established by multivariate nonlinear regression,and the number of characteristic wavelengths screened by the SiPLS-CARS algorithms was 67,accounting for 2.90% of the full spectrum.The prediction model showed the R2c of 0.972 7,the root mean square error of calibration(RMSEC)of 0.333 8,the R2p of 0.967 2 and the root mean square error of prediction(RMSEP)of 0.366 0 on the validation set,and the relative prediction deviation(RPD)of 4.506 6.The established method can realize non-destructive and rapid measurement of passion fruit sugar content,and the model in the portable equipment for non-destructive measurement of passion fruit sugar can be simplified.

Key words:passion fruit;sugar content;characteristic wavelength;near -infrared spectrum;non -destructive measurement

DOI:10.12161/j.issn.1005-6521.2023.20.025

基金项目: 贵州省科技计划项目(黔科合支撑〔2021〕一般140)

作者简介:田永国(1976—),男(汉),高级农艺师,本科,研究方向:农业技术推广与农产品加工。

* 通信作者: 吕都(1988—),男(汉),副研究员,硕士,研究方向:光谱快速检测;卢扬(1981—),男(汉),副研究员,硕士,研究方向:农产品精深加工与安全检测。

引文格式:

田永国,吕都,唐健波,等.基于SiPLS-CARS 算法的百香果糖度无损检测[J].食品研究与开发,2023,44(20):184-190.

TIAN Yongguo1,LÜ Du,TANG Jianbo,et al.Nondestructive Measurement of Passion Fruit Sugar Content Based on SiPLS and CA RS Algorithms[J].Food Research and Development,2023,44(20):184-190.

加工编辑:王艳

收稿日期:2023-04-17