开阳富硒枇杷富含微量元素硒,有助于增强人体的免疫力,其果皮及果肉均显橙黄色,具有独特的口感以及丰富的营养价值,被称为贵州枇杷王[1]。枇杷糖度是衡量其内部品质的重要指标之一,枇杷糖度传统的测定方法是利用折射仪测定,然而该方法存在耗费时间、破坏样本,以及难以实现大规模检测等缺点[2]。因此,开展枇杷糖度的快速检测研究对其品质快速分级以及销售等具有非常重要的指导意义。
基于光谱原理的快速无损检测技术因具有检测速度快、不破坏样本等优势,受到国内外科研学者的关注。近年来,该技术已被广泛地应用于水果内、外部品质的检测领域[3-9]。目前,国内外科研学者已研究了关于樱桃[10]、橙子[4,11]、猕猴桃[2,5,12]、苹果[13-14]、桃[6,15]、李子[16]、梨[17-18]以及蓝莓[19]等水果糖度的快速无损检测,并取得了较好的成果。Hu等[20]无损检测了1-甲基环丙烯(1-methylcyclopropene,1-MCP)对“海沃德”猕猴桃中不同糖分含量积累的诱导机制。高升等[21]基于可见/近红外透射光谱技术无损检测了红提糖度,得出采用最小二乘支持向量机所建模型的效果好,但模型的运算时间较长;对于采用偏最小二乘回归所建模型的运算时间较短,但模型的预测性能较差。光谱技术在水果内、外部品质快速无损检测的应用中,面临的主要瓶颈是数据冗余,这严重影响了检测模型的运算效率。实现水果内、外部品质的无损检测,亟需建立简化的检测模型,而且采用光谱技术以及反向传播(back propagation,BP)神经网络预测枇杷糖度的快速无损检测研究也未见报道。
本文使用紫外/可见光纤光谱仪获取开阳枇杷的反射光谱;利用标准正态变换(standard normal variation,SNV)以及多元散射校正(multi-scatter calibration,MSC)预处理原始的反射光谱,选取较优的预处理方法,应用竞争性自适应重加权算法(competitive adaptive reweighted sampling,CARS)、连续投影算法(successive projection algorithm,SPA)以及SPA+CARS 3种方法分别筛选特征变量,构建简化的BP神经网络检测模型,依据模型的剩余预测偏差确定相对较优的开阳枇杷糖度快速无损检测模型,为研发开阳枇杷糖度的快速无损检测装备提供参考。
开阳富硒枇杷于2021年5月23日采摘自贵州省贵阳市开阳县禾丰乡枇杷果园。为使样品具有代表性,从不同的果树上随机挑选出120个无病虫害且无表面损伤的枇杷样品。枇杷样品采摘后马上运送至贵州省农产品无损检测工程研究中心实验室,并在(22±2)℃条件下进行试验。试验前先用软纸轻轻擦掉枇杷表面的杂物,对其依次编号后进行反射光谱采集以及糖度的测定。
折射仪(ATAGO PAL-α):日本 Atago公司;光纤光谱仪(QEPro):蔚海光学仪器(上海)有限公司。
1.3.1 反射光谱采集
反射光谱采集前,利用适配器将反射探头安装在支架上,反射探头离枇杷表面大约1cm。试验依据标准反射白板的光谱强度,通过调整积分时间等参数,使采集到白板的反射率接近于100%。光谱仪的积分时间为110 ms,扫描平均次数为8次,滑动平均宽度为1。同时,确保采集枇杷反射光谱时的参数保持不变。
将标记好的枇杷样本紧靠在反射探头支架上,每个枇杷样本分A、B两面,每面分别采集3次(靠近花萼部位、靠近赤道部位、靠近果梗部位),最终计算6次采集到反射率的平均值,作为该枇杷样本原始的反射光谱。
1.3.2 糖度的测定
获取完所有枇杷样本的反射光谱后,立即进行枇杷糖度的测定。参照NY/T 2637—2014《水果和蔬菜可溶性固形物含量的测定折射仪法》的方法,分别将每个枇杷样本A、B两面的果肉压成汁,随后使用一次性滴管将果汁滴到折射仪的检测凹槽中,读出糖度的参考值。每个枇杷样本以A、B两面测定结果的算术平均值作为该枇杷样本的糖度参考值。
1.3.3 光谱处理及模型评价
1.3.3.1 光谱预处理及特征变量筛选
试验采用SNV和MSC预处理原始的反射光谱数据,以消除原始的反射光谱中的噪声信号,探究相对较优预处理方法。应用CARS以及SPA筛选特征变量。其中CARS应用五折交叉验证筛选出n个偏最小二乘模型的交叉验证均方根误差(root mean squares errors for cross validation,RMSECV)最小的子集,最终将这些子集确定为相对较优的特征变量[17]。而SPA依据均方根误差(root mean squares errors,RMSE)来确定相对较优的特征变量。
1.3.3.2 建模方法及模型评价方法
试验采用BP神经网络分别建立基于全光谱以及特征变量的开阳枇杷糖度无损检测模型,BP神经网络是当前应用很广泛的一种人工神经网络模型[22]。
将建模集和预测集的相关系数(rc)和(rp),建模集的均方根误差(root mean squares errors for calibration,RMSEC)和预测集的均方根误差(root mean squares errors for prediction,RMSEP),以及剩余预测偏差(residual predictive deviation,RPD)作为衡量模型优劣的主要指标。若RPD<1.4,证明构建的检测模型无法完成预测;1.4≤RPD<1.8,则模型仅可粗略地预测;1.8≤RPD<2.0,证明检测模型可以完成相对较好的预测;RPD≥2,证明模型可以较好地完成预测[23],RPD的计算公式如下。
式中:SD为预测集中枇杷样本糖度值的标准偏差(standard deviation,SD)。
在建立无损检测模型前,先基于反射光谱以及糖度参考值将所有枇杷样本划分为建模集和预测集,样本集划分优劣的评判标准是建模集中参考值范围是否比预测集的范围宽。本文应用光谱-理化值共生距离方法[24]将120个枇杷样本依照3∶1的比例划分为90个建模集以及30个预测集。其中,建模集中枇杷糖度的范围(8.50%~13.80%)比预测集中的范围(9.30%~13.70%)宽,这样划分的样本集有助于后期构建相对较好的无损检测模型。建模集以及预测集中枇杷糖度的频率分布图见图1。
图1 枇杷糖度频率分布图
Fig.1 Probability distribution of loquat sugar content
选择360 nm~1 000 nm波段作为有效原始光谱区域,该区域总共包含了835个波段。由于原始反射光谱中包含一些噪声,为提高枇杷糖度无损检测模型的精准度及稳定性,分别运用SNV以及MSC对原始的反射光谱进行预处理。所有枇杷的原始的反射光谱以及经过SNV、MSC预处理后的相对反射光谱见图2。
图2 枇杷的反射光谱
Fig.2 Reflectance spectra of loquat
(a)原始的光谱;(b)SNV预处理后的光谱;(c)MSC预处理后的光谱。
由图2可知,预处理后的反射光谱曲线要比原始反射光谱曲线平滑,说明对原始反射光谱进行预处理去掉了部分噪声以及背景干扰信息。为进一步分析比较SNV以及MSC两种方法预处理原始的反射光谱效果,分别将原始的反射光谱(original reflectance spectra,ORR)以及经过SNV和MSC预处理后的相对反射光谱输入BP神经网络模型中,构建枇杷糖度无损检测模型,建模结果见表1。
表1 基于两种预处理方法的BP神经网络模型对枇杷糖度的检测结果
Table 1 Detection results of loquat sugar content by BP neural network model based on the two preprocessed methods
检测模型光谱预处理方法images/BZ_146_485_586_1167_612.png建模集 预测集rc RMSEC/% rp RMSEP/% RPD BP ORR 0.78 0.86 0.79 0.84 1.63 MSC 0.81 0.82 0.83 0.80 1.70 SNV 0.85 0.72 0.83 0.79 1.73
由表1可知,基于两种方法构建的无损检测模型的性能均优于原始的反射光谱,而且经SNV预处理后建立的BP神经网络检测模型具有相对较大的rc(0.85)、rp(0.83)和RPD(1.73)以及较小的RMESC(0.72%)和RMSEP(0.79%),说明SNV预处理方法相对较好,因此本文应用SNV预处理原始的反射光谱。
2.3.1 采用SPA筛选特征变量
应用SPA筛选特征变量时,依据RMSE来确定相对较优的特征变量。SPA筛选特征变量的结果见图3。
图3 SPA筛选特征变量的结果
Fig.3 Characteristic variables selected by successive projection algorithm(SPA)
(a)RMSE随着SPA中有效变量数的变化规律;(b)SPA筛选的特征变量。
由图3(a)可知,有效变量数小于5时,RMSE随着有效变量数的增加而下降,然而有效变量数大于5时,RMSE减小的趋势不明显,因此将这5个变量(占总变量的0.59%)作为特征变量,图3(b)即为筛选出的5个特征变量。
2.3.2 采用CARS筛选特征变量
应用CARS筛选特征变量时,应用五折交叉验证方法计算所构建的偏最小二乘模型的RMSECV(蒙特卡洛采样次数:50),相对较优的特征变量通过RMSECV的最小值来确定。CARS筛选特征变量的结果见图4。
图4 CARS筛选特征变量的结果
Fig.4 Characteristic variables selected by competitive adaptive reweighted sampling(CARS)
(a)RMSECV随着采样次数的变化规律;(b)CARS筛选的特征变量。
由图4(a)可知,第24次采样获得的RMSECV值最小(0.67),该变量集包括了49个特征变量(占总变量的5.87%),图4(b)即为筛选的49个特征变量。为进一步探究SPA+CARS筛选的特征变量对BP神经网络模型检测性能的影响,将SPA筛选的5个特征变量以及CARS筛选的49个特征变量组合在一起,剔除重合的1个特征变量,构成新的特征变量(包含53个特征变量,占总变量的6.34%)。SPA+CARS组合筛选的特征变量分布情况见图5。
图5 SPA+CARS筛选的特征变量
Fig.5 Characteristic variables selected by SPA+CARS
将全光谱(full spectra,FS)以及应用SPA、CARS和SPA+CARS筛选的特征变量作为自变量,建模集以及预测集中枇杷糖度参考值作为因变量,建立预测开阳枇杷糖度BP神经网络无损检测模型。基于特征变量构建的BP神经网络检测模型对开阳枇杷糖度的预测结果见表2。
表2 基于特征变量构建的BP神经网络模型对枇杷糖度的预测结果
Table 2 Detection results of loquat sugar content by BP neural network model based on the characteristic spectra
光谱预处理方法变量数建模集 预测集rc RMSEC/% rp RMSEP/% RPDimages/BZ_147_804_1590_828_1629.pngFS 835 0.85 0.72 0.83 0.79 1.73 SPA 5 0.72 0.94 0.85 0.77 1.76 CARS 49 0.92 0.55 0.91 0.56 2.42 SPA+CARS 53 0.81 0.81 0.91 0.58 2.33
由表2可知,基于全光谱和SPA筛选的特征变量构建的BP神经网络检测模型仅可粗略地预测枇杷糖度,其RPD值分别为1.73和1.76。而基于CARS筛选的特征变量构建的CARS-BP神经网络检测模型具有相对较大的rc(0.92)和rp(0.91)以及较小的RMSEC(0.55%)和RMSEP(0.56%),且 RPD 值(2.42)大于2,表明构建的CARS-BP神经网络检测模型具有较好的预测性能。同时采用CARS从835个全变量中筛选出了49个特征变量,占总变量的5.87%,大大提高了模型的运算效率。另外,基于SPA+CARS筛选的特征变量构建的检测模型的RPD值为2.33,相对于CARSBP神经网络检测模型,并没有提升BP神经网络模型预测性能。综上所述,CARS算法是一种较好的变量筛选方法,与文献[17]报道一致,而且构建的CARSBP神经网络预测模型对检测开阳枇杷糖度具有较好的检测能力,且运算效率得到了明显提升。CARSBP神经网络无损检测模型对开阳枇杷糖度的检测结果见图6。
图6 枇杷糖度的实测值与预测值
Fig.6 Measured and predicted values of loquat sugar content
本研究以开阳富硒枇杷为研究对象,采用紫外/可见光纤光谱仪采集开阳枇杷的反射光谱,探究比较了两种方法(SNV和MSC)对原始的反射光谱的预处理效果,得出经SNV预处理后建立的BP神经网络检测模型具有较大的rc(0.85)、rp(0.83)和RPD(1.73)以及较小的RMESC(0.72%)和RMSEP(0.79%),说明 SNV预处理效果相比于MSC较好;应用SPA、CARS以及SPA+CARS分别筛选特征变量,进而基于筛选的特征变量构建了预测开阳枇杷糖度的BP神经网络检测模型,得出采用CARS从835个全光谱中筛选了49个特征变量,不仅很好地提高了检测模型的运算效率,而且基于CARS筛选的特征变量构建的CARS-BP神经网络检测模型具有相对较大的rc(0.92)、rp(0.91)以及较小的RMSEC(0.55%)、RMSEP(0.56%),RPD 值(2.42)大于2,表明构建的CARS-BP神经网络检测模型具有较好的预测性能。为研发开阳枇杷糖度快速无损检测装备奠定较好的理论基础。
[1]赵彬.美味又营养的开阳富硒枇杷[J].大众科学,2018(10):22-23.ZHAOBin.Delicious and nutritious Kaiyang selenium-rich loquat[J].China Public Science,2018(10):22-23.
[2]董金磊,郭文川.采后猕猴桃可溶性固形物含量的高光谱无损检测[J].食品科学,2015,36(16):101-106.DONG Jinlei,GUO Wenchuan.Nondestructive detection of soluble solid content of postharvest kiwifruits based on hyperspectral imaging technology[J].Food Science,2015,36(16):101-106.
[3]王芹志,强锋,何建国,等.基于可见-近红外光谱预测灵武长枣脆度及模型优化[J].食品与发酵工业,2017,43(3):205-211.WANG Qinzhi,QIANG Feng,HE Jianguo,et al.The model of predicting of the brittleness of Lingwu jujube by visible-near infrared spectroscopy and its optimization[J].Food and Fermentation Indus-tries,2017,43(3):205-211.
[4]王旭.冰糖橙可溶性固形物和pH值近红外光谱检测[J].食品研究与开发,2017,38(3):143-146.WANG Xu.Detecting of soluble solid content and pH of Bingtang orange by near-infrared spectroscopy[J].Food Research and Development,2017,38(3):143-146.
[5]许丽佳,陈铭,王玉超,等.高光谱成像的猕猴桃糖度无损检测方法[J].光谱学与光谱分析,2021,41(7):2188-2195.XU Lijia,CHEN Ming,WANG Yuchao,et al.Study on non-destructive detection method of kiwifruit sugar content based on hyperspectral imaging technology[J].Spectroscopy and Spectral Analysis,2021,41(7):2188-2195.
[6]武琳霞,李玲,习佳林,等.桃品质的无损检测技术研究进展[J/OL].食品科学(2022-01-07)[2021-10-18].https://kns.cnki.net/kcms/detail/11.2206.TS.20211015.2026.020.html.WULinxia,LILing,XIJialin,et al.Research progress of nondestructive detection for peach quality[J/OL].Food Science(2022-01-07)[2021-10-18].https://kns.cnki.net/kcms/detail/11.2206.TS.20211015.2026.020.html.
[7]ZHANG C,GUO C T,LIU F,et al.Hyperspectral imaging analysis for ripeness evaluation of strawberry with support vector machine[J].Journal of Food Engineering,2016,179:11-18.
[8]FAN S X,ZHANG B H,LI J B,et al.Prediction of soluble solids content of apple using the combination of spectra and textural features of hyperspectral reflectance imaging data[J].Postharvest Biology and Technology,2016,121:51-61.
[9]XIE C Q,CHU B Q,HE Y.Prediction of banana color and firmness using a novel wavelengths selection method of hyperspectral imaging[J].Food Chemistry,2018,245:132-140.
[10]LI X L,WEI Y Z,XU J,et al.SSC and pH for sweet assessment and maturity classification of harvested cherry fruit based on NIR hyperspectral imaging technology[J].Postharvest Biology and Technology,2018,143:112-118.
[11]ZHANGHL,ZHANBS,PANF,et al.Determination of soluble solids content in oranges using visible and near infrared full transmittance hyperspectral imaging with comparative analysis of models[J].Postharvest Biology and Technology,2020,163:111148.
[12]孟庆龙,尚静,黄人帅,等.不同成熟度猕猴桃糖度紫外/可见光谱检测[J].食品研究与开发,2020,41(21):167-172.MENG Qinglong,SHANG Jing,HUANG Renshuai,et al.Detecting of sugar content of different maturity of kiwifruits by UV/vis spectroscopy[J].Food Research and Development,2020,41(21):167-172.
[13]刘燕德,徐海,孙旭东,等.不同产地苹果糖度可见近红外光谱在线检测[J].中国光学,2020,13(3):482-491.LIU Yande,XU Hai,SUN Xudong,et al.On-line detection of soluble solids content of apples from different origins by visible and near-infrared spectroscopy[J].Chinese Optics,2020,13(3):482-491.
[14]FAN S X,LI J B,XIA Y,et al.Long-term evaluation of soluble solids content of apples with biological variability by using near-infrared spectroscopy and calibration transfer method[J].Postharvest Biology and Technology,2019,151:79-87.
[15]刘燕德,吴明明,孙旭东,等.黄桃表面缺陷和可溶性固形物光谱同时在线检测[J].农业工程学报,2016,32(6):289-295.LIU Yande,WU Mingming,SUN Xudong,et al.Simultaneous detection of surface deficiency and soluble solids content for Amygdalus persica by online visible-near infrared transmittance spectroscopy[J].Transactions of the Chinese Society of Agricultural Engineering,2016,32(6):289-295.
[16]LI B,COBO-MEDINA M,LECOURT J,et al.Application of hyperspectral imaging for nondestructive measurement of plum quality attributes[J].Postharvest Biology and Technology,2018,141:8-15.
[17]詹白勺,倪君辉,李军.高光谱技术结合CARS算法的库尔勒香梨可溶性固形物定量测定[J].光谱学与光谱分析,2014,34(10):2752-2757.ZHAN Baishao,NI Junhui,LI Jun.Hyperspectral technology combined with CARS algorithm to quantitatively determine the SSC in Korla fragrant pear[J].Spectroscopy and Spectral Analysis,2014,34(10):2752-2757.
[18]YU X J,LU H D,WU D.Development of deep learning method for predicting firmness and soluble solid content of postharvest Korla fragrant pear using Vis/NIR hyperspectral reflectance imaging[J].Postharvest Biology and Technology,2018,141:39-49.
[19]LEIVA-VALENZUELA G A,LU R F,AGUILERA J M.Prediction of firmness and soluble solids content of blueberries using hyperspectral reflectance imaging[J].Journal of Food Engineering,2013,115(1):91-98.
[20]HU W H,SUN D W,BLASCO J.Rapid monitoring 1-MCP-induced modulation of sugars accumulation in ripening 'Hayward' kiwifruit by Vis/NIR hyperspectral imaging[J].Postharvest Biology and Technology,2017,125:168-180.
[21]高升,王巧华.基于可见/近红外透射光谱技术的红提糖度和含水率无损检测[J].中国光学,2021,14(3):566-577.GAO Sheng,WANG Qiaohua.Non-destructive testing of red globe grape sugar content and moisture content based on visible/near infrared spectroscopy transmission technology[J].Chinese Optics,2021,14(3):566-577.
[22]郭文川,董金磊.高光谱成像结合人工神经网络无损检测桃的硬度[J].光学精密工程,2015,23(6):1530-1537.GUO Wenchuan,DONG Jinlei.Nondestructive detection on firmness of peaches based on hyperspectral imaging and artificial neural networks[J].Optics and Precision Engineering,2015,23(6):1530-1537.
[23]于雷,章涛,朱亚星,等.基于IRIV算法优选大豆叶片高光谱特征波长变量估测SPAD值[J].农业工程学报,2018,34(16):148-154.YU Lei,ZHANG Tao,ZHU Yaxing,et al.Determination of soybean leaf SPAD value using characteristic wavelength variables preferably selected by IRIV algorithm[J].Transactions of the Chinese Society of Agricultural Engineering,2018,34(16):148-154.
[24]GALVÃORK H,ARAUJO M C U,JOSÉ G E,et al.A method for calibration and validation subset partitioning[J].Talanta,2005,67(4):736-740.
Nondestructive Detection of the Sugar Content of Kaiyang Loquat Based on BP Neural Network
孟庆龙,冯树南,谭涛,等.基于BP神经网络快速无损检测开阳枇杷糖度[J].食品研究与开发,2022,43(13):135-140.
MENG Qinglong,FENG Shunan,TAN Tao,et al.Nondestructive Detection of the Sugar Content of Kaiyang Loquat Based on BP Neural Network[J].Food Research and Development,2022,43(13):135-140.