新疆是红枣主要的种植地之一,产量占据全国的一半[1],凭借着优质的自然条件和得天独厚的地理位置,生产的红枣口感极佳并拥有较高的生理功能价值[2],相对于其它品种而言,新疆红枣市场占有较高份额[3-4]。随着红枣产量的剧增和消费者需求标准的提高,红枣的品质变得尤为重要。为增加红枣产品的附加值并提高果农收益,研究如何实现红枣品质快速检测成为目前最迫切的任务。
近年来,偏振高光谱成像技术在多个领域的科学研究中得到了广泛应用。在农业领域,该技术能够在不破坏土壤形态的前提下,实现精确的土壤品质监测[5-6]。医学领域的研究者们利用这一技术检测皮肤异常结构和生理变化,从而实现对疾病早期症状的识别[7-8]。在大气检测方面,基于偏振高光谱仪的应用为大气参数监测提供了新的方法,为环境监测工作提供了可靠的数据支持[9-10]。偏振探测技术可以获得除自身偏振态和强度信息等参数外的其它信息,信息量的丰富有利于提高对目标物的探测精度[11-12],其中Nguyen-Do-Trong 等[13]研究表明,利用交叉偏振高光谱反射成像有助于减少两种苹果和茄子表面产生的镜面反射,改善高光谱反射率图像的质量,将数据中的信噪比从1.1 倍改善至3 倍。Hao 等[14]设计一种基于多波段偏振成像的消光算法,该算法可以稳定去除水果表皮反射亮光。Yang 等[15]基于偏振成像技术,获取损伤和未损伤油桃分别在5 个时间段4 个偏振角(0°、45°、90°和135°)的光谱图像,建立ResNet-G18 检测模型,结果表明,损伤在12 h 及以上的坏果,被检测率高达98.62%。李伟等[16]通过对南疆冬枣水分高光谱建立预测模型,得到在最优预处理下南疆冬枣水分高光谱模型的预测决定系数为0.691 4。索玉婷等[17]建立的不同天气条件下南疆冬枣线性偏振度-水分含量模型,得到在晴天条件下模型预测集相关系数分别为0.846、0.879。由此可见,偏振可能是影响果品预测模型精度的一个因素。目前采用偏振高光谱这一技术,提高冬枣水分和可溶性固形物含量预测模型精度的研究鲜有报道。
为探究偏振因素对预测模型精度的影响,本研究采用偏振高光谱成像技术,并以冬枣含水率和可溶性固形物含量作为理化指标,建立无偏高光谱和4 个不同偏振角(0°、45°、90°和135°)的高光谱品质预测模型。红提葡萄作为对比物料在相同的条件下进行建模。旨在探究5 组不同偏振高光谱数据建模精度的差异,通过比较不同偏振度下模型的预测结果,评估偏振因素对品质预测的影响程度,以期为南疆冬枣和红提葡萄的品质检测提供新的方法和思路。
为保证样品的选择具有代表性,从新疆第一师阿拉尔市10 团采集了120 个冬枣和120 个红提葡萄样品。为消除样品表面的污泥对光谱反射率的影响,使用沾有清水的干净毛巾对每个样品进行擦拭,确保表面干净、无污泥及水渍,然后在户外对每个样品进行光谱采集试验。以上样品大小均匀,并且表面光滑,无肉眼可见的损伤。
Image-λ-N17E-N3 型增强型近红外高光谱相机:中国科学院长春光学精密机械与物理研究所;HSIA-CT-150×150 型标准白板:四川双利合谱科技有限公司;A2003 型电子天平:梅特勒-托利多仪器有限公司;GZX-9140-MBE 电热鼓风干燥箱:上海博迅医疗生物仪器股份有限公司;GMK-701R 型数显糖度仪:日本爱拓公司。
1.3.1 光谱数据的采集
选择晴朗天气、正午时段采集样品光谱[18-19],首先将光谱仪预热30 min,将样品按照图1 从上至下、从左至右的顺序摆放至试验架上,测得增强型近红外高光谱相机距离试验架台中心距离1.5 m,调整增强型近红外高光谱相机的位置和角度,确保它对准样品并能够捕捉到完整的样品光谱信息。使用SolarAngle Calculate 软件,通过输入光谱采集地的经纬坐标和时间得出太阳入射光高度角,进而得太阳光天顶角为52.51°。通过在增强型近红外高光谱相机镜头前添加偏振片,在较短时间内通过设置偏振片的透光轴角度为0°、45°、90°和135°,分别采集对应角度下的高光谱图像数据[20]。
图1 户外样品摆放图
Fig.1 Outdoor layout of samples
1.3.2 样品理化值的测定
根据GB 5009.3—2016《食品安全国家标准 食品中水分的测定》中的直接干燥法测定样品含水率,首先沿采集光谱表面赤道切开样品,取3 g 左右质量精度到0.001 g 的样品两份(1 份用于含水率,另1 份用于SSC 测量),然后将样品置于预热至恒定温度为103 ℃的热风烘干箱内,设置定时器,每隔2 h 取出样品进行称重并记录,使用校准好的天平,直至单个样品质量变化连续3 次均小于0.001 g 时取出,最后依据烘干前后质量变化得到样品含水率,公式如下。
式中:X 为样本含水率,%;m1 为样品的质量,g;m2为样品干燥后的质量,g。
使用数显糖度仪测得样品中SSC。首先在数显糖度计棱镜玻璃面处滴2~3 滴蒸馏水进行校准,然后使用干净的吸水纸擦净棱镜玻璃面的蒸馏水,最后将样品去皮后破碎并挤出汁液至棱镜表面,每个样品测3 次取平均值作为该样品SSC。
1.3.3 数据处理
选取900~1 750 nm 近红外全波段光谱进行分析和处理。首先,使用Matlab R2020b 软件对获取的光谱数据进行处理,接下来使用浓度残差法剔除冬枣样品含水率以及SSC 在无偏高光谱和4 个偏振角高光谱下的异常样本,通过基于联合X-Y 距离的样本集划分(sample set partitioning based on joint X-Y distance,SPXY)算法,按照3∶1 的比例对冬枣和红提葡萄样本进行预测集和训练集的划分。再采用竞争性自适应重加权 算法(competitive adaptive reweighted sampling,CARS)进行波长优选,来简化模型和提高模型预测精确度和稳定性。利用包络线去除-偏最小二乘回归(continuum removal - partial least squares regression,CRPLSR)建立两种果品不同偏振高光谱的含水率和SSC品质预测模型。
1.3.4 模型评价指标
选取特征波长后使用偏最小二乘法(partial least squares,PLS)建立冬枣品质预测模型,模型评价指标为相关系数(related coefficient,R)、均方根误差(root mean square error,RMSE)、剩余预测偏差(residual predictive deviation,RPD)、校正集相关系数(Rc)、预测集相关系数(Rp)。其中相关系数值越接近1 表明模型相关性越好;均方根误差值越接近于0 表明模型标准偏差越小;剩余预测偏差采用的标准,当RPD<2.0 时,模型预测效果一般,当2.0≤RPD<2.5 时,模型的预测效果良好,当2.5≤RPD<3.0 时,模型预测效果较优,当RPD≥3.0 时,模型预测效果优秀[21]。计算方法如下。
式中:N 为样本数;x 和y 为不同变量;和
为对应变量平均值;xi 和yi 为对应变量实际值;
为对应变量预测值;RPD 为剩余预测偏差;RMSE 为均方根误差;std为标准差;RMSEP 为预测均方根误差。
光谱采集完成后使用ENVI 4.7 软件对光谱图像进行平场校正,之后提取样品光谱,选择感兴趣区域(region of interest,ROI),其大小为5×5 个像素,并对光谱数据进行包络线去除处理。图2 为高光谱图像提取后的数据结果。
图2 冬枣的无偏振、0°偏振、45°偏振、90°偏振、135°偏振户外反射光谱
Fig.2 Non-polarized,0° polarized,45° polarized,90° polarized,and 135° polarized outdoor reflection spectra of winter jujube
(a) 原始高光谱;(b) 去除包络线。
从图2 可以看出,冬枣的0°和45°偏振光谱曲线趋势相似,90°、45°和135°偏振光谱曲线共同位于0°偏振光谱曲线和无偏高光谱曲线之间。比较图2(a)与图2(b),可以明显从图中得出去除包络线对无偏高光谱曲线有着较明显的改变,偏振比无偏高光谱数据曲线有着更好的稳定性,包络线剔除可以增强样本光谱理化成分的吸收特征,消除背景噪声和系统干扰,从而改善光谱质量,以便增强光谱特征信息。
为探究偏振高光谱对果品检测精度的影响,建立样品品质预测模型。在构建模型前需要对采集数据进行样本分析,以降低因人为测量误差对模型预测效果的影响。设置输入阈值为2.5,图3 为冬枣样品在0°偏振时剔除含水率异常样本。使用相同的方法,将阈值设定为1.7,来剔除红提葡萄样品在无偏和4 个偏振角高光谱下的含水率和SSC 的样本个数。
图3 浓度残差法剔除异常样本
Fig.3 Elimination of abnormal samples based on concentration of residual
以剔除冬枣含水率为例,如图3 所示,剔除编号为8、72、73 和100 的含水率理化值。
样品的含水率和可溶性固形物含量统计结果如表1 所示。
表1 两种果品含水率与可溶性固形物含量统计结果
Table 1 Statistical results of moisture content and soluble solid content in two fruit products
样本冬枣红提葡萄训练集预测集训练集预测集含水率数据范围/%59.32~75.35 62.01~71.84 78.95~84.97 79.66~82.46平均值/%66.94 66.81 81.51 81.35标准差0.033 5 0.024 7 0.012 7 0.006 8可溶性固形物含量数据范围/°Brix 23.90~38.60 27.40~36.50 18.10~22.70 19.50~22.20平均值/°Brix 31.57 31.69 20.50 20.41标准差3.378 1 2.499 7 1.102 7 0.724 9
从表1 中得知,冬枣的含水率相对红提葡萄较低,但可溶性固形物含量高,且其样本理化值标准差较大,说明其理化值偏离平均值较多。红提葡萄样本含水率相对冬枣较高,可溶性固形物含量低,其标准差相对冬枣较低,说明红提葡萄样本的理化值均分布在平均值附近。
由于全波段光谱相邻波段数据相似度较高,光谱数据量大且包含着与变量无关的冗余信息,基于全波段光谱的建模往往存在运行速度较慢、模型误差较高等缺点[22],因此需要进行特征提取以简化模型并提升模型效率。使用CARS 提取无偏高光谱和4 个偏振角高光谱特征变量,为保证提取特征变量的平稳性,设置提取特征波长循环100 次,每次提取后使用偏最小二乘方法建立预测模型,选择其中预测效果最优的一组作为最终的特征变量。使用CARS 方法提取冬枣0°偏振高光谱含水率特征波长,结果见图4。
图4 CARS 方法选取冬枣含水率特征波长
Fig.4 Selection of characteristic wavelength of moisture content in winter jujube by CARS method
如图4 所示,可以看出交互验证均方根误差在迭代第40 次时达到最小,最终从冬枣原始光谱254 个波段中选取38 个特征波长为最优变量子集。
建立冬枣水分在0°偏振高光谱数据包络线去除-偏最小二乘回归预测模型,建模效果如图5 所示。
图5 特征波段CARS-PLSR 模型预测结果
Fig.5 Prediction results of CARS-PLSR model for characteristic bands
为了探究不同偏振高光谱建模精度效果,选择一致的建模参数,按照上述方法建立无偏、0°偏振、45°偏振、90°偏振和135°偏振高光谱的冬枣和红提的含水率和SSC 预测模型。结果如表2 所示。
预测集相关系数(Rp)作为重要的评价指标,从表2 得出,冬枣含水率预测:在建立模型后,预测集相关系数由高到低依次为90°偏振、45°偏振、无偏、135°偏振、0°偏振,分别为0.958 8、0.958 4、0.953 9、0.951 7、0.941 0。剩余预测偏差值均大于2,表明这些模型的预测效果较好。此外,使用90°和45°偏振高光谱建立的冬枣水分预测模型相较于无偏有更好的预测效果。
表2 基于不同偏振态光谱冬枣和红提葡萄的含水率和SSC 预测模型
Table 2 Prediction models for moisture and SSC content in winter jujube and red grapes based on different polarized spectra
样本冬枣红提葡萄偏振角无偏0°45°90°135°无偏0°45°90°135°含水率Rc 0.961 9 0.945 7 0.966 2 0.963 2 0.963 6 0.960 7 0.907 9 0.925 8 0.942 6 0.922 3 Rp 0.953 9 0.941 0 0.958 4 0.958 8 0.951 7 0.833 5 0.804 1 0.847 4 0.925 6 0.915 7 RMSEC 0.008 7 0.010 4 0.008 5 0.008 7 0.008 7 0.002 9 0.003 7 0.003 5 0.003 1 0.003 8 RMSEP 0.007 9 0.010 2 0.009 3 0.008 5 0.009 0 0.005 5 0.004 4 0.005 0 0.002 6 0.002 8 RPD 3.335 5 2.804 1 2.473 6 3.245 0 3.118 6 1.359 3 1.451 4 1.448 2 2.477 6 2.498 8可溶性固形物含量Rc 0.933 4 0.915 6 0.883 9 0.897 4 0.925 4 0.880 2 0.876 3 0.914 4 0.904 8 0.957 4 Rp 0.904 3 0.909 0 0.882 8 0.890 6 0.924 3 0.811 4 0.806 0 0.848 6 0.901 1 0.946 2 RMSEC 1.147 8 1.302 0 1.572 8 1.471 0 1.221 6 0.321 2 0.348 7 0.357 3 0.388 5 0.262 9 RMSEP 1.039 7 1.347 9 1.344 3 1.176 8 0.996 2 0.479 1 0.414 4 0.378 5 0.360 5 0.302 8 RPD 2.123 9 2.240 4 1.747 5 2.151 8 2.661 7 1.507 5 1.553 3 1.669 3 2.334 6 2.239 4
冬枣SSC 预测:在建立模型后,预测集相关系数由高到低依次为135°偏振、0°偏振、无偏、90°偏振、45°偏 振,分 别 为 0.924 3、0.909 0、0.904 3、0.890 6、0.882 8。除45°偏振,剩余预测偏差值均大于2,说明这些模型的预测效果较好。然而,45°偏振的剩余预测偏差值小于2,表示使用45°偏振高光谱建立的冬枣SSC 预测模型效果较差。
红提葡萄水分预测:在建立模型后,预测集相关系数由高到低依次为90°偏振、135°偏振、45°偏振、无偏、0°偏 振,分 别 为0.925 6、0.915 7、0.847 4、0.833 5、0.804 1。除90°和135°偏振,剩余预测偏差值均小于2,意味着这些模型的预测效果不理想。相比之下,使用90°和135°偏振高光谱建立的红提葡萄水分预测模型效果较好,优于无偏模型。
红提葡萄SSC 预测:在建立模型后,预测集相关系数由高到低依次为135°偏振、90°偏振、45°偏振、无偏、0°偏振,分别为0.946 2、0.901 1、0.848 6、0.811 4、0.806 0。除135°和90°偏振,剩余预测偏差值均小于2,说明这些模型的预测效果较差。值得注意的是,与红提葡萄水分预测有同样的预测效果,使用135°和90°偏振高光谱建立的红提葡萄SSC 预测模型效果优于无偏模型。
利用5 种偏振高光谱建立的冬枣含水率和SSC的偏最小二乘预测模型,结合相同条件下建立的红提葡萄水分和SSC 的偏最小二乘预测模型进行小验证,结果表明:1)部分偏振光谱与理化指标建立的预测模型能提高检测精度;2)冬枣和红提葡萄水分预测模型在90°偏振光谱下具有较高的精度;3)冬枣和红提葡萄SSC 预测模型在135°偏振光谱下具有较高的精度。因此,在进行冬枣含水率和SSC 的品质预测时,分别选用90°和135°偏振光谱进行建模,红提葡萄得到相似结论。
本研究用于冬枣和红提葡萄的品质检测,使用偏振光谱建模可以提高模型的预测效果。但是,本研究只采集了无偏高光谱和不同偏振角(0°、45°、90°和135°)冬枣的高光谱数据,还可以进一步细化偏振角度的选择,并观察模型精度的变化规律,通过找到不同果品含水率和SSC 对应的最佳偏振角度光谱数据进行建模,可以进一步提高模型的检测精度和预测能力,让预测模型更加准确和可靠。
[1] 余文静, 石晶. 新疆红枣产业发展现状与前景[J]. 农业展望,2022, 18(11): 103-108.YU Wenjing, SHI Jing. Development status and prospect of Xinjiang jujube industry[J]. Agricultural Outlook, 2022, 18(11): 103-108.
[2] 郭盛, 严辉, 钱大玮, 等. 枣属药用植物资源产业化过程副产物及废弃物的资源价值发现与循环利用策略构建[J]. 南京中医药大学学报, 2019, 35(5): 579-584.GUO Sheng, YAN Hui, QIAN Dawei, et al. Resource value discovery and recycling strategy construction of by-products and wastes in industrialization of medicinal plant resources of Ziziphus genus[J]. Journal of Nanjing University of Traditional Chinese Medicine,2019, 35(5): 579-584.
[3] 李凤, 马惠兰, 苏洋. 新疆红枣消费者购买行为: 包装偏好、购买渠道与支付水平[J]. 干旱区地理, 2015, 38(2): 420-427.LI Feng, MA Huilan, SU Yang. Consumers′ purchase behavior of Xinjiang jujube: Packaging preferences, purchasing channels and payment level[J]. Arid Land Geography, 2015, 38(2): 420-427.
[4] 汪晶晶, 马惠兰, 苏洋. 新疆红枣在北京市场的消费偏好分析—基于非参数统计方法[J]. 新疆社科论坛, 2014(5): 60-64.WANG Jingjing, MA Huilan, SU Yang. Analysis on consumption preference of Xinjiang jujube in Beijing market—Based on nonparametric statistical method[J]. Tribune of Social Sciences in Xinjiang, 2014(5): 60-64.
[5] 王凌志, 韩阳, 潘倩. 多角度偏振高光谱的农田土壤肥力模型研究[J]. 光谱学与光谱分析, 2018, 38(1): 240.WANG Lingzhi, HAN Yang, PAN Qian. Study on farmland soil fertility model based on multi-angle polarized hyper-spectrum[J].Spectroscopy and Spectral Analysis, 2018, 38(1): 240.
[6] HAN Y, QIN W C, WANG Y Q. Study on the polarized reflectance hyperspectral characteristics and models of typical saline soil in the west of Jilin Province, China[J]. Spectroscopy and Spectral Analysis, 2014, 34(6): 1640-1644.
[7] VASEFI F, MACKINNON N, SAAGER R B, et al. Polarization-sensitive hyperspectral imaging in vivo: A multimode dermoscope for skin analysis[J]. Scientific Reports, 2014, 4: 4924.
[8] DREMIN V, MARCINKEVICS Z, ZHEREBTSOV E, et al. Skin complications of diabetes mellitus revealed by polarized hyperspectral imaging and machine learning[J]. IEEE Transactions on Medical Imaging, 2021, 40(4): 1207-1216.
[9] 刘晶晶, 李开良, 徐梓翔, 等. 基于偏振高光谱激光雷达和微波辐射计的大气温度探测和融合算法研究[J]. 光子学报, 2021, 50(7): 0701001.LIU Jingjing, LI Kailiang, XU Zixiang, et al. Atmosphere temperature profiling and a fusion algorithm based on polarization HSRL and MWR[J]. Acta Photonica Sinica, 2021, 50(7): 0701001.
[10] LI Z Q, XIE Y Q, HOU W Z, et al. In-orbit test of the polarized scanning atmospheric corrector (PSAC) onboard Chinese environmental protection and disaster monitoring satellite constellation HJ-2 A/B[J]. IEEE Transactions on Geoscience and Remote Sensing,2022, 60: 4108217.
[11] 陈伟力, 孙秋菊, 王淑华, 等. 目标表面发射率对红外辐射偏振特性的影响分析[J]. 光谱学与光谱分析, 2017, 37(3): 737.CHEN Weili, SUN Qiuju, WANG Shuhua, et al. Influence analysis of target surface emissivity on infrared radiation polarization characteristics[J]. Spectroscopy and Spectral Analysis, 2017, 37(3): 737.
[12] 周强国, 黄志明, 周炜. 偏振成像技术的研究进展及应用[J]. 红外技术, 2021, 43(9): 817-828.ZHOU Qiangguo, HUANG Zhiming, ZHOU Wei. Research progress and application of polarization imaging technology[J]. Infrared Technology, 2021, 43(9): 817-828.
[13] NGUYEN-DO-TRONG N, KERESZTES J C, DE KETELAERE B,et al. Cross-polarised VNIR hyperspectral reflectance imaging system for agrifood products[J]. Biosystems Engineering, 2016, 151:152-157.
[14] HAO J L, ZHAO Y Q, PENG Q N. A specular highlight removal algorithm for quality inspection of fresh fruits[J]. Remote Sensing,2022, 14(13): 3215.
[15] YANG Y, WANG L, HUANG M, et al. Polarization imaging based bruise detection of nectarine by using ResNet-18 and ghost bottleneck[J]. Postharvest Biology and Technology, 2022, 189: 111916.
[16] 李伟, 罗华平, 索玉婷, 等. 冬枣水分高光谱快速反演模型研究[J]. 食品科技, 2020, 45(2): 329-333.LI Wei, LUO Huaping, SUO Yuting, et al. Study on water hyperspectral rapid inversion model of winter jujube[J]. Food Science and Technology, 2020, 45(2): 329-333.
[17] 索玉婷, 罗华平, 李伟, 等. 南疆冬枣偏振参量模型户外光照条件适应性研究[J]. 光谱学与光谱分析, 2021, 41(1): 223-228.SUO Yuting, LUO Huaping, LI Wei, et al. Study on the adaptability of polarization parameter model of winter jujube in South Xinjiang to outdoor light conditions[J]. Spectroscopy and Spectral Analysis,2021, 41(1): 223-228.
[18] 索玉婷, 罗华平, 刘金秀, 等. 基于Roujean 和Ross-Li 模型算法的不同户外光照南疆冬枣BRDF 特性研究[J]. 光谱学与光谱分析, 2021, 41(6): 1737-1744.SUO Yuting, LUO Huaping, LIU Jinxiu, et al. A comparative study on Roujean and Ross Li models of winter jujube in South Xinjiang under different outdoor light[J]. Spectroscopy and Spectral Analysis, 2021, 41(6): 1737-1744.
[19] 刘燕德, 崔惠桢, 李斌, 等. 基于可见-近红外光谱技术的苹果糖度光照位置优化研究[J]. 光谱学与光谱分析, 2022, 42(11): 3373-3379.LIU Yande, CUI Huizhen, LI Bin, et al. Study on optimization of apple sugar degree and illumination position based on near-inf rared technology[J]. Spectroscopy and Spectral Analysis, 2022, 42(11): 3373-3379.
[20] SHIKADA M, MIYAKITA K. Effects of solar and view angles on reflectance for paddy field canopies[J]. Geocarto International, 1992,7(3): 9-17.
[21] SAEYS W, MOUAZEN A M, RAMON H. Potential for onsite and online analysis of pig manure using visible and near infrared reflectance spectroscopy[J]. Biosystems Engineering, 2005, 91(4): 393-402.
[22] 程介虹, 陈争光, 张庆华. 不同波长选择方法在土壤有机质含量检测中对比研究[J]. 中国农业科技导报, 2020, 22(1): 162-170.CHENG Jiehong, CHEN Zhengguang, ZHANG Qinghua. Comparison of different wavelength selection methods in SOM content detection[J]. Journal of Agricultural Science and Technology, 2020, 22(1): 162-170.
Quality Detection of Winter Jujube from South Xinjiang Based on Polarized Hyperspectral Imaging
雷大涛,罗华平,高峰,等. 基于偏振高光谱成像的南疆冬枣品质检测[J]. 食品研究与开发,2025,46(2):172-177.
LEI Datao,LUO Huaping,GAO Feng,et al. Quality Detection of Winter Jujube from South Xinjiang Based on Polarized Hyperspectral Imaging[J]. Food Research and Development,2025,46(2):172-177.