基于紫外-可见和近红外光谱技术的葡萄酒产地鉴别

薛鸿图,苏彩玲,张凡,陈克想,马倩云,王文秀*,孙剑锋*

(河北农业大学食品科技学院,河北保定 071000)

摘 要:该研究将紫外-可见光谱、近红外光谱技术与化学计量学方法相结合,建立一种快速、准确鉴别干红葡萄酒产地的方法。采集3 个不同产地(怀涿盆地、宁夏贺兰山东麓和渤海湾)的108 个赤霞珠干红葡萄酒样品的紫外-可见和近红外光谱信息。首先,对比采用标准正态变量变换(standard normal variable,SNV)、一阶导数(first derivative,FD)、二阶导数(second derivative,SD)及不同方法组合对两种光谱数据进行预处理,分别建立随机森林(random forest,RF)、K-最邻近法(K-nearest neighbor,KNN)和最小二乘支持向量机(least squares support vector machine,LS-SVM)判别模型,通过比较建模结果得到最优的预处理-建模方法组合;然后,基于最优判别模型,采用竞争性自适应重加权采样(competitive adaptive reweighted sampling,CARS)算法和无信息变量消除(uninformative variable elimination,UVE)法对光谱数据进行特征波段提取并建立判别模型。结果表明,基于紫外-可见光谱建立的SNV+FD-UVE-LSSVM 模型的校正集和验证集的识别率分别达到97.53%和96.30%,基于近红外光谱建立的FD-CARS-KNN 模型的校正集和验证集的识别率分别达到98.76%和96.30%。该结果证实将紫外-可见光谱、近红外光谱技术与机器学习相结合,有望成为一种简单、快速和低成本的工具,用于鉴别中国干红葡萄酒的地理来源。

关键词:葡萄酒;紫外-可见光谱;近红外光谱;产地鉴别;特征提取

葡萄酒是一种由新鲜葡萄或葡萄汁经部分或完全发酵制成的低酒精类饮料,其风味独特,含有诸多人体所需的营养物质,是世界三大果酒之一,备受消费者喜爱。适量饮用葡萄酒可抑制血小板凝聚,不易形成血栓,对人体健康具有积极的作用。“七分原料,三分酿造”,葡萄酒的品质和商业价值与酿酒葡萄产地来源密切相关,不同生长环境的葡萄由于气候、水质、昼夜温差、土壤营养成分等环境和气象因子不同导致生长状况有所差异,因此来自不同产地的葡萄酒带有不同的地域性香气[1]。有些地区适合种植特定的葡萄品种,在好年份酿造出高品质的葡萄酒。例如,来自中国烟台、昌黎和贺兰山东麓地区的“地理标志保护”(protected geographic indication,PGI)认证葡萄酒通常比来自非PGI 地区的葡萄酒品质更好[2],具有更高的商业价值。然而,在经济利益的驱动下,以非PGI 地区的廉价葡萄酒替代高价值葡萄酒的现象层出不穷,而我国有关针对葡萄酒原产地鉴别的国家标准还不完善。因此,建立葡萄酒产地鉴别的方法对葡萄酒品质控制和市场监管具有重要意义[3]

为了实现葡萄酒的产地鉴别,目前已开发的方法包括核磁共振氢谱法[4-6]、电感耦合等离子体质谱法[7-8]、稳定同位素质谱法[9-11]、气相色谱法[12]、非靶向代谢组学分析[13-14]等。这些方法可以提供精确的数据和有价值的信息,但通常耗时、成本高,且需要专业人员操作,难以实现现场实时检测。因此,有必要开发低成本、简单、快速实时的检测方法。近年来,光谱技术以其快速、经济、简便的优点,在葡萄酒分类领域受到了越来越多的关注。Riovanto 等[15]利用紫外-可见、近红外和中红外光谱结合化学计量学对澳大利亚5 个不同产区的葡萄酒进行鉴别分析,准确率最高达到95.3%。Hu 等[16]利用近红外和中红外光谱结合化学计量学对来自不同国家(澳大利亚、智利和中国)的赤霞珠葡萄酒进行了分类,对3 个国家葡萄酒的识别准确率分别为97%、97% 和92%。以上研究表明,无论是利用单一光谱还是联合多种光谱技术,在葡萄酒产地溯源分析方面都具有较高的预测能力。因此,将光谱技术与化学计量学相结合,有望快速、直接、准确、实时地实现对不同产地葡萄酒的鉴别和溯源。

本研究旨在利用紫外-可见和近红外光谱分析技术,研究3 个中国葡萄酒地理标志产区(怀涿盆地、宁夏贺兰山东麓和渤海湾)的葡萄酒光谱特征,结合随机森林(random forest,RF)、K-最邻近法(K-nearest neighbor,KNN)和最小二乘支持向量机(least squares support vector machine,LS-SVM)等化学计量学算法,建立一种快速实时准确的葡萄酒产地鉴别方法。以期为维护葡萄酒市场稳定,保障消费者权益有着重要意义。

1 材料与方法

1.1 试验材料

本试验所用的葡萄酒来自怀涿盆地、宁夏贺兰山东麓和渤海湾3 个产地的赤霞珠葡萄酒各36 瓶,共计108 个葡萄酒样品。

1.2 仪器与设备

TU-1810 型紫外可见分光光度计:北京普析通用仪器有限责任公司;FLAME-NIR-INSMA25 微型近红外光谱仪:美国海洋光学公司。

1.3 方法

1.3.1 光谱采集

1.3.1.1 紫外-可见光谱采集

利用蒸馏水对葡萄酒样品进行5 倍稀释,置于石英比色皿中采集200~800 nm 范围内的紫外-可见光谱,采集模式为吸光度,分辨率为2 nm,光程为1 mm,扫描间隔为1 nm。以超纯水为背景在室温下测定,每个样品重复测定3 次后取平均值,获得108 个葡萄酒样品的原始紫外-可见光谱。

1.3.1.2 近红外光谱采集

将适量葡萄酒样品置于石英比色皿中进行近红外光谱采集,获取每个样品在942~1 652 nm 范围内的吸收光谱,波长数为128 个,仪器分辨率为8 cm-1,光程为1 mm,扫描间隔为1 nm。以空气为背景在室温下测定,每个样品重复测定3 次后取平均值,获得108 个葡萄酒样品的原始近红外光谱。

1.3.2 光谱预处理

利用紫外可见-分光光度计和微型近红外光谱仪测得的葡萄酒样品原始数据中存在噪音或基线漂移等干扰信号。为了减少干扰信号对所建预测模型准确性的影响,必须要对光谱进行预处理来提高信噪比和预测模型的准确性。本研究对原始光谱数据进行以下处理:1)标准正态变量变换(standard normal variable,SNV),用于消除光谱内颗粒大小或分布不均匀造成的散射影响;2)一阶导数(first derivative,FD)、二阶导数(second derivative,SD)消除基线漂移和基线旋转;3)不同顺序组合(SNV+FD、SNV+SD、FD+SNV、SD+SNV)。通过比较建模结果,确定最优的预处理方法。光谱预处理在PLS_Toolbox 7.5 中进行。

1.3.3 特征波长筛选

波长筛选能够选择有效波长信息、减少数据运算量、提高数据有效性,对进一步设计鲁棒模型具有重要意义。本研究利用竞争性自适应重加权采样(competitive adaptive reweighted sampling,CARS)算法和无信息变量消除(uninformative variable elimination,UVE)法来筛选特征波长。其中CARS 算法模拟了达尔文进化论中“适者生存”原则,将每个波长看成一个个体,通过自适应重加权采样筛选出模型中回归系数绝对值较大的波长,去掉权重较小的变量,从而获得多个波长变量子集,并对每个变量子集采用交叉验证建模,最后根据误差最小原则选择最优波长变量子集。UVE 是一种基于偏最小二乘回归模型稳定性分析的变量选择方法,用于消除冗余或无信息的光谱变量[17]

1.3.4 模型建立及评价

采用kennard-stone(K-S)算法将108 个样品按照3∶1(质量比)分为校正集(81 个)和验证集(27 个)用于建立和验证模型。本研究采用LS-SVM、KNN 和RF 算法建立分类模型。其中,LS-SVM 是支持向量机的改进版本,具有线性和非线性多元校正的能力。RF 是一种分析高维数据的有效方法,它通过并行构造多棵决策树,并将它们的结果组合在一起产生一个输出,是机器学习中常用的决策树方法之一,不容易过度拟合,计算需求较低,本研究RF 随机树的数目设置为500。KNN算法计算未知样本与所有已知样本之间的距离,根据多数表决的方法,将未知样本和k 个近邻样本归为一类,本研究中k 值设置为9。

利用准确率(%)对模型的结果进行评价,准确率越接近1,表明模型准确率越高。

1.4 数据处理

光谱数据的预处理、特征波长的筛选以及3 种算法的进行均在MATLAB2014a 中实现。

2 结果与讨论

2.1 原始光谱解析

葡萄酒中含有1 000 多种化学成分,除了占比很大的水和酒精,还包括糖类、有机酸和多酚化合物等多种复杂有机分子。3 个产地葡萄酒的紫外-可见光谱和近红外光谱分别见图1 和图2,其中红色、蓝色、绿色光谱曲线分别代表宁夏贺兰山东麓、渤海湾和怀涿盆地的葡萄酒。

图1 葡萄酒样品的原始紫外-可见光谱图
Fig.1 UV-Vis original spectra of wine samples

图2 葡萄酒样品的原始近红外光谱图
Fig.2 NIR original spectra of wine samples

由图1 和图2 可知,不同产地的葡萄酒紫外-可见光谱和近红外光谱在整个波段范围内趋势基本一致,但吸光度大小有所差异,表明不同产地葡萄酒中某些物质含量不同。在图1 中,250 nm 处的吸收波段与不同类型的酚类化合物有关,而320 nm 处的吸收波段与黄酮类化合物和非黄酮类化合物有关[13],520 nm 处的吸收带与所含花青素含量有关[18]

C—H、O—H、N—H 等官能团是组成赤霞珠葡萄内部物质的基础,由于葡萄内各物质含量不同导致光谱特征的不同。图2 中980 nm 处的吸收峰可能与碳水化合物和水中的O—H 基团有关[19];在1 190 nm 处的吸收峰与糖和有机酸的C—H 振动的第二次泛音有关;1 075 nm 和1 398 nm 处的吸收峰与O—H 键有关;1 269 nm 处的吸收峰与C—H 键伸缩振动的第二泛音有关[20]

2.2 光谱数据预处理对比分析

基于7 种方法预处理后的光谱数据分别建立LSSVM、RF 和KNN 模型,建模结果如表1 所示。

表1 全波段光谱建模结果
Table 1 Modeling results based on full-band spectra

项目紫外-可见光谱准确率/%SNV FD SD SNV+FD SNV+SD FD+SNV SD+SNV近红外光谱SNV FD SD SNV+FD SNV+SD FD+SNV SD+SNV预处理方法校正集验证集校正集验证集校正集验证集校正集验证集校正集验证集校正集验证集校正集验证集校正集验证集校正集验证集校正集验证集校正集验证集校正集验证集校正集验证集校正集验证集RF 97.53 88.89 97.53 77.78 98.77 92.59 98.77 92.59 98.77 88.89 98.77 88.89 98.77 92.59 96.30 77.78 97.53 81.48 100.00 74.07 98.77 85.19 96.30 66.67 96.30 81.48 98.77 70.37 KNN 92.59 77.78 97.53 74.07 96.30 85.19 97.53 85.19 96.30 74.07 98.77 92.59 97.53 88.89 95.30 70.37 95.06 88.89 96.30 66.67 96.30 62.96 88.89 55.56 96.30 66.67 96.30 62.96 LS-SVM 97.50 88.89 97.53 88.89 95.06 85.19 97.53 95.70 98.77 88.89 98.77 92.59 98.77 92.59 93.30 71.37 97.53 77.78 98.77 70.37 98.77 81.48 96.30 77.78 96.30 74.07 100.00 70.37

由表1 可知,对于3 个产地葡萄酒样品的紫外-可见光谱数据,采用SNV-FD 的组合预处理方法建立的LS-SVM 分类模型效果最好,此时验证集的模型判别准确率可达95.70%。对于近红外光谱,FD 的预处理方法可提高模型的准确度和稳定性,KNN 模型效果最好,验证集判别准确率为88.89%。因此分别选择SNVFD 和FD 预处理后的光谱数据作为紫外-可见光谱和近红外光谱后续分析的基础。

2.3 特征波长筛选结果分析

2.3.1 利用CARS 算法筛选特征波长结果

基于SNV-FD 处理的紫外-可见光谱数据,采用CARS 算法选择有效波长。CARS 算法将蒙特卡罗采样的运行次数设置为1000 次,并通过10 倍交叉验证确定所选波长的数量。CARS 的过程如图3 所示。

图3 CARS 筛选特征波长过程
Fig.3 Process of CARS screening characteristic wavelengths

(A)筛选变量个数的变化趋势;(B)交叉验证均方根误差趋势图;(C)回归系数路径。

图3(A)为筛选变量的变化趋势,可分为快速筛选和精细筛选两个阶段。由图3(A)可知,采样变量随着运行次数的增加而减少,起初由于使用指数衰减函数(Exponential Dispersion Function,EDF)所选波长的数量急剧下降,后期变得相对稳定。由图3(B)可知,由于消除了无效波段信息,均方根误差从1~563 次采样运行中减少,随后在564~680 次采样运行的范围内略有增加,当采样次数超过680 次时,由于一些重要的波长也被消除,均方根误差迅速增加。在图3(C)中,每条曲线记录了每个波长在采样运行时的系数路径,蓝色星号线表示运行次数和均方根误差值最低的点,与图3(B)结果一致,采样次数在563 次时误差最小。通过CARS 运算,从全光谱中筛选出24 个特征波长,分别为200、223、265、266、280、310、357、369、370、382、383、384、403、432、433、434、514、555、579、580、682、683、684 nm 和685 nm,其在原始光谱曲线中的分布图如图4 所示。

图4 特征波长所在位置示意图
Fig.4 Location of characteristic wavelengths

由图4 可知,与全光谱相比,波长数减少了96%。

基于FD 处理的近红外光谱数据,采用CARS 算法选择有效波长。CARS 的过程如图5 所示。

图5 CARS 筛选特征波长过程
Fig.5 Process of CARS screening characteristic wavelengths

(A)筛选变量个数的变化趋势;(B)交叉验证均方根误差趋势图;(C)回归系数路径。

由图5(A)可知,采样变量随着运行次数的增加而减少。由图5(B)可知,均方根误差在1~602 次采样运行中减少,随后在603~800 次采样运行的范围内略有增加,最后当采样次数超过800 次时,由于一些重要的波长也被消除,均方根误差迅速增加。由图5(C)可知,采样次数在562 次时误差最小。经过CARS 运算得到10 个特征波长,分别为942、947、1 020、1 052、1 147、1 175、1 244、1 273、1 279 nm 和1 442 nm,其分布图如图6 所示。

图6 特征波长所在位置示意图
Fig.6 Location of the characteristic wavelengths

由图6 可知,特征波长数较全波段数减少了92%。

2.3.2 利用UVE 算法筛选特征波长结果

基于紫外-可见光谱数据和近红外数据的优选与葡萄酒产地有关特征波长过程如图7 和图8 所示。

图7 紫外-可见光谱的UVE 筛选特征波长过程
Fig.7 UVE screening process of UV-Vis spectra for characteristic wavelengths

图8 近红外光谱的UVE 筛选特征波长过程
Fig.8 UVE screening process of NIR spectra for characteristic wavelengths

由图7 可知,左侧曲线为葡萄酒的紫外-可见光谱变量矩阵,右侧为添加与葡萄酒紫外-可见光谱变量数目相同的随机噪声矩阵,两条水平虚线代表随机噪声的最大和最小阈值,两线之间为剔除的无关变量。经过UVE 筛选后的特征变量共有235 个,较全波段数减少了61%。由图8 可知,阈值内的变量被剔除,其余部分则被保留,共有13 个特征波长被筛选,较全波段数减少了90%。

2.4 基于特征波长建模结果分析

为了获取最佳的模型组合,将所筛选的特征波长与分类模型相结合。由全波段建模结果可知,对于紫外-可见光谱,SNV-FD-LSSVM 为最佳模型组合,因此进一步基于CARS 和UVE 方法优选的特征波段下光谱数据建立LS-SVM 模型。同理,以CARS 和UVE 优选的近红外特征波段作为变量建立KNN 分类模型,其建模结果如表2 所示。

表2 基于特征波长的建模结果
Table 2 Modeling results based on characteristic wavelengths

光谱类型紫外-可见光谱近红外光谱模型LS-SVM预处理SNV-FD KNN FD特征波长(个数)CARS(24)UVE(235)CARS(10)UVE(13)准确率/%校正集97.53 97.53 98.76 93.83验证集92.59 96.30 96.30 92.59

由表2 可知,对于紫外-可见光谱信息来说,基于UVE 算法挑选的特征波长建模效果最佳,其准确率达到96.30%,较全光谱建模结果准确率增加了0.6%。对于近红外可见光谱,基于CARS 算法挑选的特征波长建模效果最佳,其准确率也达到96.30%,较全光谱建模结果准确率增加了7.41%。这些算法选取特征的机制有所不同,因而导致的建模结果有所差异。对比全光谱建模和提取特征波长后建模结果,CARS 算法在提取的特征波长数较少的情况下提升了模型的性能和准确率,相较于UVE 算法具有更大的优势和应用潜力。

3 结论

本研究基于紫外-可见光谱和近红外光谱技术对中国不同产地葡萄酒进行鉴别分析,并建立了怀涿盆地、宁夏贺兰山东麓和渤海湾产地红葡萄酒样品的LSSVM、KNN 和RF 判别模型。结果表明,基于3 个产地葡萄酒的紫外-可见光谱和近红外全光谱数据结合LSSVM 和KNN 算法所建立的模型均可实现对产地的鉴别,其识别准确率分别为95.70% 和88.89%。利用CARS 及UVE 算法筛选特征波长后分别建立LS-SVM和KNN 模型,其准确率均为96.30%,较全波长增加了0.6%和7.41%,且波长数分别减少了61%和90%。由全光谱建模结果来看,紫外-可见光谱的建模结果优于近红外光谱,但在采集光谱信息时,近红外光谱的采集速度快于紫外-可见光谱,更适合现场快速检测。本研究证实了紫外-可见光谱和近红外光谱与化学计量学方法相结合,均可作为葡萄酒产地鉴别的有效工具。

参考文献:

[1] 凌莉,刘津,韦晓群,等.葡萄酒的地理标志意义及对中国葡萄酒业的启发[J].酿酒科技,2013(12):109-112.LING Li, LIU Jin, WEI Xiaoqun, et al. Significance of grape wine geographical indications and its enlightenments for Chinese grape wine industry[J]. Liquor-Making Science & Technology, 2013(12):109-112.

[2] TAN J, LI R, JIANG Z T, et al. Geographical classification of Chinese Cabernet Sauvignon wines by data fusion of ultraviolet-visible and synchronous fluorescence spectroscopies: The combined use of multiple wavelength differences[J].Australian Journal of Grape and Wine Research,2016,22(3):358-365.

[3] GU H W, ZHOU H H, LV Y, et al. Geographical origin identification of Chinese red wines using ultraviolet-visible spectroscopy coupled with machine learning techniques[J].Journal of Food Composition and Analysis,2023,119:105265.

[4] KUBALLA T,HAUSLER T,OKARU A O,et al.Detection of counterfeit brand spirits using 1H NMR fingerprints in comparison to sensory analysis[J].Food Chemistry,2018,245:112-118.

[5] 沈晓骅.法国波尔多地区葡萄酒身份信息鉴别技术研究[D].厦门:集美大学,2014.SHEN Xiaohua. The studies on identification method for identifiable information of wine in Bordeaux Region from france[D].Xiamen:Jimei University,2014.

[6] 赵玉立,王丽,谭丹,等.基于核磁共振氢谱的葡萄酒真实性鉴别技术研究进展[J].食品科学,2023,44(5):305-313.ZHAO Yuli, WANG Li, TAN Dan, et al. Progress in wine authentication by 1H nuclear magnetic resonance(NMR)spectroscopy[J].Food Science,2023,44(5):305-313.

[7] 邓之豪,钟亚莉,母健,等.电感耦合等离子体质谱法测定葡萄酒中28 种微量元素[J].食品科技,2019,44(7):338-343.DENG Zhihao, ZHONG Yali, MU Jian, et al. Determination of 28 trace elements in wine by inductively coupled plasma mass spectrometry[J].Food Science and Technology,2019,44(7):338-343.

[8] GEANA I, IORDACHE A, IONETE R, et al. Geographical origin identification of Romanian wines by ICP-MS elemental analysis[J].Food Chemistry,2013,138(2/3):1125-1134.

[9] 申雪.葡萄酒中稳定同位素特征变化与影响因素及产地溯源研究[D].乌鲁木齐:新疆农业大学,2021.SHEN Xue. Study on the change of stable isotope characteristics,influencing factors and origin traceability in wine[D].Urumqi:Xinjiang Agricultural University,2021.

[10] WU H, LIN G H, TIAN L, et al. Origin verification of French red wines using isotope and elemental analyses coupled with chemometrics[J].Food Chemistry,2021,339:127760.

[11] DURANTE C, BERTACCHINI L, COCCHI M, et al. Development of 87Sr/86Sr maps as targeted strategy to support wine quality[J].Food Chemistry,2018,255:139-146.

[12] 谢建军,陈小帆,陈文锐,等.气相色谱指纹图谱法进行红葡萄酒产地溯源表征[J].食品科学,2013,34(18):253-257.XIE Jianjun,CHEN Xiaofan,CHEN Wenrui,et al.Tracing the geographical origin of red wine based on gas chromatographic fingerprint[J].Food Science,2013,34(18):253-257.

[13] PAN Y, GU H W, LV Y, et al. Untargeted metabolomic analysis of Chinese red wines for geographical origin traceability by UPLCQTOF-MS coupled with chemometrics[J]. Food Chemistry, 2022,394:133473.

[14] 韩静雯,李国辉,钟其顶,等.超高效液相色谱-四极杆/飞行时间质谱鉴别红葡萄酒的品种和产地[J].食品与发酵工业,2022,48(19):250-256.HAN Jingwen, LI Guohui, ZHONG Qiding, et al. Identification of red wine varieties and origins based on ultra-high performance liquid chromatography-quadrupole/time of flight mass spectrometry[J].Food and Fermentation Industries,2022,48(19):250-256.

[15] RIOVANTO R, CYNKAR W U, BERZAGHI P, et al. Discrimination between Shiraz wines from different Australian regions: The role of spectroscopy and chemometrics[J]. Journal of Agricultural and Food Chemistry,2011,59(18):10356-10360.

[16] HU X Z, LIU S Q, LI X H, et al. Geographical origin traceability of Cabernet Sauvignon wines based on Infrared fingerprint technology combined with chemometrics[J].Scientific Reports,2019,9:8256.

[17] ZHONG Q D, ZHANG H, TANG S Q, et al. Feasibility study of combining hyperspectral imaging with deep learning for chestnutquality detection[J].Foods,2023,12(10):2089.

[18] ROUSSIS I G, LAMBROPOULOS I, TZIMAS P, et al. Antioxidant activities of some Greek wines and wine phenolic extracts[J]. Journal of Food Composition and Analysis,2008,21(8):614-621.

[19] MARTELO-VIDAL M J, VÁZQUEZ M. Classification of red wines from controlled designation of origin by ultraviolet-visible and nearinfrared spectral analysis[J]. Ciência e Técnica Vitivinícola, 2014,29(1):35-43.

[20] COOMBE B G. Growth stages of the grapevine: Adoption of a system for identifying grapevine growth stages[J].Australian Journal of Grape and Wine Research,1995,1(2):104-110.

Wine Origin Identification Based on Ultraviolet-Visible and Near-Infrared Spectroscopy

XUE Hongtu,SU Cailing,ZHANG Fan,CHEN Kexiang,MA Qianyun,WANG Wenxiu*,SUN Jianfeng*
(College of Food Science and Technology,Hebei Agricultural University,Baoding 071000,Hebei,China)

Abstract:The quality attributes of wine are closely related to its origin. In recent years,the issue of origin fraud has seriously disrupted the wine market.Therefore,it is necessary to establish a fast,accurate,and realtime method for identifying wine origins. In this study,ultraviolet-visible(UV-Vis)spectroscopy,near-infrared(NIR)spectroscopy,and chemometrics were combined to establish a rapid and accurate identification method for red wine origin. The spectroscopic information of 108 Cabernet Sauvignon red wine samples from three different regions,Huaizhuo Basin,eastern foothills of Helan Mountain in Ningxia,and Bohai Bay,was collected by UV-Vis spectrophotometer and micro-NIR spectrometer. Firstly,standard normal variable(SNV),first derivative(FD),second derivative(SD),and different methods were utilized to preprocess two kinds of spectral data. The discrimination models of random forest(RF),K-nearest neighbor(KNN),and least squares support vector machine(LS-SVM)were built. Comparing the classification effect of the models,the combination of optimal preprocessing and modeling methods was achieved. Secondly,based on the obtained optimal discrimination model,the competitive adaptive reweighted sampling(CARS)and uninformative variable elimination(UVE)were adopted to extract the feature bands of spectral data and build discrimination models. The results showed that the recognition rates of the correction set and the verification set of the SNV-FD-UVE-LSSVM model based on UV-Vis spectrum were 97.53% and 96.30%,respectively,and those of the FD-CARS-KNN model based on NIR spectra were 98.76% and 96.30%.The study showed that combining UV-Vis spectroscopy and NIR spectroscopy with machine learning had the potential to be a simple,fast,and low-cost tool for identifying the geographical origin of Chinese red wine.

Key words:wine;ultraviolet-visible spectra;near-infrared spectra;origin identification;feature extraction

DOI:10.12161/j.issn.1005-6521.2024.13.023

基金项目:优质葡萄酒酿造及真实性快速精准鉴别关键技术研究(2021C-09)

作者简介:薛鸿图(1999—),男(汉),硕士,研究方向:葡萄酒真实性鉴别。

*通信作者:王文秀(1989—),女(汉),副教授,博士,研究方向:食品快速无损检测技术及装备研究;孙剑锋(1979—),男(汉),博士,研究方向:食品加工技术。

引文格式:

薛鸿图,苏彩玲,张凡,等.基于紫外-可见和近红外光谱技术的葡萄酒产地鉴别[J].食品研究与开发,2024,45(13):166-171.

XUE Hongtu,SU Cailing,ZHANG Fan,et al. Wine Origin Identification Based on Ultraviolet-Visible and Near-Infrared Spectroscopy[J].Food Research and Development,2024,45(13):166-171.

加工编辑:王雪

收稿日期:2023-07-03