摘 要:测定各类燕窝和掺假样品的氨基酸组成,通过主成分分析构建白燕窝鉴别的综合评价模型,运用多变量统计分析方法,初步建立燕窝掺假模型,并进行验证。结果表明,前两个主成分提取了原来18个指标87.75%的信息;利用综合评价模型计算出各类样品的主成分得分,燕窝样品在主成分得分图中分布的位置较集中,掺假燕窝样品则较分散;以掺假物质含量作为自变量,综合评价得分作为因变量,进行线性回归分析,单一物质掺假的线性模型和混合掺假线性模型的线性系数R2>0.98。模型验证误差平均值为3.25%,说明氨基酸指纹图谱指纹谱图鉴别法是一种有效且可靠性高的鉴别白燕窝的方法。
关键词:白燕窝;掺假;主成分分析;多元线性回归;建模
燕窝是由雨燕科动物金丝燕及多种同属燕类用唾液与续羽等混合凝结所筑成的巢窝,其成分有水溶性蛋白质、碳水化合物、微量元素以及对促进人体活力起重要作用的氨基酸。燕窝按颜色可分为白燕窝、黄燕窝和血燕窝3种。由于其性价比,白燕窝比另外两种燕窝更加受消费者的青睐[1-3]。近年来,我国燕窝的消费量仍在持续增长。由于燕窝产品的珍贵及燕窝行业的高产值。为了牟取高额利润,不法商人利用价廉的材料全部伪制或部分替代真实燕窝产品,以达到增加重量、提高卖相、以假乱真等目的,市场中燕窝产品的质量安全状况令人担忧[4]。
燕窝中氨基酸的含量、种类及比例是评价其营养价值优劣的主要指标之一[4]。所以,对燕窝的氨基酸组成的监测分析具有重要意义。近年来,多变量统计学方法对食品科学研究及其应用产生了非常大的影响,比如食品感官分析、食品风味及化合物分析、食用植物种类的分类与鉴别、食品腐坏的建模与预测等[5-6]。以此为出发点,本研究以白燕窝作为研究对象,采用氨基酸自动分析仪技术测定白燕窝氨基酸组成,通过主成分分析构建白燕窝鉴别的综合评价模型,以掺假物质含量作为自变量,综合评价得分作为因变量,运用多变量统计分析方法,初步建立燕窝掺假模型,并进行验证。对规范燕窝市场秩序、促进产业发展和打击假冒伪劣产品、维护消费者健康安全具有重大意义。
1.1 材料与试剂
白燕窝:从各大品牌购买的经专家鉴定为真品的燕窝;干猪皮、猪浮皮、银耳、鸡蛋:购于农贸市场;浆糊:购于文具店。
盐酸(GR):广州试剂厂;巯基乙酸(AR):天津科密欧化学试剂有限公司;茚三酮(AR)、柠檬酸钠(AR):国药集团化学试剂有限公司;氨基酸标准品:美国Sigma公司。
1.2 仪器与设备
L-8900型高效氨基酸自动分析仪:日本日立公司;DGG-9420A电热恒温干燥箱:上海森信实验仪器有限公司有限公司;分析天平:北京赛多利斯科学仪器有限公司;HHS-2型电热恒温水浴锅等;HGC-12A氮吹仪:江苏汉邦科技有限公司;高纯氮气:南京天泽气体有限责任公司。
1.3 方法
1.3.1 试验设计
选取4个经鉴定为真品的燕窝作为该研究的对照组,猪浮皮、银耳、琼脂、鸡蛋清和浆糊作为掺假物质,分别在真品燕窝中掺入2%、5%、10%、20%和50%的猪浮皮、银耳和琼脂;以鸡蛋清和浆糊作为涂层掺假物质,在燕窝上涂上均匀的涂层;两种以上不同比例掺假物质的设计见表1。
1.3.2 样品的处理
根据各样品蛋白质含量,取一定量的样品于水解管中,加入6 mol/L盐酸15 mL,以及3滴巯基乙酸,混匀。水解管充氮气后封口,置于110℃的恒温干燥箱内,水解22 h后,取出冷却。用去离子水冲洗水解管,将水解液全部转移到50 mL容量瓶中,用去离子水定容。吸取2 mL滤液于小烧杯中,水浴蒸干。残留物用1 mL超纯水溶解,再蒸干,重复2次。冷却后,加入10 mL 0.02 mol/L盐酸溶解,溶液用0.45 μm滤膜过滤,氨基酸自动分析仪检测。
1.3.3 色谱条件
离子交换柱规格4.6 mmID×60 mm,不锈钢柱(日本公司生产的氨基酸分析专用树脂);泵流速P1:0.40 mL/min,P2:0.35 mL/min;柱温:57℃,反应温度:135℃;进样体积:20 μL。
1.3.4 数据分析
以18种氨基酸作为指标,用SAS 9.1进行主成分分析和多元线性回归分析。Excel进行线性回归分析。
表1 混合掺假样品
Table 1 Samples of mixed adulteration
样品号 猪浮皮/% 银耳/% 琼脂/%样品1 0 5 5样品2 0 20 20样品3 5 0 5样品4 5 5 20样品5 5 20 0样品6 20 0 20样品7 20 5 0样品8 20 20 5
2.1 燕窝掺假模型的氨基酸组成分析
4个真品燕窝、猪浮皮、银耳、琼脂、鸡蛋清和浆糊的氨基酸组成结果见表2;单一物质掺假燕窝的氨基酸组成结果见表3;两种以上物质不同比例掺假燕窝的氨基酸组成结果见表4。
由表2~表4可以看出,18种氨基酸组成为各类样品特征性指标,不同类型样品的氨基酸组成均有差异。由于变量个数太多,并彼此之间存在一定的相关性,因而使得所观测到的数据在一定程度上反映的信息有所重叠;而当变量较多时,在高维空间中研究样本的分布规律比较复杂,需要将多个指标化为小数综合指标进行统计分析。
2.2 各类样品氨基酸组成的主成分分析
主成分分析是一种通过降维技术把多个变量化为少数几个主成分(即综合变量)的统计方法,利用模型“合成”为一个整体性的评价值,进而对样品总体进行评价,不但可将多指标问题转化为较少的综合指标,而且能给出较为客观的权重,为燕窝真伪的鉴别提供科学而客观的评价方法。
表2 燕窝对照组和掺假物质的氨基酸组成
Table 2 Amino acid of control group and adulterant g/100 g
注:n.d.表示该项目未检出。
?
表3 单一物质掺假燕窝的氨基酸组成
Table 3 Amino acid of single adulteration g/100 g
注:n.d.表示该项目未检出。
氨基酸种类 猪浮皮掺假 银耳掺假 琼脂掺假 鸡蛋清涂层浆糊涂层2% 5% 10%20%50% 2% 5% 10%20%50% 2% 5% 10%20%50%天冬氨酸Asp 4.98 4.89 4.82 4.94 4.77 4.83 4.73 4.48 4.21 2.92 4.98 4.87 4.79 4.39 3.37 5.50 4.68苏氨酸Thr 3.88 3.76 3.64 3.51 2.71 3.78 3.66 3.46 3.25 2.16 3.79 3.69 3.61 3.21 2.22 3.56 3.43丝氨酸Ser 4.92 4.81 4.67 4.64 3.96 4.69 4.56 4.28 3.98 2.63 4.65 4.49 4.36 3.93 2.77 4.25 3.85谷氨酸Glu 3.95 4.02 4.15 4.63 5.93 3.74 3.69 3.52 3.27 2.33 3.83 3.79 3.79 3.68 3.54 4.95 3.62脯氨酸Pro 3.97 4.17 4.19 5.04 7.04 3.69 3.63 3.36 3.17 2.23 3.89 3.94 3.95 3.76 3.37 3.38 3.62甘氨酸Gly 2.27 2.65 3.25 4.69 9.43 1.91 1.88 1.78 1.67 1.20 2.02 2.09 2.21 2.49 3.40 2.10 1.87丙氨酸Ala 1.62 1.73 1.93 2.46 4.11 1.44 1.42 1.34 1.28 0.97 1.54 1.52 1.57 1.60 1.89 2.05 1.40胱氨酸cys n.d. n.d. n.d. n.d. n.d. n.d. n.d. n.d. n.d. n.d. n.d. n.d. n.d. n.d. n.d. n.d. n.d.缬氨酸Val 3.94 3.85 3.73 3.65 2.98 3.83 3.75 3.52 3.36 2.14 3.83 3.73 3.64 3.24 2.35 3.99 3.56蛋氨酸Met 0.42 0.42 0.42 0.46 0.55 0.38 0.36 0.35 0.29 0.24 0.39 0.38 0.36 0.34 0.29 0.81 0.33异亮氨酸Ile 1.71 1.68 1.63 1.64 1.42 1.65 1.63 1.52 1.42 1.04 1.72 1.68 1.64 1.53 1.18 2.13 1.60亮氨酸Leu 3.83 3.73 3.65 3.67 3.18 3.68 3.60 3.38 3.16 2.21 3.82 3.74 3.66 3.31 2.49 4.17 3.52酪氨酸Tyr 3.05 2.80 2.73 2.61 1.76 2.82 2.71 2.47 2.29 1.53 3.00 2.86 2.80 2.37 1.52 2.78 2.54苯丙氨酸Phe 3.50 3.40 3.32 3.26 2.68 3.40 3.32 3.12 2.90 1.95 3.50 3.43 3.33 2.97 2.13 3.66 3.31赖氨酸Lys 2.10 2.09 2.13 2.27 2.57 1.99 1.95 1.87 1.74 1.23 2.03 2.01 2.00 1.91 1.67 2.64 1.97组氨酸His 2.00 1.93 1.87 1.79 1.33 1.94 1.89 1.78 1.59 1.09 1.98 1.92 1.85 1.64 1.12 1.87 1.84精氨酸Arg 3.55 3.60 3.66 3.98 4.84 3.36 3.33 3.12 2.97 1.95 3.44 3.36 3.35 3.11 2.54 3.56 3.20羟脯氨酸Hypro 0.07 0.29 0.58 1.37 3.88 n.d. n.d. n.d. n.d. n.d. n.d. n.d. 0.16 0.33 0.98 n.d. n.d.
表4 混合掺假样品的氨基酸组成
Table 4 Amino acid of mixed adulteration g/100 g
注:n.d.表示该项目未检出。
氨基酸种类 对照1 样品1 样品2 样品3 样品4 样品5 样品6 样品7 样品8天冬氨酸Asp 5.06 4.60 3.61 4.80 4.28 4.18 4.38 4.74 4.05苏氨酸Thr 3.86 3.36 2.48 3.32 2.88 2.93 2.76 3.08 2.54丝氨酸Ser 4.70 3.89 2.94 3.98 3.43 3.41 3.44 3.80 3.15谷氨酸Glu 3.84 3.59 3.22 4.21 3.94 3.53 4.58 4.66 4.17脯氨酸Pro 4.01 3.54 3.12 4.53 4.31 3.80 5.17 5.34 4.76甘氨酸Gly 1.95 1.93 2.32 3.63 3.62 2.83 5.54 5.39 5.10丙氨酸Ala 1.48 1.36 1.49 2.08 1.97 1.70 2.73 2.68 2.45胱氨酸cys n.d. n.d. n.d. n.d. n.d. 0.04 n.d. n.d. n.d.缬氨酸Val 3.86 3.60 2.69 3.63 3.08 3.05 3.01 3.27 2.74蛋氨酸Met 0.37 0.33 0.29 0.38 0.36 0.31 0.39 0.41 0.36异亮氨酸Ile 1.70 1.60 1.26 1.61 1.40 1.42 1.42 1.51 1.31亮氨酸Leu 3.80 3.51 2.70 3.58 3.08 3.10 3.12 3.38 2.89酪氨酸Tyr 2.93 2.67 1.73 2.56 1.95 2.17 1.81 2.26 1.82苯丙氨酸Phe 3.59 3.25 2.50 3.28 2.81 2.86 2.74 3.02 2.56赖氨酸Lys 2.07 1.92 1.64 2.15 1.97 1.84 2.14 2.20 1.98组氨酸His 2.00 1.82 1.35 1.80 1.51 1.54 1.41 1.57 1.30精氨酸Arg 3.50 3.24 2.57 3.68 3.24 3.11 3.63 3.87 3.48羟脯氨酸Hypro n.d. n.d. 0.41 0.59 0.78 0.39 1.71 1.53 1.58
利用SAS9.1统计分析软件对各类样品的氨基酸组成的原始数据进行主成分分析,表5为相关系数矩阵的特征值,相关系数矩阵的特征值越大,它所对应的主成分变量包含的信息就越多。
表5 特征值和方差贡献率
Table 5 Eigenvalues and variance contributionrate
主成分 特征值 差异 方差贡献率/% 累计贡献率/%主成分1 10.862 2 5.929 6 60.35 60.35主成分2 4.932 7 3.238 7 27.40 87.75主成分3 1.693 9 1.248 9 9.41 97.16主成分4 0.445 0 0.404 6 2.47 99.63主成分5 0.040 4 0.028 4 0.22 99.86主成分6 0.012 0 0.006 7 0.07 99.92主成分7 0.005 3 0.001 7 0.03 99.95主成分8 0.003 7 0.002 3 0.02 99.97主成分9 0.001 3 0.000 1 0.01 99.98主成分10 0.001 2 0.000 2 0.01 99.99主成分11 0.001 0 0.000 5 0.01 99.99主成分12 0.000 4 0.000 1 0.00 100.00主成分13 0.000 3 0.000 0 0.00 100.00主成分14 0.000 2 0.000 1 0.00 100.00主成分15 0.000 1 0.000 0 0.00 100.00主成分16 0.000 1 0.000 0 0.00 100.00主成分17 0.000 0 0.000 0 0.00 100.00主成分18 0.000 0 0.00 100.00
从表5可以看出,第1和第2主成分的特征值较大,说明这两个主成分包含了原来18个指标大部分的信息。第4列为每个主成分的贡献率,第1和第2主成分的贡献率分别为60.35%和27.40%,其余主成分的贡献率较小,最后1列为累计贡献率。由此列数值可知,前两个主成分提取了原来18个指标87.75%的信息。综合以上指标,对前两个主成分进行深入分析。
表6为主成分分析得到的特征向量,根据特征向量构建主成分与各类样品氨基酸组成之间的线性关系如下:
Y1=0.301 9x1+0.262 6x2+0.274 3x3+0.246 1x4+ 0.112 1x5+0.039 3x6+0.154 3x7-0.103 3x8+0.294 9x9+ 0.213 9x10+0.280 4x11+0.300 0x12+0.254 3x13+0.292 3x14+ 0.268 3x15+0.257 6x16+0.255 7x17-0.015 8x18
Y2=0.022 9x1-0.173 9x2-0.108 8x3+0.234 2x4+ 0.326 7x5+0.428 6x6+0.382 8x7+0.311 8x8-0.102 9x9+ 0.108 2x10-0.011 0x11-0.034 1x12-0.204 7x13-0.111 8x14+ 0.142 8x15-0.195 4x16+0.214 0x17+0.431 4x18
式中:Y1、Y2为综合指标,是样品18个氨基酸组成的线性组合。
以两个主成分Y1、Y2与其方差贡献率构建各类样品氨基酸组成的综合评价模型Z,Z为因变量,Y1、Y2为自变量,Z为Y1、Y2的线性组合:Z=0.6535Y1+ 0.274 0Y2。
表6 各指标主成分特征向量
Table 6 Eigenvectors of each index on PC
氨基酸种类 特征向量 主成分1 主成分2天冬氨酸Asp x1 0.301 9 0.022 9苏氨酸Thr x2 0.262 6 -0.173 9丝氨酸Ser x3 0.274 3 -0.108 8谷氨酸Glu x4 0.246 1 0.234 2脯氨酸Pro x5 0.112 1 0.326 7甘氨酸Gly x6 0.039 3 0.428 6丙氨酸Ala x7 0.154 3 0.382 8胱氨酸cys x8 -0.103 3 0.311 8缬氨酸Val x9 0.294 9 -0.102 9蛋氨酸Met x10 0.213 9 0.108 2异亮氨酸Ile x11 0.280 4 -0.011 0亮氨酸Leu x12 0.300 0 -0.034 1酪氨酸Tyr x13 0.254 3 -0.204 7苯丙氨酸Phe x14 0.292 3 -0.111 8赖氨酸Lys x15 0.268 3 0.142 8组氨酸His x16 0.257 6 -0.195 4精氨酸Arg x17 0.255 7 0.214 0羟脯氨酸Hypro x18 -0.015 8 0.431 4
利用该模型计算出各类样品的主成分得分,真品燕窝和掺假样品在第1、第2主成分的得分图见图1。
图1 主成分得分图
Fig.1 Diagram of PC scores
从图1可以看出,燕窝样品在主成分得分图中分布的位置较集中,掺假燕窝样品则较分散,可为初步判定燕窝真伪提供一定的参考价值;部分掺假样品与真品有不同程度的交叉重叠,需要建立不同水平的掺假模型进行鉴别。
2.3 单一物质掺假燕窝的线性模型建立
以各单一物质的掺假量为横坐标,样品的综合评价得分Z作为纵坐标绘制散点图,见图2。
从图2可以看出,猪浮皮掺假会提高样品的综合评价,银耳和琼脂的掺假则会降低得分。对不同掺假水平下的样品综合得分进行拟合,其回归方程和相关系数R2>0.98,具有良好的相关性,拟合度高,说明该模型可用于单一物质的掺假鉴别。
2.4 两种以上物质掺假燕窝的多元线性模型建立
利用综合评价模型Z计算出混合掺假样品的综合评价得分,见表6。将综合得分作为因变量,将变量x1、x2、x3作为自变量,进行多元线性回归分析。回归分析结果如表7、表8所示。
图2 单一物质掺假燕窝的线性模型
Fig.2 Linear model of single adulteration
表7 方差分析
Table 7 Analysis of variance
?
表8 参数估计
Table 8 Parameter estimates
变量 DF参数估计 标准误差 t值 Pr>|t| 标准化估算常数项 1 0.474 3 0.054 3 8.74 0.000 0 x1 1 2.433 3 0.324 2 7.51 0.000 7 0.3726 x2 1 -5.135 9 0.324 2 -15.84<0.000 1 -0.786 4 x3 1 -3.135 9 0.324 2 -9.67 0.000 2 -0.480 1
表7和表8结果表明,模型检验(F=133.66,P<0.000 1),表示模型通过检验,达到显著水平。在回归系数检验中,常数项(t=8.74,P=0.000 3)、x1(t=7.51,P= 0.0007)、x2(t=-15.84,P<0.0001)、x3(t=-9.67,P=0.000 2),达到显著水平,表明Y和常数项、x1、x2、x3存在显著的线性关系。所以回归方程为Y=0.474 3+2.433 3x1-5.135 9x2-3.135 9x3。决定系数(R2)为0.987 7,表明在变量Y的总变异中,由变量x1-x3线性说明的部分占98.77%。
2.5 模型验证
测定4个样品的18种氨基酸组成。以各掺假物质的含量为预测变量,综合评价得分为因变量,代入掺假模型,结果见表9。
表9 线性回归模型检验
Table 9 Validation of linear regression model
样品号 模型测定值 实际评分值 误差/% 平均误差/% 1 1.33 1.31 1.53 3.25 2 -0.30 -0.33 -9.09 3 -1.18 -1.20 -1.67 4 -0.22 -0.18 22.22
4个样品的模型预测值和观测值的误差在-9.09%~22.22%之间,误差平均值为3.25%,证明该方法建立的线性回归模型对掺假物质含量拟合良好。模型的误差可能归结于本研究中未纳入考虑的将18种氨基酸指标转化为一个综合评价指标过程中所造成的误差。
1)利用SAS软件对样品的氨基酸组成进行主成分分析,前两个主成分提取了原来18个指标87.75%的信息。根据特征向量构建主成分与各类样品氨基酸组成之间的线性模型Y1、Y2。以两个主成分Y1、Y2与其方差贡献率构建各类样品氨基酸组成的综合评价模型Z=0.653 5Y1+0.274 0Y2。
2)利用综合评价模型模型计算出各类样品的主成分得分,燕窝样品在主成分得分图中分布的位置较集中,掺假燕窝样品则较分散,可为初步判定燕窝真伪提供一定的参考价值。
3)以掺假物质含量作为自变量,综合评价得分作为因变量,进行线性回归分析,单一掺假的线性模型和混合掺假线性模型的线性系数R2>0.98。模型验证误差在-9.09%~22.22%之间,误差平均值为3.25%,证明该方法建立的线性回归模型对掺假物质含量拟合良好。
参考文献:
[1]乌日罕,陈颖,吴亚君,等.燕窝真伪鉴别方法及国内外研究进展[J].检验检疫科学,2007,17(4):60-62
[2] Lin J,Zhou H,Lai X.Overview of edible bird's nest research[J]. Journal of Chinese Medicinal Materials,2006,29(1):85-90
[3]Sankaran R.The status and conservation of the Edible-nest Swiftlet (Collocalia fuciphaga)in the Andaman and Nicobar Islands[J].Biological Conservation,2001,97(3):283-294
[4]郭丽丽.表征属性识别技术在燕窝真伪鉴别中的应用研究[D].北京:中国农业大学,2014
[5]刘景,王荫榆,郭本恒,等.发酵乳储存期内风味模型的建立与检验[J].食品科学,2011,32(12):296-300
[6]吴有炜.试验设计与数据处理[M].苏州:苏州大学出版社,2002:148-154
DOI:10.3969/j.issn.1005-6521.2016.11.031
基金项目:广东省科技计划项目(2012B040302015)
收稿日期:2015-05-08
Construction and Validation of Adulteration Model of Edible Bird's Nest by Amino Acid
Abstract:The amino acid composition of edible bird's nest(EBN)and adulterate EBN were analyzed by using an automatic amino.Principal component analysis(PCA)was applied to establish an evaluative model.Multivariate statistical methods were used to establish an adulteration model of EBN and verify.The results showed that prin 1 and prin 2 reflect 87.75%information of 18 indexes.Every sample was evaluated by PCA mathematical evaluative model and the PCA scores of EBNs were relative concentration than adulterate EBN.The parameters of adulteration content were analyzed as independent variables,and evaluative scores as the dependent variable for linear regression analysis.The final model were R2>0.98.The determined values and the predicted values of the tested samples were fitted well with an average error of 3.25%.Therefore,the amino acids composition fingerprint could be used to distinguish adulterate bird's nest based on changes in content or proportion.
Key words:edible bird's nest;adulteration;multiple linear regression;principal components analysis (PCA);modeling