?

蛋白質組學非靶向性質譜分析結合化學計量學在牛肉摻假初篩中的應用

2023-02-21 10:34蒲科源丘嘉敏劉柏霖童永祺程子彬劉誠林艷吳坤明
食品與發酵工業 2023年3期
關鍵詞:肉類牛肉質譜

蒲科源,丘嘉敏,劉柏霖,童永祺,程子彬,劉誠,林艷,吳坤明*

1(汕頭大學 化學系 廣東省有序結構材料的制備與應用重點實驗室,廣東 汕頭,515063) 2(汕頭大學 生物系,廣東 汕頭,515063)3(汕頭大學 計算機科學與技術系,廣東 汕頭,515063) 4(汕頭大學醫學院第二附屬醫院,廣東 汕頭,515041)

肉類和肉制品摻假問題已成為世界各地的共同問題,2014年歐洲報道的“馬肉丑聞”更是揭露了多國肉制品的摻假現象[1]。牛肉造假的主要原因是部分商家為節省成本,通過添加牛肉香精、染料等化學物質,將價格較低的豬雞鴨等肉全部或部分代替價格較高的牛肉。牛肉造假主要分為生牛肉造假、牛肉生制品造假(如肥牛卷、調制牛排等)以及牛肉熟制品造假(如牛肉干、牛肉丸等)。由于摻假過程不標明摻假成分,從而導致消費者面臨接觸病原體和過敏原等健康風險[2-3]。因此,發展牛肉制品的摻假測定及真偽鑒別等安全檢測手段對于規范肉類市場秩序及震懾不法分子具有重要的意義,更是對習總書記要求保護民眾“舌尖上的安全”的踐行。

常見的肉類鑒別技術主要有免疫學檢測方法[4]、光譜技術[5]及聚合酶鏈式反應技術[6]。其中,免疫學檢測基于抗原抗體特異結合的原理,具有靈敏性高的特點,但測試過程耗時長、操作繁瑣,難以實現待檢測物質的高通量鑒別[7];光譜技術檢測基于被檢測原子或分子在激發狀態下發射特征光譜的原理,雖然能夠快速、無損地進行肉制品摻假鑒別,但是由于光譜數據容易受到外加添加劑的干擾,存在不法分子借此逃過檢查的可能,且模型的穩定性易受光譜采集參數和環境因素影響[5],因此重現性差;聚合酶鏈式反應技術依靠核酸來鑒別肉及肉制品是否摻假,具有穩定性高、靈敏度高的特點,檢測更準確[8],但是反應耗時較長、步驟復雜、成本較高,易出現假陽性的風險[9]。最重要的是,經過熟加工,由于蛋白質、脂肪、核酸受熱變性,食品添加劑(如調味料、防腐劑、色素)的加入,上述方法對熟肉制品進行檢測的成本與難度隨之增大。

基質輔助激光解析電離飛行時間質譜(matrix-assisted laser desorption/ionization time of flight mass spectrometry,MALDI TOF-MS)是一種生物質譜技術,具有高靈敏度、高通量、快速、準確等優點[10-12],利用軟電離,能在保持大分子完整性的前提下得到質譜圖。由于其能快速、無損地獲得分析物質譜圖,因此常被用于非靶向性分析,通過綜合多個特征峰完成鑒別,具有高穩定性、高抗污染性的優點,且相較于其他手段,質譜能直接獲得樣品信息,使得造假行為難以遁形。目前,該項技術已在癌癥[13]、心血管疾病[14]等臨床領域研究和食品微生物檢測[15]中取得顯著進展。近年來在肉類的鑒別中也有了初步探索,如對豬、牛、馬、雞的鮮肉和烹制后肉制品,以及魚類肉制品進行MALDI TOF-MS表征后,利用聚類分析(hierarchical cluster analysis, HCA)進行了鑒別[16-17]。

1 材料與方法

1.1 實驗材料

本實驗所用肉類樣品(牛、豬、雞和鴨),汕頭鮀浦當地市場;硫脲、尿素、三羥基氨基甲烷(Tris)、乙腈,均為色譜級,上海阿拉丁生化科技股份有限公司;三氟乙酸(質譜級),芥子酸(98%)、MD25-1000型透析袋,Sigma-Aldrich;有機相濾頭(PVDF, 0.45 μm),津隆;一次性針器注射器,江蘇治宇醫療器械。

1.2 儀器與設備

LC-SFJ-10手持勻質勻漿機,上海力辰科技有限公司;autoflex speed飛行時間質譜儀,布魯克(北京)科技有限公司;TGL-16Gr臺式冷凍離心機,上海安亭科學儀器廠;PHS-3E酸度計,上海儀電科學儀器。

1.3 實驗方法

1.3.1 樣品信息

肉類樣品從當地市場購得后立即放入冰袋,轉入4 ℃下冷藏保鮮。測試前,隨機切取10.0 g肌肉部位組織,避免切入筋膜及脂肪。樣品切碎混勻后,稱取0.50 g肉樣,共收集到如表1所示136個樣本。

1.3.2 肉類樣品蛋白質提取與純化

0.50 g肉類樣品放入玻璃勻漿器,加入10 mL蛋白質提取液(6 mol/L尿素, 1 mol/L硫脲, 50 mmol/L Tris,pH=8.2)[19],8 000 r/min勻漿2 min至無明顯組織,4 ℃、12 000×g離心1 min,取上清液于0.45 μm 濾頭過濾,將濾液裝入透析袋,用100倍體積蒸餾水透析2 h。

表1 本實驗所用的肉類樣品信息(共136個鮮肉樣品)Table 1 Different tissue from 4 meat species adopted in the study (136 fresh meat samples)

1.3.3 MALDI-TOF MS表征

按照V(乙腈)∶V(0.1%三氟乙酸)=3∶7的比例配制TA30溶液,將透析除鹽后的蛋白質溶液與TA30飽和芥子酸溶液等比例混合,取2.5 μL點在靶板上,每個樣品重復點3次,干燥后用MALDI-TOF MS采集數據。平行實驗2次。MALDI-TOF MS具體參數如下:激光頻率為500 Hz,能量為99.6%,在正離子線性模式下掃描范圍為4 000~22 000 Da。

周愷的嘴唇抖動著,想說什么,卻最終沒有說出口。孟麗拿起水杯,說:“什么都不用說了,回來就好,先喝了這杯水,我去給你弄吃的?!敝軔鸷鴾I,接過來一飲而盡……

1.3.4 數據預處理

利用R語言MALDIquant[18]包完成質譜數據的預處理,包括平滑、基線矯正、峰對齊、峰提取等,最終將質譜圖譜轉化為二維數據矩陣,之后利用基于Microsoft Excel 的歸一化方法(MS total useful signal, MSTUS)[20]對數據矩陣進行歸一化處理。

1.3.5 隨機森林算法分析

隨機森林算法是以決策樹為基礎構建的,與決策樹類似,隨機森林算法是通過多個“節點”,實現多次二分類,直至不能再分裂,而隨機森林通過數據和特征的隨機抽取構建多個彼此間不相關的決策樹,共同完成分類預測,其隨機性使得模型的泛化能力和抗過擬合性均得到了很大提升[21]。

利用R語言中的Random forest包[22]對所得的272個數據進行分類建模,訓練集占比為80%(217),測試集占比為20%(55),篩選生或熟狀態下均能代表牛肉、雞肉、鴨肉或豬肉的重要變量。通過在質譜圖中確認重要變量對應離子峰存在(信噪比>3),則確認其為特征蛋白質,并在Uniprot(蛋白質數據庫)中比對檢索特征蛋白質。隨后將特征蛋白質作為新的變量進行隨機森林分類模型的構建,以判斷所篩選特征蛋白質的有效性。R語言版本為4.1.2,Random forest包的版本為4.6~14。通過一系列建模實驗確定模型的參數ntree=50,mtry=24。

1.3.6 PCA和HCA

PCA將多元變量投影分布到幾個不相關的主成分上,以達到數據降維的目的,實現同類數據的聚集和不同類數據的分離,同時實現數據可視化。將隨機森林算法篩選的特征蛋白質作為PCA的新變量,構建4種肉的分類模型,隨后通過HCA以驗證分類模型,最后通過鑒別包括生熟的雞肉、鴨肉和豬肉分別以25%、50%、75%質量比與牛肉混合制備的摻假樣品,完成對模型鑒別能力的驗證。PCA和HCA利用SIMCA-P14.1 軟件完成。

2 結果與分析

2.1 四種肉的MALDI -TOF MS圖譜

牛雞鴨豬4種肉蛋白質的代表性MALDI-TOF MS圖譜如圖1所示,4個物種間質譜圖離子峰存在較大差異,說明存在可以區分4種肉的特征蛋白質;而相同物種的肉在經過烹煮后,離子峰總數目均增大,同時也伴隨一些離子峰的消失,說明在烹煮過程中,部分熱不穩定的蛋白質發生水解。烹煮前后存在許多重合的離子峰,說明存在一些不易水解、性質穩定的蛋白質,具有作為能區分生熟狀態下4種肉類特征蛋白質的潛力。

a-牛肉;b-雞肉;c-鴨肉;d-豬肉圖1 4種肉(生熟)的MALDI-TOF MS圖譜Fig.1 MALDI-TOF MS spectra of 4 species meats (including fresh and cooked)注:重合數代表同種肉生肉和熟肉間重合峰的數目

2.2 重要變量的篩選

在R語言中利用Random forest包在ntree=50、mtry=24進行分類模型的構建。通過這種方法建立的模型分類正確率為100%,袋外誤差為0;在訓練集內部與測試集的準確率均為100%, 受試者工作特征曲線(receiver operating characteristic curve, ROC)下與坐標軸圍成的面積(area under curve, AUC)值均為1,表示訓練集內部數據與測試集數據均能被正確分類。證實隨機森林模型具有很好的分類能力,篩選出的重要變量可信度較高。

調用該模型的變量重要性輸出,選取變量重要性較大的前11個變量(圖2)作為重要變量。最終選取的變量為4 850.9、5 342.1、6 191.3、8 414.6、8 475.4、8 579.3、9 445.1、10 164.5、16 568.8、17 109.9及18 922.9。通過判斷其在MALDI-TOF MS譜圖中對應的離子峰的存在,確認這11個重要變量均為特征蛋白質。隨后,通過在Uniprot中比對檢索,如表2所示,共找到7個特征蛋白質。

圖2 隨機森林算法的前11個重要變量Fig.2 The 11 important variables of random forest

將上述11個特征蛋白質作為新的變量進行隨機森林分類模型的構建。超參數設定為ntree=50、mtry=3, 訓練集占比為80%(217),測試集占比為20%(55)。在新的模型中,用于構建模型的訓練集被100%正確分類,袋外誤差率為0,同時在訓練集內部預測正確率為100%、AUC值為1、95%置信區間為(0.988 1,1),且對于4種肉的特異度、敏感度均達到了1;在測試集預測中,分類的正確率為100%、AUC值為1、95%置信區間為(0.952 6,1),特異度和敏感度均為1。所得到的模型仍然具有較好的分類能力。由此,可以驗證選取的特征蛋白質具有很好的區分4種肉類的能力。

2.3 摻假判別模型的構建

2.3.1 PCA與HCA

4種肉質譜數據所有變量的PCA得分如圖3-a所示,前2個主成分的積累貢獻為R2=23.0%,說明模型對數據的擬合程度較差。各種肉間均有一定的聚類趨勢,而牛肉和豬肉之間、鴨肉和雞肉之間比較接近,反映了物種間親緣關系的接近程度。將隨機森林算法篩選得到的11個特征蛋白質作為變量進行PCA,其得分如圖3-b所示,前2個主成分積累貢獻率為R2=69.0%,模型對數據的擬合程度較好,特征蛋白質的選擇使得主成分對變量變異性的解釋能力得到了很大的提高。各物種肉均有明顯的聚類趨勢,能在2個主成分下得到分離。

a-生熟4種肉;b-11個特征蛋白質作為變量下的生熟4種肉圖3 四種肉類樣品的PCA得分圖Fig.3 PCA scoring plot of four species meats

通過對數據進行HCA,結果顯示不同物種的肉被正確地分為4類(圖4),驗證了PCA的可信性。

圖4 十一個特征蛋白質作為變量下的生熟4種肉的HCAFig.4 HCA using the 11 characteristic proteins of the four species meats (including fresh and cooked)

2.3.2 牛肉摻假樣品驗證

包括生熟的雞肉、鴨肉和豬肉分別以25%、50%、75%質量比與牛肉混合制備的摻假樣品被用于鑒別模型的驗證。其結果如圖5所示,摻假樣品均能與純肉分離,且隨著3種摻假肉加入牛肉的比例增大,摻假牛肉樣品逐漸從純牛肉向對應摻假純肉的方向移動。該結果表明模型能較好地完成對生熟牛肉摻假樣品的定性檢驗。

圖5 生熟純肉和雞肉、鴨肉和豬肉與牛肉混合制備的摻假樣品PCA得分圖Fig.5 PCA scoring plot of pure beef, chicken, duck and pork meats, and adulterated beef samples

3 結論

通過對牛、雞、鴨和豬的不同食用部位的肉樣,分別在生熟狀態下進行簡單、快速的蛋白質提取,并通過 MALDI-TOF MS進行表征,得到了4種肉的蛋白質質譜圖。經預處理后得到的數據矩陣進行隨機森林算法分析,共找到11個能代表生熟4種肉的特征蛋白質,其中7個在Uniprot中得到表征,將這些特征蛋白質作為PCA的變量以構建牛肉摻假鑒別模型。最后通過HCA和牛肉摻假樣品的鑒別驗證了該模型,說明通過本方法,可以完成摻假牛肉的初步篩查。依托于MALDI-TOF MS的高通量、簡便等優勢,可在3 h內完成對384個樣品的檢測,證明該方法可應用于市場及海關等檢測現場,維護肉制品市場的安全與秩序。

猜你喜歡
肉類牛肉質譜
氣相色譜質譜聯用儀在農殘檢測中的應用及維護
《肉類研究》雜志征訂啟事
《肉類研究》雜志征訂啟事
酸湯牛肉里的愛
尋味牛肉
牛肉怎么做,好吃又嫩?
肉類加工
吹掃捕集-氣相色譜質譜聯用測定水中18種揮發性有機物
吃不上牛肉了
歡迎訂閱2016年《肉類研究》雜志
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合