?

香葉天竺葵精油香氣成分保留指數的神經網絡研究

2018-08-16 10:05堵錫華
西南農業學報 2018年7期
關鍵詞:香葉天竺葵精油

堵錫華,王 超,李 靖,宋 明,田 林

(徐州工程學院化學化工學院,江蘇 徐州 221018)

【研究意義】香葉天竺葵為牻牛兒苗科天竺葵屬草本植物,原產于非洲,現在我國云南中西部、江蘇、浙江、四川等地也已有種植,具有主治“風濕、疝氣”、生物抗氧化能力等藥用價值[1-2],又有作為香料重要原料的經濟價值。香葉天竺葵精油為其莖和葉中的主要有效成分,作為玫瑰香韻的主要原料, 是調配各種香水、香粉、膏霜、皂用香精等日用香精和食用香精的重要香原料[3-4]?!厩叭搜芯窟M展】所以近年來對香葉天竺葵的相關研究受到人們越來越多的關注[5-6],但這些研究工作主要集中在成分分析或藥用領域方面[7-9],采用神經網絡方法對香葉天竺葵進行相關性質的研究未見有報道。

神經網絡方法是一個多學科交叉的前沿研究方法,它通過模擬人的大腦,來對研究對象的相關信息進行系統的智能處理,利用該法將其應用于定量結構-保留相關性研究(QSRR)工作,成為色譜分析研究工作者重要的也是簡便高效的手段[10-11],它已成為色譜研究中重要的分支,在食品科學[12]、藥學[13]、環境科學[14]等領域得到越來越廣泛的應用?!颈狙芯壳腥朦c】在前面[15-17]工作方法的基礎上,根據文獻[18]檢測出的61個香葉天竺葵精油的香氣分子列出的色譜保留指數RI,按照文獻[19-20]方法編寫了相關的計算程序,計算了61個香氣分子的分子連接性指數和電性拓撲狀態指數,通過最佳變量子集回歸,篩選了其中5種結構參數作為神經網絡的輸入層變量,以氣相色譜保留指數作為輸出層變量,建構得到的神經網絡模型的總相關系數rt達到0.9987的高度相關,利用該神經網絡模型預測得到的色譜保留指數與文獻值吻合度較為理想,相對平均誤差只有0.67 %?!緮M解決的關鍵問題】研究工作對利用氣相色譜分析技術快速分析香葉天竺葵精油的成分、指導生產不同香氣的香精產品具有實際意義。

表1 RI與參數的最佳變量子集回歸結果

1 參數計算及最佳變量篩選

(1)

式中:n為香葉天竺葵精油香氣成分分子的樣本總數,b為模型的變量數,r2為模型的決定系數,這里計算得到的FIT值越大,說明模型越穩定,預測能力也就越高,當然最優模型需根據相關性、誤差和FIT等綜合判斷。

表2 香氣成分的結構參數

續表2 Continued table 2

序號化合物0X4X5XcE3E8RI文獻值預測值誤差9(Z)-氧化芳樟醇5(呋喃型)8.1320.7780.982-0.0550107710860.7910綠花白千層醇11.1620.9104.0544.027015961589-0.4511八氫四甲基萘甲醇11.1620.3632.9093.4423.32916121608-0.2212(E)-氧化芳樟醇5(呋喃型)8.1320.7780.982-0.055010921086-0.6013異胡薄荷醇8.8010.6691.4091.167011551151-0.3214喇叭花醇11.1620.8404.0544.0270162316401.0515橙花醛7.5550.2310.34002.48812461222-1.9016薄荷酮7.7620.3421.2051.5540.49911701164-0.5217異薄荷酮7.7620.3421.2051.5540.49911651164-0.09186-甲基-3,5-庚二烯-2-酮6.1400.1410.16401.29211051082-2.05196,10,14-三甲基-2-十五酮14.0040.4721.5662.5400.339187218740.08206-甲基-5-庚烯-2-酮6.4000.2730.24601.5599869910.4821甲酸香茅酯8.8770.1820.5950.6351.372127913011.6922甲酸香葉酯8.6700.1590.46102.60813041296-0.6023惕各酸香葉酯11.6700.2170.57503.01717001687-0.7524丁酸香葉酯11.0070.1810.59002.528155815630.3025丙酸香葉酯10.3000.1810.53502.486147714820.3626丁酸香茅酯11.2140.2040.7410.6301.320152915300.0527丙酸香茅酯10.5070.2040.6900.6301.28414441441-0.2428乙酸香葉酯9.5930.1810.48902.38913841382-0.1229惕各酸香茅酯11.8770.2400.7270.6011.86016671659-0.4630乙酸香茅酯9.8000.2040.6350.6301.19313571343-1.04312-甲基丁酸香葉酯11.9290.2190.70203.76215861585-0.0932異戊酸香葉酯11.8770.2800.6280.3662.523161316210.4633β-波旁烯10.4220.6364.0154.8041.593139114061.0534β-石竹烯10.4750.5192.2821.7273.108142714370.7135去氫白菖蒲烯10.3780.3532.1742.3240153115360.2936β-蓽澄茄烯10.4220.6593.9814.8261.59713901367-1.6637α-依蘭油烯10.5850.3862.6193.3993.275150115070.3938α-蒎烯7.1460.5461.5801.9231.6469409420.2139α-欖香烯10.8530.5931.5250.6134.526149215081.0840β-愈創木烯10.6900.3612.3221.7056.908149015101.3541δ-杜松烯10.6380.3942.5562.5205.09315241504-1.3242α-蛇麻烯10.6380.4441.23803.027146114620.0943β-杜松烯10.5850.4252.6503.5463.275150115090.5544α-芹子烯10.4750.5142.7281.6173.047149314990.4245別香橙烯10.4220.6053.6794.8751.59014711463-0.56

續表2 Continued table 2

序號化合物0X4X5XcE3E8RI文獻值預測值誤差51月桂烯6.9830.1830.29602.49599110223.1352α-古蕓香烯10.6380.5873.4633.9083.67114121411-0.0553α-松油烯7.1460.2410.8180.7403.12110191018-0.1354α-杜松烯10.5850.4062.6193.3993.27515371507-1.9355α-水芹烯7.0940.2520.8141.5731.414100510171.1956γ-芹子烯10.5270.4992.6300.7824.790146514650.0157玫瑰醚7.7620.2550.9151.2301.36511151104-0.9858大根香葉烯 D10.4220.2711.2551.4482.81514851485-0.0159石竹烯氧化物10.8830.7082.6902.2091.504159416030.5360對傘花烴6.8870.2120.6070.6530102510441.82612,2,6-三甲基-6-乙烯基四氫吡喃7.8140.5730.900009649680.45

2 模型的建構

2.1 多元回歸模型

將文獻[18]中列出的61種香氣成分的氣相色譜保留指數,與優化篩選出的5種結構參數0X,4X,5Xc,E3和E8進行回歸分析,得到的回歸方程為:

RI=114.7860X-311.9594X+126.0565Xc-69.722E3-20.800E8+343.764

(2)

S=89.375F=70.034

利用式(2)對香氣成分的色譜保留指數進行預測,所得預測值與文獻值基本吻合,2者的相對平均誤差為4.59 %。

2.2 模型穩健性與預測能力檢驗

表3 Jackknifed相關系數的檢驗

圖1 Jackknifed相關系數r的雷達圖Fig.1 Radar map of correlation coefficient r

2.3 神經網絡模型

為提高預測氣相色譜保留指數的準確性,用神經網絡法深入進行研究。根據表1中篩選得到的0X,4X,5Xc,E3和E8共5個分子結構參數,將這5個參數作為神經網絡方法中的輸入層變量,61種香葉天竺葵精油香氣成分的氣相色譜保留指數作為輸出層變量,按照許祿等學者[24]相關建議規則:

1.4≤ρ(=n/M)<2.2

(3)

其中,n為香氣成分的樣本個數,M為網絡總權重。M的定義又為:

M=(I+1)H+(H+1)Q

(4)

其中,I、H、Q為三層神經網絡結構中的輸入層、隱含層及輸出層的變量數。這里采用5個分子結構參數作為輸入層變量,即I=7; 用香氣成分的色譜保留指數作為輸出層變量,即Q= 1; 故如要使式(3)和式(4)符合要求,H可選取4、5或6,通過分別計算、分析、比較,發現當H取6時,所得模型的結果最優,故這里網絡結構采用5∶6∶1的結構方式,隱含層的傳遞函數用tansig,輸出層的傳遞函數用purelin,訓練傳遞函數用trainlm,初始速率為0. 001,最大迭代次數則采用3000次。

為進一步判斷模型的預測能力,防止過擬合,將全部香葉天竺葵精油的香氣成分61個分子分為3組:訓練集(每5個分子為1組,取其中的第1、3、4個分子)、測試集(第2個分子)、驗證集(第5個分子),由此計算分析,得到了神經網絡預測保留指數模型的總相關系數rt=0.9987,訓練集相關系數r1

圖2 預測值和文獻值的關系圖Fig.2 Relationship between literal andpredictor of RI

=0.9986、測試集相關系數r2=0.9996、驗證集的相關系數r3=0.9986,可以看出,各集的相關系數與模型的總相關系數均較為接近,利用該建構的QSRR神經網絡模型,計算得到香葉天竺葵精油香氣成分的氣相色譜保留指數預測值(Pre.),與文獻值吻合度非常理想,兩者的相對平均誤差僅為0.67 %,遠優于采用多元回歸方法的預測精度,故神經網絡法建立模型的預測能力明顯優于多元回歸分析方法。將保留指數的預測值與文獻值列于表2中,兩者的關系圖見圖2,神經網絡模型的權重和偏置見表4。

3 討 論

在氣相色譜分析中,保留指數是使用廣泛并被公認的色譜定性指標,但影響保留指數大小的因素有:載體的吸附作用、柱溫、進樣量的大小、載氣的純度等等,其中最主要的是被測組分和固定相之間的分子間作用力大小,當固定相一定時,被測組分在色譜柱上的保留行為,則與該組分分子的空間拓撲、幾何和電性等結構特性具有密切的關系[25]。本模型選用分子連接性指數中的0X、4X、5Xc和電性拓撲狀態指數中的E3、E8共5個變量中,分子連接性指數中的0X、4X和5Xc分別代表0、4階路徑指數和簇項指數,電性拓撲狀態指數中的E3和E8分別代表 >CH-和 >C=兩種基團的結構參數值,這5個參數變量所代表的基團對模型的貢獻最大,說明分子中原子之間的連接形式、連接何種基團、相鄰原子的作用力大小等均對色譜保留指數能產生影響,從61個香葉天竺葵精油香氣成分的分子結構與保留指數的關系可以看出,隨著有機化合物分子中碳原子數目的增加,分子體積逐漸增大,色散力逐漸增強,化合物在固定相上的色譜保留作用逐漸增強;當碳原子數目一定時,分子支化度增大,組分與固定相之間的接觸面減小,色散力逐漸減小,保留作用也逐漸減小。由于單一的分子結構參數不能充分反映原子間復雜的影響關系,故將蘊含了拓撲、幾何和電性結構信息的連接性指數與電性拓撲狀態指數有機結合,揭示了基團之間的作用和影響,反映出了香葉天竺葵精油香氣成分色譜保留指數的變化規律。利用篩選的5個結構參數建立的神經網絡預測模型,得到氣相色譜保留指數預測值的相對平均誤差僅為0.67 %。通過對全部61個香葉天竺葵精油香氣成分的色譜保留指數進行預測,只有對月桂烯分子預測時,相對誤差最大達到3.13 %,這可能與該分子鏈上有多個烯鍵的相互作用使保留指數偏小有關。

表4 BP-ANN 模型的權重和偏置

4 結 論

(1)通過MINITAB優化篩選的5個結構描述子與香葉天竺葵精油的香氣成分保留指數具有高度的非線性相關性,利用結構參數與保留指數相關性建構的神經網絡模型,不但對內部化合物樣本有好的估算能力,而且對外部化合物樣本有較強的預測能力。

(2)5種分子結構參數0X、4X、5Xc、E3、E8與香氣成分色譜保留指數之間建立的QSRR模型,經檢驗不存在異常的離域值,具有良好的穩定性和較強的預測能力。

(3)神經網絡方法具有比多元回歸分析方法更好的預測準確度和糾錯能力。

(4)根據分子拓撲結構特征構建的神經網絡模型,對預測香氣成分的色譜保留指數、選擇合適的色譜分離條件、探索色譜保留機制能起到積極的指導作用。

猜你喜歡
香葉天竺葵精油
天竺葵
板栗花精油提取研究
天竺葵復興
香葉、羅勒要分清
酸橙精油GC-MS分析及其生物活性
一諾千金
為自己調香,造一座精油芳香花園
認親(短篇小說)
茉莉和天竺葵
香葉
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合