?

數據挖掘技術在中藥領域中的應用及研究進展

2023-02-15 12:54陳澤鍇黃良輝張民權周良良李陽彪陳振華
江西科技師范大學學報 2023年6期
關鍵詞:藥性新藥數據挖掘

陳澤鍇,黃良輝,張民權,周良良,李陽彪,陳振華

(江西科技師范大學藥學院 江西省藥物分子設計與評價重點實驗室,江西 南昌 330013)

1 前言

近年來,科學技術飛速發展,信息數據快速增長,社會進入大數據時代。大數據蘊含著巨大的經濟、社會、科學價值,已經成為社會各界關注的焦點。從大數據中快速收集有用的信息,并分析得出隱藏在其中的價值和規律對社會及科學的發展具有至關重要的作用[1]。數據挖掘(Data Mining)是指從大量數據中,利用算法挖掘隱藏在數據中具有有效、新穎、有潛在應用價值信息,并可從挖掘到的信息中獲取知識,揭示反映事物內在規律以及預測發展趨勢的規則。數據挖掘通常與計算機科學和人工智能密切聯系,并通過統計學、機器學習、數據可視化、神經網絡、模式識別等諸多方法來實現。在大數據背景下,數據挖掘在金融[2]、網絡安全[3]、食品與藥品[4]、醫療[5]等各個領域都有著廣泛的應用。

中藥作為我國獨特的傳統文化瑰寶,其在諸多疾病的治療中應用且效果顯著。但隨著社會與科技的發展,中藥正處于向現代化與國際化發展的關鍵時期,但其發展過程中出現的問題難以解決,一方面多數中藥成分復雜,其有效活性成分及藥理作用機制尚未明確;另一方面,將傳統中藥按國際認可的GMP、GCP、GLP 等標準規范進行研發、生產與管理并適應當今社會發展需求的過程中仍有許多問題亟待解決[6]?;诖髷祿尘跋?,通過數據挖掘對中藥進行研究是推進中藥現代化和國際化的有效途徑。近年來,有關數據挖掘在中藥鑒定識別、中藥藥性以及方劑用藥規律、中藥制劑研究等多個中藥研究領域的研究層出不窮[7](圖1、表1),本文對此有關的研究進展進行了綜述。

表1 數據挖掘在中藥領域中的研究進展

圖1 數據挖掘在中藥領域中的應用

2 中藥識別鑒定

中藥基源具有復雜性、成分多樣性的特點,對中藥及其復方制劑進行全面的質量控制及質量評估是推動中藥現代化的關鍵。目前,中藥及其制劑的質量標準與評估不再是性狀鑒別、顯微鑒別等傳統方法的真偽性鑒別,而是主要以光譜、色譜技術手段來對中藥進行整體質量的控制[8]。然而,中藥圖譜極為復雜,全方位、多角度地對中藥圖譜進行研究是展現中藥獨有特征的關鍵。運用數據挖掘技術與指紋圖譜相結合可為中藥鑒定及質量控制提供一個有效可行的方法。在不同基源的石菖蒲GC 指紋圖譜基礎上[9],利用主成分分析(PCA)可實現不同基源石菖蒲藥材的區分。由于不同算法優缺點不同且其在應用上具有一定局限性,這難免會造成中藥鑒別整體預測性能較差的缺陷。若要提高數據挖掘對中藥鑒定的作用,還需選擇最實用的算法及對不同算法進行結合聯用。有學者[10]通過比較PCA、最小二乘-判別分析(PLS-DA)、最小二乘回歸(PLS)、最小二乘-支持向量機(LS-SVM)四種算法對葛根、葛根莖及其兩者摻雜物的NIR 圖譜進行建模分析,結果表明LS-SVM 可以高性能地定量摻假的葛根樣品,實現了快速無損的葛根真偽辨識。也有學者采用主成分分析-判別分析(PCA-DA)、PLS-DA、LSSVM 對川貝母NIR 圖譜數據建立真偽辨識及商品規格辨識模型并進行交互驗證,結果表明川貝母真偽辨識以PCA-DA、PLS-DA 模型為最優,商品規格分類以PCA-DA、LS-SVM 模型為最優[11]。數據挖掘應用于中藥鑒定中從單一算法的運用到多種算法聯合運用能很好地解決中藥指紋圖譜的復雜性及多維性問題,同時還能提高鑒定的準確性。但要高精度地對中藥進行鑒定,還需要從多維指紋圖譜上進行發展,基于卷積神經網絡(CNN)算法與多元多息指紋圖譜結合[12],有學者成功建立了針對50 種中藥材的鑒定方法,準確率高達92%。但目前,有關中藥多維指紋圖譜上的數據挖掘分析研究甚少,仍需在這個方向作進一步努力。

3 中藥藥性及方劑用藥規律研究

3.1 中藥藥性研究

藥性是對中藥的功效與藥效物質基礎形成及運用規律研究理論,主要涉及中藥四氣、五味、升降浮沉、歸經、有毒無毒等研究。通過數據挖掘技術對中藥藥性研究,可對中藥化學成分進行信息化,并揭示出中藥屬性、藥性理論、化學成分之間的聯系[13]。針對中藥寒熱性識別及寒熱特征標記可視化研究中[14],通過SHAP(SHapley Additive exPlanations)算法對多種中藥紫外光譜分析發現,相似藥性的中藥具有相似的紫外吸收光譜,寒性中藥在400 和267 nm處的紫外吸光度相似,而熱性中藥在400、299、301 nm處紫外吸收也類同。亦有學者[15]針對唇形科中藥亞類化學成分與藥性之間相關性,采用二元Logistic模型進行分析發現唇形科中藥寒熱性與其含有的萜類及簡單苯丙素類成分具有強關聯性,單萜類化學成分間相互作用可使唇形科中藥藥性表現為寒性,而苯丙素化學成分相互作用則表現為熱性。數據挖掘技術可客觀地解釋化學結構-藥性間的關聯,但若要進一步闡釋“化學結構-藥性-藥效”間的聯系及其規律,還需要結合生物學效應等方面進行分析,實現中藥藥性理論科學內涵的解釋,從而促進中藥現代化的發展進程。

3.2 中藥方劑用藥規律研究

中藥方劑是根據疾病主治方向或主要特征,有目的地進行藥物配伍,以達到協同治療或是減毒增效的效果。單味中藥原本就具備四氣五味、升降浮沉等屬性及現代藥理作用機制,而多味中藥的組合配伍無疑是一種復雜的體系。數據挖掘可直觀地分析中藥方劑用藥規律并解釋其藥理作用機制。有學者[16]通過頻次分析、關聯規則、聚類分析等方法研究中藥治療潰瘍性結腸炎(UC)用藥規律,發現其用藥以苦寒降泄為主,黃連-白頭翁為核心藥對,同時網絡藥理學研究表明核心藥對可能是通過介導脂質代謝、TNF 信號、IL-17 信號和Th17 細胞分化等多個通路產生效應。亦有研究[17]采用相似的方法探究中藥治療肺結節用藥規律及作用機制,結果表明,中藥治療肺結節主要以健脾益肺、行氣化痰、活血祛瘀為主,核心藥對為甘草-茯苓-半夏,治療肺結節的潛在靶點和作用機制主要是參與炎癥反應、免疫調控等過程。中藥組方物質基礎不明是中藥配伍現代化闡述的難題,借助數據挖掘及現代藥理學技術,可清晰詳盡地總結中藥復方用藥規律并從分子層面上對核心藥的藥理作用機制及潛在作用靶點做出闡釋,推動中藥的二次開發[18]。

4 中藥制劑研究

中藥制劑的生產,由于涉及原料、制備工藝、設備、生產管理等多種因素,制劑質量差異明顯的問題時有發生,嚴重影響中藥制劑的臨床療效及其安全性[19-20]。運用數據挖掘技術探究影響中藥制劑質量關鍵屬性及其規律,可使其質量從原料及制備過程中進行控制?;诨疑P聯分析算法[21],能夠科學客觀地找出熱毒寧注射液生產過程中的關鍵工藝參數為萃取時平均體積流量、調酸后pH 值以及萃取濃縮出膏溫度。通過建立PLS[22]和多區塊-偏最小二乘(MB-PLS)[23]模型,可確定影響天舒片素片崩解時限和三七總皂苷緩釋片溶出行為的關鍵物料屬性。同時,通過數據挖掘算法構建預測模型對制劑工藝數據進行分析預測,可實現對中藥制劑生產質量的優化。有學者在桂枝茯苓膠囊智能化生產研究中[24],分別利用PLS、分類回歸樹(CART)、多元自適應回歸樣條(MARS)和引導策略搜索(GPS)等數據挖掘算法構建預測模型進行預測分析,最終確定MARS 為最佳預測模型,為桂枝茯苓膠囊生產質量控制智能化提供技術支持。

5 中藥新藥研發

5.1 中藥新藥篩選及開發

虛擬篩選作為計算機藥物篩選技術,在中藥新藥研發中的應用十分廣泛,通過數據挖掘技術建立中藥潛在藥用分子數據庫,并用虛擬篩選技術分析藥物分子與靶標間的物理化學相互作用,同時對其進行吸收、分布、代謝、排泄及毒性(ADMET)的模擬預測,可實現新藥的快速篩選。有學者[25]通過分子對接技術,針對中藥中具有潛在Galectin-3 抑制作用的分子進行虛擬篩選,并結合XGBoost 等數據挖掘算法進行進一步篩選,最后運用分子動力學加以驗證,從中藥中篩選出山楂和長苞香蒲中的1,2-二甲苯和香蒲酸兩種成分具有良好的Galectin-3 抑制作用,有可能成為神經性退行疾病的有效抑制劑。在Limk1 靶點抑制劑研究中[26],有學者采用分子對接技術結合三維卷積網絡(3DGCN)建立模型并進行活性預測,從中藥數據庫中進行潛在Limk1 靶點抑制劑的篩選,并對其進行ADMET 的預測分析及分子動力學模擬驗證,最后發現有兩個先導化合物可能為Limk1 受體候選抑制劑。數據挖掘建立中藥化學成分數據庫同時采用分子模擬等技術進行活性成分篩選是一個精確有效的中藥新藥研發途徑,可規避新藥探索過程中的盲目性,對新藥開發具指導和啟發的作用。

5.2 中藥臨床研究

目前,中藥新藥臨床療效評價體系研究仍停留在基于西醫化學藥隨機對照試驗等傳統方式上,其并不能有效地體現出中藥作用特點及療效。運用數據挖掘技術可以構建一種適用于中藥療效評價的綜合評價方法[27]。有研究[28]基于一種中藥新藥治療冠心病心絞痛(血瘀證)臨床數據為實例,同時采用西醫和中醫兩種療效指標,通過PLS-SLVM 的方法建立了適用于分析中藥臨床療效的方法,既滿足變量構建方法所需的全面性、目的性、可比性、層次性、科學性等基本原則,又兼顧了中醫臨床療效數據的結構特征,為中藥新藥療效評價提供了具有中醫臨床特色的綜合評價方法。

6 結論與展望

本文主要從中藥鑒定識別、中藥藥性及方劑用藥規律研究、中藥制劑研究、中藥新藥研發四個方面闡述了數據挖掘技術在中藥領域中的應用。在大數據背景下,數據挖掘技術在中藥領域中可探究中藥多成分、多療效、多靶點原理等傳統研究方法難解決的問題,同時還有助于中藥信息結構化,促進中藥質量標準化,推動實現中藥現代化。近年來,有關研究熱潮迭起,彰顯了數據挖掘技術在中藥研究中的適用性和優越性。但是其應用也存在著一定局限性,一方面當前大多數研究仍停留在中藥研究數據信息簡單維度的處理分析,所得結果較為片面,有待進一步的探索及驗證;另一方面,數據挖掘的算法具有一定局限性,并不能完全體現出中藥作用的特點。因此,本方向還需要多領域、多學科專家共同合作以及深入的交叉研究。

猜你喜歡
藥性新藥數據挖掘
探討人工智能與數據挖掘發展趨勢
白蘿卜與中藥同食,會解掉藥性嗎?
基于并行計算的大數據挖掘在電網中的應用
半夏的化學成分及其藥性、毒性研究進展
不同炮制和煎煮時間對大黃沉降藥性的影響研究
丙型肝炎治療新藥 Simeprevir
一種基于Hadoop的大數據挖掘云服務及應用
改進細菌群體趨藥性算法在可用輸電能力計算中的應用
魯先平:一個新藥的14年
新藥來自何方
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合