?

使用機器學習建立慢性阻塞性肺疾病患者重度氣流受限風險預警模型研究

2022-12-26 10:58周麗娟溫賢秀呂琴蔣蓉吳行偉周黃源向超
中國全科醫學 2022年2期
關鍵詞:氣流重度預警

周麗娟,溫賢秀,呂琴,蔣蓉,吳行偉,周黃源,向超

據報道,全球有5.449億人患有慢性呼吸道疾病,大多數慢性呼吸道疾病患者死于慢性阻塞性肺疾?。╟hronic obstructive pulmonary disease,COPD)[1-2]。COPD嚴重影響患者的生活質量,為家庭和社會帶來沉重的經濟負擔[3],已成為21世紀危害人類健康的重要公共衛生問題。氣流受限程度是判定COPD患者疾病嚴重程度的主要指標[4-5],然而部分患者無法順利實施檢查獲得該指標,如咯血、氣胸、安置胸腔閉式引流管、心功能不全、主動脈瘤等有肺功能檢查禁忌證的患者,無法完成檢查體位和呼吸動作且配合度較差的患者,以及各種原因未定期隨訪的患者等。該項指標的缺失可能使COPD患者忽視重度氣流受限風險,導致不良預后。針對上述問題,建立預警模型以估計患者的重度氣流受限風險可能是一種替代方案。然而,目前少見有較佳預測性能及臨床應用潛力的預警模型報道。因此,本研究構建了基于機器學習的COPD患者重度氣流受限程度的風險預警模型,為COPD的臨床評估及治療提供技術工具及參考依據。

1 對象與方法

1.1 研究對象 采用橫斷面設計調查2019年1月至2020年6月四川省某三甲醫院的COPD住院患者。納入標準:(1)符合慢性阻塞性肺疾病全球倡議(GOLD)2019版COPD的診斷標準[5];(2)近一個月內做過肺功能檢查;(3)年齡≥18歲;(4)自愿參與本研究且簽署知情同意書。排除標準:(1)存在COPD合并其他通氣和限制性通氣功能障礙的呼吸系統疾??;(2)存在嚴重的視、聽障礙而無法交流;(3)有嚴重心、肝、腎等器質性疾病。

1.2 研究方法

1.2.1 收集一般臨床指標 一般臨床指標調查表由研究者根據文獻回顧和臨床經驗自行設計,內容包括:(1)一般資料:性別、年齡、病程分期(穩定期、急性加重期)、體質指數(BMI)、受教育程度。(2)疾病因素:哮喘癥狀(有、無)、喘息(有、無)、呼吸困難(有、無)、食欲不振(有、無)、咳嗽(有、無)、咳嗽描述、痰液描述、痰液性狀描述、癥狀高發時間、急性發作次數、距上次急性發作時間、致病因素、急性發作住院史(有、無)及次數、急性發作門診就診(有、無)、全身使用激素(有、無)、合并呼吸衰竭(有、無)、合并肺心?。ㄓ?、無)、合并肺性腦?。ㄓ?、無)、營養代謝異常(有、無)、心血管疾?。ㄓ?、無)、其他疾病史(有、無)、COPD家族史(有、無)、吸煙史(有、無)、吸氧(有、無)、每日吸氧時間、吸氧流量、吸氧方式、使用經皮血氧飽和度監測儀(有、無)、血氧飽和度值、無創通氣使用(有、無)、每天無創通氣時間、無創通氣方式、佩戴面罩(有、無)、是否知曉無創呼吸機濕化罐和呼吸機管道如何消毒、營養狀況、鍛煉(有、無)、鍛煉方式、每天鍛煉時間、縮唇腹式呼吸(有、無)、使用吸入劑(有、無)、吸入劑種類及數量、長期使用吸入藥物(有、無)。

1.2.2 COPD患者病情評估 使用慢性阻塞性肺疾病評估表(COPD assessment test,CAT)[6]評估COPD病情。CAT包括8方面內容:咳嗽、咳痰、胸悶、氣促、活動受限、外出信心、睡眠、精力。CAT評分總分為40分,總分>30分為病情非常嚴重,20分<總分≤30分為病情嚴重,10分<總分≤20分為病情中等,總分≤10分為病情輕度。

1.2.3 COPD患者呼吸困難嚴重程度評估 使用呼吸困難指數評分(mMRC)[6]評估COPD患者的呼吸困難嚴重程度。mMRC為改良英國MRC,共有0~4級。0級:只有在劇烈活動時感到呼吸困難;1級:平地快步行走或步行小坡時出現氣短;2級:由于氣短,平地行走時比同齡人慢或者需要停下來休息;3級:在平地行走約100 m或數分鐘后需要停下喘氣;4級:因為嚴重呼吸困難而不能離開家,或在穿脫衣服時出現呼吸困難。

1.2.4 肺功能檢查與重度氣流受限的確定 采用德國耶格(Master Screen PFT System)肺功能儀,經環境參數定標、容量定標和氣體定標后,測定受試者肺功能通氣情況。

參考GOLD(2019版)指南[5],本研究采用肺功能指標中第1秒用力呼氣量占預計值的百分比(FEV1%)來判定COPD患者氣流受限程度,輕度氣流受限為FEV1%≥80%;中度氣流受限為50%≤FEV1%<80%;重度氣流受限為30%≤FEV1%<50%;極重度氣流受限為FEV1%<30%。

為建立風險模型,以FEV1%=50%為臨界閾值,將患者分為有重度氣流受限風險者(重度、極重度FEV1%<50%)賦值為1,無重度氣流受限風險者(輕度、中度FEV1%≥50%)賦值為0。

1.3 質量控制 由經統一培訓考核合格的1名碩士研究生、1名肺功能技師和4名本科且有5年以上呼吸科工作經驗的護士組成科研小組進行問卷設計、問卷調查、肺功能檢查。問卷使用統一指導語,由患者匿名填寫。若遇患者無法自行填寫,由調查員不予任何誘導下誦讀問卷條目,再讓患者獨立做出條目結果判斷。肺功能檢查采用相同設備和相同技師規范檢測。調查完畢后,當場回收問卷。數據錄入、脫敏及分析并非相同人員,調查員雙人錄入問卷結果,另一成員對數據進行脫敏處理后交予數據分析人員。本研究對20例COPD患者進行預調查,在預調查實施過程中存在的問題加以修改完善。完善后,開始正式調查與數據收集。

1.4 倫理說明 在數據收集前,研究者將本研究的內容、目的告知患者,經患者同意后,獲得書面知情同意書。本研究僅采集患者診斷及臨床信息,不采取干預措施,因此患者損害風險低。

1.5 數據處理 以患者重度及以上氣流受限程度(FEV1%<50%)作為模型的輸出變量,其余50個變量作為輸入變量,進行數據處理及模型研究。

1.5.1 數據審核及初步篩選 審核數據的變量特征,并按既定規則進行初步篩選:(1)刪除每列數據缺失占比>90%的變量;(2)刪除每列單個類別比例>90%的變量;(3)刪除每列變異系數(variable coefficient,CV)<0.05的變量。

1.5.2 缺失值處理 采用不填充、簡單填充、隨機森林填充和改良的隨機森林填充4種方法行缺失值填充。

1.5.3 特征篩選 本研究使用不篩選、Lasso篩選、Boruta篩選3種特征篩選方法進行數據集的特征提取。使用Lasso篩選、Boruta篩選生成特征重要數據,該數據反映各輸入變量對結果預測的重要性。經過4種缺失值處理和3種特征篩選方法,共獲得12個處理后的數據集。

1.6 模型建立 使用Python Scikit-Learn庫中train_test_split包將數據分為80%訓練集和20%測試集。訓練集數據用于模型訓練,測試集數據用于評價和選擇模型。使用17種機器學習和1種集成學習算法(Ensemble Learning)對經過預處理的12個數據集分別建模。17種機器學習算法包括:邏輯回歸(Logistic Regression)、隨機梯度下降(SGD)、K最近鄰(KNN)、決策樹(Decision Tree)、高斯樸素貝葉斯(Gaussian Na?ve Bayes)、伯努利樸素貝葉斯(Bernoulli Naive Bayes)、多項式樸素貝葉斯(Multinomial Naive Bayes)、支持矢量機(SVM)、二次判別分析(QDA)、隨機森林(Random Forest)、極端隨機樹(Extra Tree)、線性判別分析(LDA)、被動攻擊(Passive Aggressive)、自適應增強(AdaBoost)、引導聚集(Bagging)、梯度提升(Gradient Boosting)、極端梯度提升(XGBoost)。集成模型的結果由最佳的前5個模型投票產生。

1.7 模型評價 以ROC曲線下面積(AUC)、準確率、精確率、召回率、F1值作為模型評估的指標,在各指標結果不一致時,以AUC作為主要參考。在訓練集中,使用十折交叉驗證法進行模型評估。在測試集中,采用Bootstrapping算法重抽樣200次進行外部驗證。采用測試集數據的評價指標作為最佳模型選擇依據。

1.8 樣本量驗證 使用篩選的最佳模型,隨機使用訓練集10%、20%……100%的數據訓練模型,使用測試集數據對訓練的模型預測性能進行評價。該方法重復100次,觀察訓練樣本量的變化對模型預測性能的影響。模型建立和圖形可視化采用Python3.7.3+Pycharm搭建開發環境,使用Scikit-Learn庫和Xgboost庫建立機器學習模型。模型數據預處理、模型建立、評價及選擇流程見圖1。

圖1 基于機器學習COPD患者氣流受限程度風險預警模型建立流程Figure 1 Flowchart of risk prediction model for COPD patients with airflow limitation based on machine learning

1.9 統計學方法 使用R 4.0.3軟件對數據進行分析。計量資料以(±s)表示,在不同數據預處理方法比較中,若數據正態分布及方差齊性,多組間比較采用方差分析;若數據為非正態分布或方差不齊,多組間比較采用Kruskal-Wallis檢驗。計數資料以頻數、百分比表示。以P<0.05為差異有統計學意義。

2 結果

2.1 研究對象的一般臨床指標 本研究共發放問卷432份,回收問卷418份,有效回收率為96.7%。納入的418例COPD患者中,女46例,男372例;年齡(63.7±10.9)歲;穩定期304例,急性加重期114例;氣流受限輕、中度有206例(49.3%),重、極重度有212例(50.7%)。共收集輸入變量50個,輸出變量1個,變量情況見表1。

表1 COPD患者一般臨床指標(n=418)Table 1 General information of the included COPD patients(n=418)

2.2 數據審核及初步篩選結果 根據上述數據審核和初篩原則,剔除12個輸入變量。變量剔除的原因匯總見表2。

表2 總數據集變量剔除表Table 2 Total data set variable elimination

2.3 影響氣流受限的關鍵因素 經4種缺失值處理和3種特征篩選后,本研究共獲得12個處理后的數據集及12種影響氣流受限因素的重要性排序,結果顯示,mMRC等級、年齡、BMI、吸煙史(有、無)、CAT評分、呼吸困難(有、無)在變量特征排序中居于前列,是構造模型的關鍵指標,對結果預測有重要作用。其中,采取不填充、Lasso篩選方法后,獲得的因素重要性排序見圖2。mMRC等級、吸煙史(有、無)、呼吸困難(有、無)為位居前三的預測因子,mMRC等級占特征重要性的54.15%。使用不填充、Boruta篩選方法后,獲得的因素重要性排序見圖3。CAT評分、年齡、mMRC等級為位居前三的預測因子,CAT評分占特征重要性的26.64%。

圖2 不填充、Lasso篩選方法特征重要性Figure 2 Unfilled,Lasso screened feature importance maps

圖3 不填充、Boruta篩選方法特征重要性Figure 3 Unfilled、Boruta screened feature importance maps

2.4 預警模型建立與評價 使用17種機器學習和1個集成學習算法對12個數據集分別建模,共得216個預測模型。17種機器學習算法十折交叉驗證結果見表3。不同算法預測性能比較,差異有統計學意義(P<0.05),隨機梯度下降算法的平均AUC最大,為(0.738±0.089)。使用Bootstrapping算法對測試集進行外部驗證,結果見表4。不同算法所得模型的預測性能比較,差異有統計學意義(P<0.05),集成學習算法的平均AUC最大為(0.757±0.057)。本研究利用Bootstrapping算法對4種缺失值處理和3種特征篩選預測性能的評價,結果見表5~6。當不填充和Lasso篩選時,可提高模型的性能,差異有統計學意義(P<0.05)。

表3 17種機器學習算法十折交叉驗證結果Table 3 Ten fold cross validation results of 17 machine learning algorithms

表4 17種機器學習算法外部驗證結果Table 4 External verification results of 17 machine learning algorithms

表5 不同缺失值處理方法在外部驗證的結果Table 5 The results of external validation of different missing value processing methods

表6 不同特征篩選方法在外部驗證的結果Table 6 The results of external validation of different feature screening methods

2.5 預警模型的選擇 使用測試集數據對216個機器學習模型進行測試,選擇AUC最大的模型為最佳模型。AUC前5個最大的模型預測性能指標見表7,AUC為0.790 9,準確率為75.90%,精確率為75.00%,召回率為78.57%,F1值為0.767 4。ROC曲線圖和P-R曲線圖見圖4~5。

圖4 5個最佳風險預警模型的ROC曲線Figure 4 ROC curves of the five optimal risk prediction models

圖5 5個最佳風險預警模型的P-R曲線Figure 5 P-R curves of the five optimal risk prediction models

2.6 樣本量驗證 選擇最佳模型對應的算法作為樣本量驗證的算法。將數據集按照8∶2劃分為訓練集和測試集。對訓練集樣本分別隨機抽取10%、20%...100%,進行模型訓練,該過程重復100次。使用測試集數據對模型進行測試,建立AUC與樣本量的折線圖,見圖6,結果顯示,當樣本量到達70%左右,曲線趨于平緩。提示此時樣本量對預測性能的提升不再增加。

圖6 COPD患者氣流受限程度風險預警模型的樣本量驗證Figure 6 Sample size validation diagram of the risk prediction model for the degree of airflow limitation in COPD patients

3 討論

隨著患者氣流受限嚴重程度增加,COPD導致的死亡風險也隨之增加。因而,明確氣流受限程度并實施適當的干預手段,具有重要意義[7]。本研究通過構建COPD患者重度氣流受限程度的風險模型,來預測患者氣流受限嚴重程度。數據通過初篩、缺失值填充、變量特征篩選等數據挖掘過程,以AUC、準確率、精確率、召回率、F1值作為內部驗證、最佳模型、外部驗證的評價指標,選擇出集成學習模型為最佳模型。本研究結果與LIU等[8]的研究一致。集成學習[9]通過組合多個學習算法來達到更佳的預測表現,其使用多個學習算法共同決策比使用單個學習算法的預測更加準確,具有一定的臨床應用價值。董泉明等[10]利用多元線性模型建立了FEV1預警模型,但該研究未納入疾病相關因素加以探討。本研究在前人研究的基礎上,綜合考慮了疾病相關因素的變量用于構建氣流受限程度的分類模型。ZAFARI等[11]開發了一種肺功能下降的個體化預測模型,但該研究僅納入輕中度COPD吸煙者,對嚴重的COPD患者無法預測。另外,幾項研究均是對肺功能FEV1絕對值進行的預測,而FEV1%則是相對個體化的評價指標,在臨床上用途更廣,更受到研究者的關注,因此,更有預測價值[12-13]。

本研究中模型構建的關鍵指標有mMRC等級、年齡、BMI、CAT評分、是否有吸煙史和呼吸困難。肺通氣功能指標與年齡、吸煙史有關,這與既往研究一致[14-16]。COPD患者多為老年人,隨年齡增加,呼吸肌收縮力降低,胸廓和肺的彈性回縮力下降,支氣管管壁萎縮、管腔狹窄,導致肺通氣阻力增加,氣流速度減慢。加之,患者吸煙影響肺微生態群,降低了肺部防御能力[17]。肺功能與BMI有關,與部分學者研究吻合[18-19]。GRIGSBY等[20]研究表明,在發展中國家,BMI越低,肺功能越差。然而,有學者指出FEV1與BMI無關,僅與身高呈正相關[10,14]。研究結果差異可能因納入人群的社會人口學特征不同所致。肺功能還與mMRC等級和CAT評分存在顯著關系[5,21-22]?;诨颊叻喂δ艿念A測轉向為疾病惡化風險和癥狀的評估,該評估可用于完善COPD氣流受限程度分級。

真實世界研究中,數據缺失已成為常見且難以避免的嚴重問題。在數據分析中,若因小部分的數據缺失而刪除該患者整個信息,將會損失大部分信息;若因過多的信息丟失加入特征,可能反倒增加噪聲,影響最后結果。本研究通過初步篩選刪除數據缺失占比大于90%的變量后進行填充。而對于剩余數據是否需要填充,以及怎樣有效填充,直至今日,也尚未達成共識。最常用的填充方法莫過于用均值、中位數或頻率最高的數據進行插補,但是精確度也較低。STEKHOVEN等[23]建立了隨機森林的迭代插補方法,并取得了很好的填充效果。隨機森林能有效處理混合類型數據填充,比單一類型填充方法更具有優勢。但本研究結果顯示,不同的填充方法對模型性能影響具有統計學差異(P<0.05)。在不填充數據時,得到的預警模型效果更佳,導致此結果的原因為:本研究中不填充方法與既往研究中不填充方法不同,這是一種最大限度地保留原始數據集進行分析的方法,所以得到的效果最佳。

表7 5個最佳的COPD患者氣流受限程度風險預警模型匯總Table 7 Summary of 5 best risk prediction models for airflow limitation in patients with COPD

本研究變量的特征篩選采用了不篩選、Lasso篩選、Boruta篩選。不同的篩選方法可減少特征數量、降維,降低學習的難度,提升模型的效率,增強模型泛化能力。本研究不同的特征篩選方法對模型性能存在影響。其中,不篩選是為了納入缺失值處理后的所有變量,了解模型預測效果。然而,若只選擇部分特征構建模型,可以大大減少學習算法的運行時間,也可以增加模型的可解釋性。Boruta篩選是選擇出所有與因變量具有相關性的特征集合,可以更全面的理解因變量的影響因素。Lasso篩選相比于普通最小二乘估計,可在眾多變量時快速有效地提取出重要變量來簡化模型。本研究假設檢驗單因素分析中,Lasso篩選在模型中表現較好,平均AUC為(0.719±0.094),但在5個最佳模型里Lasso篩選并未表現出較好的預測性能。集成學習、不填充、Boruta篩選模型優于集成學習、不填充、Lasso篩選模型。

本研究創新性之處:(1)國內尚未發現較成熟的COPD患者重度氣流受限風險預警模型,本研究所建立的機器學習模型為COPD患者疾病評估提供輔助決策依據。(2)迄今為止,許多關于機器學習方面的研究常使用某一種或幾種機器學習算法建立模型,并很少采用不同的數據預處理方式進行多樣化建模來比較模型預測性能。然而,本研究通過不同的數據清洗方法,采用多達216種算法,經十折交叉驗證,建立了2 160個模型。同時,本研究采用了先進的Bootstrapping算法通過重抽樣將小樣本數據轉化成大樣本數據,提高模型預測精度,保證模型的可靠度。(3)本研究評價了每一個預測變量對每一種模型性能的影響,與其他機器模型相比更加全面、更具說服力。(4)基于樣本量驗證的方法,探究樣本量與AUC之間的關系,為預測研究的樣本分析提供了參考。

本研究局限性:(1)本研究在預測因子方面,未納入實驗室和CT檢查數據,其相關性還有待進一步深入探究。(2)本研究為單中心研究,研究對象僅限于COPD住院患者,存在一定選擇偏倚,后續需進一步開展多中心、大樣本驗證。

4 結論

綜上所述,集成學習模型對COPD患者重度氣流受限風險的預警效果良好,mMRC等級、年齡、BMI、CAT評分、是否有吸煙史和呼吸困難是影響氣流受限的關鍵因素。無法進行肺功能測試者,借助重度氣流受限風險預警模型可有助于醫生評估患者的肺功能,在有效降低COPD患者未來風險和負擔方面發揮巨大潛能。

作者貢獻:周麗娟進行文章的構思與設計,撰寫論文;呂琴、蔣蓉進行研究的實施與可行性分析;周麗娟、呂琴、向超進行數據收集;周麗娟、吳行偉、周黃源進行數據整理、統計學處理;周麗娟、溫賢秀、蔣蓉、周黃源進行論文的修訂;溫賢秀負責文章的質量控制及審校,對文章整體負責,監督管理。

本文無利益沖突。

猜你喜歡
氣流重度預警
預警型智能包裝在食品安全中的應用和設計
暫時性(牙合)墊在重度磨耗患者中的作用與意義
超級秀場 大風預警
小水滴在風洞氣流中的跟隨性
宮斗劇重度中毒
比翼雙飛
驚魂未定
睡眠呼吸面罩
CT增強掃描重度碘過敏反應1例護理體會
預警個啥
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合