?

運用3種統計學方法構建的頑固性產后尿潴留的風險預測模型的分析比較*

2022-10-21 04:28鄧連方黃秋杰
廣西醫科大學學報 2022年9期
關鍵詞:頑固性線圖決策樹

鄧連方,梁 潔,盧 丹,黃秋杰,何 水

(欽州市第一人民醫院產科,欽州 535000)

陰道分娩產后尿潴留(PUR)是產科常見并發癥,發生率為1.5%~47%[1],部分產婦會因癥狀漸性加重而發展為頑固性PUR,威脅產婦生命健康。早期識別和準確預測產婦產后PUR 風險對臨床采取針對性預防措施具有重要的意義。然而,目前臨床多采用Logistic 回歸模型分析發生PUR 的影響因素[2],其雖有訓練速度快、簡單易懂等特點,但無法直接呈現各因素對結果變量的重要程度。列線圖是整合多個相關因素預測某事件發生概率的模型圖,具有直觀、可視化特點,在醫學領域常用于疾病影響因素的風險預測;數據挖掘技術是一種較為新興的統計學方式,如決策樹、隨機森林等均被證明可用于預測疾病發生[3-4]。目前這3種預測模型在頑固性PUR 的應用報道較少,且缺乏關于這3 種統計學方法預測頑固性PUR 的分析研究。本研究旨在對比列線圖、決策樹及隨機森林模型對頑固性PUR的預測效能。

1 對象與方法

1.1 研究對象 回顧性分析2020 年1 月至2021 年12月在欽州市第一人民醫院經陰道分娩的380例產婦的臨床資料。納入標準:(1)初產婦、足月、單胎;(2)頭位妊娠,經陰道自然分娩;(3)產后6~8 h 內出現尿潴留,產后2 d 后有尿但無法自行排出。排除標準:(1)產前合并泌尿系統感染疾病者;(2)產前合并妊娠期高血壓、糖尿病、甲亢者;(3)其它原因引發尿潴留(如產婦膀胱腫物、受外傷等)者;(4)嚴重精神系統疾病者;(5)合并嚴重肝、腎功能異常者。

PUR判斷標準[5]:陰道分娩后6 h內無法自行排尿,或在自行排尿后經超聲測定膀胱內殘余尿量>150 mL;頑固性PUR 是產后2 d 有尿但不能自行排出,需借助其他手段進行排尿。根據產后有無頑固性PUR分為頑固性PUR組和對照組。

1.2 資料收集 收集產婦的臨床資料,包括年齡、孕周、分娩前體質量、妊娠糖尿病、妊娠高血壓、總產程時間、第一產程時間、第二產程時間、人工破膜、分娩鎮痛時間、產鉗助產、會陰側切伴裂傷及巨大兒(新生兒出生1 h內體重超過4 kg)等[6]。

1.3 數據預處理 列線圖和決策樹按照機器學習設置,將產婦按7:3的比例分為訓練集(266例)和測試集(114例);隨機森林按照隨機樣本的分割節點,按照機器學習設置,將患者分為訓練集為2/3(254例)與測試集為1/3(126例)。

1.4 列線圖模型 在訓練集數據上,采用R Studio軟件中的lrm函數建立初始Logistic回歸模型,基于已識別的相關因素,將顯著性P<0.05 的變量構建列線圖模型。

1.5 決策樹模型 本研究使用R 語言中的rpart 函數構建決策樹模型,“因變量”為發生頑固性PUR,“自變量”為具統計學意義的特征變量,指定最小代價復雜度剪枝中的復雜度參數CP 設置為0.012 5,并運算生成決策樹分析模型。

1.6 隨機森林模型 在Rstudio 軟件中,采用randomforest 程序包對隨機森林分類識別并構建模型。randomforest 函數在進行模型構建過程中主要包含2個模型參數,分別是ntree和mtry。ntree參數設置為500,即隨機森林中默認存在500 顆樹,mtry默認設置為在每次拆分時隨機抽樣候選的變量數。根據上述參數,構建隨機森林初始模型。

1.7 統計學方法 采用SPSS 23.0統計軟件分析數據,計量資料以均數±標準差()表示,兩組間比較采用t檢驗;計數資料以百分率(%)表示,率的比較采用χ2檢驗。將單因素分析中差異具有統計學意義的變量作為輸入變量,將是否發生頑固性PUR作為結局變量,在訓練集中分別建立列線圖、決策樹模型及隨機森林模型,通過計算預測模型的準確度、靈敏度、特異度、召回率、精確度及受試者工作特征(ROC)曲線下面積(AUC)評價3種統計學模型的預測效能。以P<0.05為差異有統計學意義。

2 結果

2.1 3 組臨床資料比較 380 例陰道分娩產婦中,180 例發生頑固性PUR(頑固性PUR 組),發生率47.37%,未發生頑固性PUR 200 例(52.63%),作為對照組。單因素分析顯示,頑固性產后PUR與總產程時間、第一產程時間、第二產程時間、分娩鎮痛、產鉗助產、會陰側切伴裂傷及巨大兒有關(P<0.05),見表1。

表1 影響頑固性PUR的單因素分析結果

2.2 陰道分娩產婦發生頑固性PUR 的3 種風險預測模型的構建 以產婦是否發生頑固性PUR(是=1、否=0)作為因變量,將單因素分析中差異有統計學意義的變量分別納入列線圖、決策樹和隨機森林模型。對分類資料進行賦值[產鉗助產(是=1、否=0),會陰側切伴裂傷(是=1、否=0),巨大兒(是=1、否=0)],連續變量:產程時間、第一產程時間、第二產程時間、分娩鎮痛時間,以實際值錄入。

2.3 列線圖模型 基于多因素Logistic回歸分析中篩選出的危險變量,用70%樣本量構建產婦發生頑固性PUR 的列線圖預測模型,見圖1。預測模型的臨床應用示例:1 位陰道分娩產婦,總產程時間為13.5 h(32 分),第一產程時間560 min(86 分),第二產程80 min(50 分),分娩鎮痛使用時間350 min(30分),有使用產鉗助產(22 分),有會陰側切伴裂傷(28分),巨大兒(16分),總分264分,對應發生頑固性PUR風險為72%。

圖1 陰道分娩產婦發生頑固性PUR風險的列線圖預測模型

2.4 決策樹模型 模型結果顯示,第二產程時間≥77 min的頑固性PUR發生率為30%,分娩鎮痛時間≥327 min、第一產程時間≥526 min的頑固性PUR發生率為25%,第一產程時間≥568 min的頑固性PUR發生率為3%,總產程時間≥14 h的頑固性PUR發生率為6%,巨大兒的頑固性PUR發生率為11%,見圖2。

圖2 陰道分娩產婦發生頑固性PUR風險的決策樹預測模型

2.5 隨機森林模型 根據構建的最佳模型總體預測準確度變化,影響產婦發生頑固性PUR的變量排序分別是第二產程時間、第一產程時間、總產程時間、分娩鎮痛時間、會陰側切伴裂傷、巨大兒、產鉗助產,見圖3。

圖3 陰道分娩產婦發生頑固性PUR 風險的隨機森林預測模型:輸入變量重要性測度

2.6 3種模型性能比較 使用驗證集對3種模型進行效能驗證,結果顯示,列線圖模型在實際患者識別發生頑固性PUR 效能方面優于決策樹和隨機森林模型,列線圖模型的準確度為0.833,靈敏度為0.933,特異度為0.759,召回率為0.900,精確率為0.806,AUC為0.902,均高于決策樹模型和隨機森林模型,見表2。

表2 列線圖、決策樹與隨機森林模型預測效能比較

3 討論

隨著臨床醫學研究信息不斷膨脹,數據呈現多樣化發展,傳統的數據分析方法和工具難以滿足當前臨床需求,對于繁雜、大規模的醫學數據信息,機器學習算法更具優勢。本研究利用本院醫院信息系統病歷數據,分別構建列線圖、決策樹和隨機森林用于預測陰道分娩產婦發生頑固性PUR 風險識別模型,在一定精準度上選擇最優的預測模型,以更好地服務臨床。

陰道分娩過程中,若產程時間過長,胎兒對陰道造成的壓迫時間也有所增加,致使盆底肌肉和神經在不斷拉伸下損傷,逼尿肌未能正常舒張、收縮而發生PUR[7]。隨著總產程時間的推移,陰道分娩產婦發生頑固性PUR 的風險顯著增加[8];而第一產程時間的延長會使陰道持續受壓,對膀胱和尿道造成持續性壓迫,產婦盆骨神經功能被抑制而增加了頑固性PUR 的發生風險[9]。第二產程時間超過1 h也是引發PUR 的危險因素,會時膀胱、尿道黏膜及尿道口充血、水腫,最終致使產婦頑固性PUR 發生。分娩鎮痛雖然能夠有效減輕產婦分娩過程中的疼痛感、提高分娩質量,但該法會延遲神經組織和盆底局部組織受到壓迫的時間,致使產婦排尿信號受影響[10],而鎮痛劑量的加大會導致分娩鎮痛時間和排尿傳導信號的影響時間延長,影響正常排尿,導致頑固性PUR 發生[11]。既往研究證實,會陰側切和會陰裂傷與PUR發生呈正相關關系[12-13]。本研究結果顯示,會陰側切伴裂傷程度越重,頑固性PUR 風險越高。會陰側切伴裂傷引起的疼痛和水腫程度也影響反射性尿道痙攣,并間接反映了陰道分娩的困難程度。Polat等[14]研究表明,產鉗助產過程中可能會損傷盆腔神經、肛門括約肌等,延長膀胱受刺激時間,造成產婦自主排尿反射障礙。產鉗助產具侵入性,會致使生殖道機械性阻塞、膀胱創傷而引起頑固性PUR[15]。巨大兒可能會延長產程時間、提高會陰側切及產鉗助產率,巨大兒對于膀胱以及盆腔神經的壓迫更劇烈,產婦產后發生嚴重的組織水腫而導致排尿困難或無法自主排尿[16],本研究提示巨大兒是發生頑固性PUR的獨立危險因素。

隨著計算機軟件和人工智能的發展,機器學習已成為醫學界研究的新方向,能夠從大樣本數據集中篩選出更有效數據,并做出準確預測或決策,為患者帶來更為準確和個性化的診療。研究顯示,采用機器學習算法預測模型預測鋼鐵工人頸動脈粥樣硬化發生情況[17]。通過機器學習可預測軟骨肉瘤患者的肺轉移風險[18]。本研究將差異有統計學意義的7 項指標分別納入列線圖、決策樹和隨機森林算法并建立預測模型,經驗證,列線圖模型在實際患者識別發生頑固性PUR 效能方面優于決策樹和隨機森林模型,列線圖模型的準確度、靈敏度、特異度、精確率和AUC均高于決策樹模型和隨機森林模型。此外,在測試集中發現,隨機森林模型的預測性能均低于訓練集,說明隨機森林模型存在過擬合現象,也可能是訓練集數據不足而出現泛化效果較差??梢?,列線圖模型的預測效果更為理想,其診斷價值均優于決策樹模型與隨機森林模型,且列線圖可將Logistic回歸或Cox回歸可視化,臨床醫師可以簡單、便捷的估算出產婦發生頑固性PUR 的風險。

本研究局限性在于:本研究為單中心回顧性研究,受時間及樣本量限制,可能存在一定的偏倚;本研究沒有分析更多的頑固性PUR 發生風險特征與危險因素。在未來的研究中將使用更大、更全面的樣本集,并采用多中心研究對本研究中的模型進行改進與驗證,以進一步構建更為完善的預測模型。

綜上所述,列線圖模型在陰道分娩產婦發生頑固性PUR中具有較好的預測效果和穩定性,其預測效能優于決策樹預測模型和隨機森林模型,具有較好的臨床應用價值。

猜你喜歡
頑固性線圖決策樹
纈沙坦聯合氨氯地平片在老年頑固性高血壓病人中的臨床應用
一些圖運算的調和指標與調和多項式的線圖?
預測瘢痕子宮陰道試產失敗的風險列線圖模型建立
簡述一種基于C4.5的隨機決策樹集成分類算法設計
決策樹學習的剪枝方法
一類圖及其線圖的Wiener指數
決策樹在施工項目管理中的應用
針刺配合穴位埋線治療頑固性面癱63例
菖遠安眠湯治療頑固性失眠60例
旋降湯治療頑固性梅核氣27例
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合