?

基于Logistic回歸與決策樹模型的老年多重慢病及影響因素分析*1

2024-03-14 11:12董海穎梁笑笑何燕
中國衛生事業管理 2024年2期
關鍵詞:婚姻狀況決策樹慢性病

董海穎, 梁笑笑, 何燕

(1.鄭州大學公共衛生學院社會醫學與衛生事業管理學系,河南 鄭州 450001;2.海南醫學院)

隨著老齡化程度的不斷加劇,平均壽命的不斷延長,老年人失能和共病成為全球醫療保健關注的重要問題,老年多重慢病現象日趨普遍[1]。世界衛生組織(WHO)將共病定義為同時具有多種長期且需要持續性、多樣化治療的健康問題[2]。多重慢病不僅使老年人的功能狀態和生活質量下降,還會使其失能、衰弱及死亡的風險明顯增加,給家庭、社會帶來沉重的經濟負擔[3]。由于老年多重慢病的影響因素較多,Logistic回歸分析模型和決策樹模型共同運用可以優勢互補,提高分析效能[4]。雖然決策樹現被廣泛應用于衛生醫療領域[5-7],但尚缺乏在老年多重慢病影響因素的研究。本研究通過描述老年多重慢病的一般情況,通過Logistic回歸及決策樹模型探討老年多重慢病的影響因素,以期為我國多重慢病的管理和防控提供依據。

1 對象與方法

1.1 研究對象

本研究于2021年9月至11月,在青島,廣州,蘇州三個地區采用多階段分層隨機抽樣方法選取社區老年人為研究對象。首先,在每個城市轄區內隨機抽取一個縣/區。青島市選擇即墨區,蘇州選擇昆山市,廣州選擇越秀區。其次從每個縣/區中隨機選擇兩個街道,每個街道隨機抽取4個社區。納入標準:(1)年齡≥60歲;(2)意識清晰、能正常溝通交流;(3)自愿參與本次調查,并簽署知情同意書。排除標準:(1)嚴重認知障礙者;(2)嚴重記憶障礙者;(3)刪除關鍵變量缺失問卷。本研究通過鄭州大學生命科學倫理委員會的審查(審查批準號:ZZUIRB2022-07)并獲得研究對象的知情同意。

1.2 方法

本研究采用自制的一般資料調查表,內容主要包括性別、年齡、婚姻狀況、文化程度、醫療保險、子女數量、月均收入、吸煙、飲酒、睡眠時間,慢病情況(是否患有慢性病兩種及兩種以上)等。根據既往研究結果[8-9]選取在老年人中常見的且老年人對其認知度較高的慢性病,將高血壓、糖尿病、冠心病、腦卒中、哮喘、慢性支氣管炎等27種慢性病納入調查。通過調查對象對“您是否患有以下疾病或有以下疾病史(經醫生診斷或有過發病的情況)”這一問題的回答,判斷老年人的慢性病及慢性共病的患病情況。采用一對一詢問的方法收集數據,調查前統一對調查員進行培訓。

1.3 統計學方法

采用EpiData 3.1 進行數據的雙錄入,使用SPSS 21.0進行數據分析。計數資料以頻數(百分比)表示,用χ2檢驗,將單因素分析中具有統計學意義的變量納入Logistic回歸和決策樹模型中,構建老年慢病影響因素的預測模型。Logistic回歸及決策樹模型預測效果通過構建受試者工作特征曲線(ROC曲線)進行比較,計算兩種模型的ROC曲線下面積(AUC),判斷兩種統計模型分析預測效果。以P<0.05為差異有統計學意義。

2 結果

2.1 基本情況

本次共調查1273名老年人,男性為565人,占比44.4%,多重慢病患病率為21.7%;女性為708人,占比55.6%,多重慢病患病率為31.2%。以老年人是否患多重慢病作為因變量,將性別、年齡、婚姻狀況、文化程度、醫療保險、子女數量、月均收入、吸煙、飲酒、睡眠時間為自變量進行χ2檢驗,結果顯示性別、年齡、婚姻狀況、醫療保險、子女數量、吸煙具有統計學意義(P<0.05)。見表1。

表1 多重慢病老年人的單因素分析

2.2 二分類Logistic回歸分析

以是否患有多重慢病作為因變量,將性別、年齡、婚姻狀況、醫療保險、子女數量、吸煙作為自變量進行Logistic回歸分析。共線性診斷顯示各變量方差膨脹因子在1.013~1.246,容忍度在0.803~0.987,表明各變量間不存在多重共線性。結果顯示年齡、婚姻狀況、醫療保險、吸煙為多重慢病的影響因素。見表2。

表2 多重慢病老年人的二分類Logistic回歸

2.3 基于CHAID算法的決策樹分析

以是否患有多重慢病作為因變量,將性別、年齡、婚姻狀況、醫療保險、子女數量、吸煙作為自變量納入決策樹模型,決策樹生長層數為3層,父節點最小樣本量為100,子節點最小樣本量為50。結果顯示對老年多重慢病有影響的變量主要是醫療保險、吸煙、年齡、婚姻狀況。位于樹第一層為是否有醫療保險,說明多重慢病老年人與是否有醫療保險的關聯性最強。有醫療保險的老年人中,與多重慢病關系最密切的是年齡,年齡越大患病風險越高,60~70歲老年人的婚姻狀況也影響其多重慢病情況。沒有醫療保險的老年人中,吸煙可能會導致老年人多重慢病患病率的增加。見圖1。

圖1 慢性共病老年人的CHAID決策樹分析

2.4 兩種模型分析結果比較

兩種模型的分析結果顯示,年齡、婚姻狀況、醫療保險、吸煙均為老年多重慢病的影響因素,Logistic回歸模型的靈敏度為74.3%,特異度為55.3%,約登指數為29.6%,ROC曲線下面積為0.700(95%CI 0.728-0.671)。決策樹模型的靈敏度為57.2%,特異度為73.3%,約登指數為30.5%,ROC曲線下面積為0.653(95%CI 0.683-0.623)。兩模型曲線下面積均接近0.7,表明兩個模型的分類預測效果有實際意義,并且模型分類均具有一定的準確性。綜合來看,兩種模型分類效果雖然接近,但決策樹模型的特異度較Logistic回歸模型高,但靈敏度相對較低,將二者結合,更有利于分析老年多重慢病的影響因素。具體見表3、圖2。

圖2 Logistic回歸模型和決策樹模型的ROC曲線

表3 Logistic回歸模型和決策樹模型的分類效果比較

3 討論

3.1 社會人口學因素對老年多重慢病的影響

多項研究表明,老年人群是慢性疾病的主要患病群體,老年多重慢病與高死亡率、機體功能下降、生活質量下降有密切的相關性[10]。多重慢病不僅損害個人的整體健康,對家庭、衛生系統和社會也造成嚴重的經濟負擔[11]。

不同年齡段的老年人發病情況存在差異,年齡越大器官老化程度越深,免疫能力和機體的抵抗力則逐漸下降,所以多重慢病的患病風險隨著年齡的增長而增加,這與馬建、劉帥帥的研究一致[12-13]?;橐鰻顩r[14]也是影響慢性病的重要因素,60~70歲的已婚老年人可能身心壓力較大,容易加重或引發慢性病。有研究發現,煙草會導致多種疾病的發生,在當今社會經濟和環境的多重壓力下,人們常常通過吸煙等方式緩解壓力,但容易引發慢性病,患共病后吸煙也是造成期望壽命減少的最重要的原因[15]。王維華等[16]的研究也顯示吸煙者比非吸煙者總體慢性病患病率高,患病風險也大幅度增加。建議開展慢性病健康教育,鼓勵老年人樹立科學就醫的觀念,增強自我保健意識,做好老年人健康管理工作;加大基層衛生資源投入,根據慢性共病的特點進行重點防控,做好慢性病檢測和規范化管理。

3.2 醫療保險對于老年多重慢病的影響

本研究顯示,不論采用決策樹模型還是Logistic回歸模型,醫療保險都是老年多重慢病的主要影響因素[17],慢性病病程較長,醫療費用高,對于沒有醫療保險的自費的老年慢病患者來說,日常用藥及治療會加重其經濟負擔[18],降低生活水平和幸福感,增加慢性病的發病風險。政府應繼續推進醫保改革,加大醫保報銷力度;醫務人員應綜合考慮患者病情及家庭經濟承受能力,盡可能處方經濟、有效的藥物;提升對老年多重慢病患者的醫療支持力度,減輕經濟負擔。

3.3 老年多重慢病的Logistic回歸模型和CHAID決策樹模型比較

目前,對于老年多重慢病影響因素的研究多采用Logistic回歸分析,該方法旨在表現某變量的主效應,Logistic回歸模型反映了年齡是老年多重慢病的保護因素,婚姻狀況、醫療保險、吸煙是老年多重慢病的危險因素。但該方法在處理變量共線性及潛在交互作用方面存在一定局限性[19]。而基于CHAID算法的分類決策樹模型不受變量間共線性的影響,在提取自變量時變量間相互獨立,影響因素潛在的交互作用能被很好的體驗出來[20]。本研究中的決策樹模型分析顯示,醫療保險在第一層,表明有無醫療保險與老年多重慢病的相關性最高,第二層則顯示變量間交互關系,吸煙和年齡是老年多重慢病的主要因素。兩種模型的ROC曲線比較可以看出二者分類預測效果相差不大,但兩種模型各有優劣,將兩者結合,構建的分類預測模型將具有較高的靈敏度和特異度。

本研究顯示醫療保險、婚姻狀況、年齡、吸煙是老年多重慢病的影響因素,兩種模型在不同領域應用廣泛,各有優缺點,可以通過聯合建模的方法彌補缺陷。因此,在今后的研究中,可以將兩種模型結合使用分析老年多重慢病的影響因素,加大資源和政策投入,提供科學且針對性管理方案,滿足患者健康需求,提高老年人生活質量。

猜你喜歡
婚姻狀況決策樹慢性病
肥胖是種慢性病,得治!
健康體檢常見慢性病及指標異常流行病學分析
一種針對不均衡數據集的SVM決策樹算法
決策樹和隨機森林方法在管理決策中的應用
居民慢性病患病率十年增一倍
從《日耳曼尼亞志》看日耳曼人的婚姻狀況
韓男性對婚姻狀況更滿意
逆轉慢性病每個人都可能是潛在的慢性病候選人!
基于決策樹的出租車乘客出行目的識別
農牧區哈薩克族老年人生命質量與社會支持和家庭婚姻狀況關系的調查研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合