?

基于隨機森林的醫聯體雙向轉診智能決策研究與應用

2020-01-05 05:37周穎胡外光陳敏蓮胡珊珊

計算技術與自動化 2020年4期

關鍵詞：醫聯體隨機森林

周穎　胡外光　陳敏蓮　胡珊珊

摘? ?要：針對醫聯體平臺中實際雙向轉診過程存在轉診安排不及時，患者不滿意等問題，設計了一種基于隨機森林的雙向轉診智能決策方法。該方法選取影響轉診的5個主要因素，建立了包括床位數、床位使用率、疾病治愈率、治療費用、相距距離五大指標的智能轉診評分模型;然后利用大數據和隨機森林的方法對主要因素進行分析，以分數的形式來衡量待轉診醫院適合度。實踐效果表明，基于這5個主要因素的預測可以羅列出多種轉診方案，為轉診安排精準化決策提供一種依據，從而提高轉診效率。

關鍵詞：雙向轉診;智能決策;醫聯體;隨機森林

中圖分類號：TP399? ? ? ? ? ? ? ?文獻識別碼：A

Intelligent Decision-making for Two-way Referral of Medical

Alliance Based on Random Forest and its Application

ZHOU Ying ，HU Wai-guang，CHEN Min-lian，HU Shan-shan

（Data Information Management Center of Hunan Children's Hospital，Changsha，Hunan 410083，China）

Abstract：Aiming at the problems in the actual two-way referral process of medical alliance platform，such as untimely referral arrangement and unsatisfactory patients，a two-way referral intelligent decision method based on random forest was designed. In this method，five main factors affecting referral were selected and an intelligent referral scoring model was established，including the number of beds，bed utilization rate，disease cure rate，treatment cost and distance. Then，big data and random forest methods are used to analyze the main factors and measure the suitability of the hospital to be referred to in the form of scores. The practical results show that predictions based on these five main factors can list a variety of referral plans，provide a basis for accurate decision-making on referral arrangements，and improve the efficiency of referrals.

Key words：two-way referral;intelligent decision;medical alliance;random forest

在我國醫療體制改革進程中，雙向轉診是在社區首診基礎上建立的扶持社區醫療衛生，解決“看病難、看病貴”的一項重要舉措[1]，它可以有效地引導病人合理分流，促進衛生資源合理利用[2]。雙向轉診是根據病情需要而進行的上下級醫院間、?？漆t院間或綜合醫院與?？漆t院間的轉院診治的過程[3]。它有縱向轉診、橫向轉診兩種形式?？v向轉診即是上下級醫院之間的轉診。橫向轉診就是同級別綜合醫院之間，綜合醫院與?？漆t院之間的轉診[4]。主要討論縱向轉診，即上下級醫院間雙向轉診。而在實際轉診過程中存在轉診安排不及時等問題，導致患者不滿意。

某省兒童醫院牽頭成立兒科醫聯體，經過多年持續投入，目前該醫聯體輻射區域5省21市州，成員單位156家。已建立的這個比較完備的兒科醫聯體平臺，實現了對轉診病人診療全過程的信息化管理，逐步積累了以患者為核心的海量臨床診療數據?；谠搩嚎漆t聯體平臺海量數據，提取出5個轉診指標，利用大數據和隨機森林的方法對主要因素進行分析，當患者轉診時，為其提供若干個醫院進行轉診選擇，在充分尊重患者選擇權的前提下，引導和規范病人的就診。

1? ?智能決策模型

提出的雙向轉診智能決策模型是一種以分數的形式來衡量待轉診醫院適合度的技術手段。智能評分模塊算出所有待轉診醫院的綜合評分后，供醫生和病友雙向參考，真正做到最智能、最恰當的轉診，優化醫療資源配置，讓病友更加智能地享受醫療服務[5]。整個評分體系從病房床位數、床位使用率、疾病治愈率、治療費用、相距距離等5個維度按不同權重進行打分，具體如圖1所示。具體特征描述如下：

（1）床位數。按照2018年國家衛健委發文的綜合醫院建設標準，醫院病床數量分為6級，即200張床以下、200～399床、400～599床、600～899床、900～1199床、1200～1500床及以上6個級別。單個科室床位數參照按照上述醫院總床位數按50分、60分、70分、80分、90分、100分6個檔次進行打分，床位數評分占整個評分體系的10%。

（2）床位使用率。病床使用率是反映每天使用床位與實有床位的比率，即實際占用的總床日數與實際開放的總床日數之比，它能反映醫院病床的工作負荷情況。下節介紹通過隨機森林算法對待轉診醫院的床位使用率進行預測，床位使用率作為待轉診醫院未來時間點接待能力的重要體現，占整個評分體系的35%。

（3）疾病治愈率。按照治愈率=治愈出院人數/收容總數×100這個公式，通過加工醫院HIS系統現有數據獲得，治愈率75%以下得80分，治愈率75%-85%得90分，治愈率85%以上得100分，疾病治愈率占整個評分體系的30%。

（4）治療費用。治療費用是指待轉診患者轉到目標醫院后治愈疾病需要花費的費用。不同的疾病一般會有不同的費用區別，系統會按照疾病類別對治療成本進行打分?？紤]到治病第一的原則，本系統治療費用評分只占整個評分體系的10%。

（5）相距距離。相距距離是指待轉診醫院和目前就診醫院間點到點的距離，通過兩者的經緯度數據計算而得，單位為公里。系統按照計算結果將相距距離分為遠、中、近三個檔次，距離評分占整個評分體系的15%。

2? ?模型設計與實現

2.1? ?體系結構

設計的醫聯體雙向轉診智能決策系統具體如圖2所示，按功能可以分為以下幾個模塊：

（1）標準體系模塊：醫聯體信息平臺的首要任務是建立標準體系，統一訪問接口、交換接口、指標口徑等，從而打破各醫院的信息孤島，才能充分信息共享。

（2）醫聯體醫療數據資源庫模塊：標準體系建立后，需要建立醫聯體集中的醫療數據資源庫，用集中模式建立相關資源庫。建立大集中的數據中心，是實現智能決策的數據基礎。在具體和各醫院系統的對接過程中，可能需要對各醫療機構醫院信息系統進行改造，以適應醫聯體信息化的要求。

（3）智能決策引擎模塊：基于醫聯體醫療數據資源庫存儲的各醫院數據，按照智能決策模型中的床位數、床位使用率、疾病治愈率、治療費用、相距距離等5個指標進行數據加工得分，并按相關權重算出綜合得分。

（4）搜索展示界面模塊：作為該系統與使用人員交互的唯一渠道，向醫護人員和患者提供按病種、距離等因素，羅列所有待轉診醫院的得分情況。

2.2? ?基于隨機森林的床位使用率預測

作為一種新興高度靈活的機器學習算法[5]，隨機森林通過集成學習的思想將多棵決策樹進行集成，根據每顆cart樹是分類樹還是回歸樹，隨機森林可以分別應用在分類和回歸問題上，對輸入變量進行離散型和連續型的輸出預測[6]。隨機森林作為一種集成學習方法，通過產生多個分類樹來生成結果，即在特征的選取和數據的選取上進行隨機化，生成許多分類樹，再匯總分類樹的結果。隨機森林在復雜度沒有顯著提高的情況下，提高了預測精度，且對多元線性不敏感，因此對缺失數據和非平衡數據比較穩健[7]。

住院部病床使用率作為判定科室忙閑程度的重要指標，也是決定是否轉診的重要因素之一。通過對某省兒童醫院2013-2019年醫療統計指標進行分析，我們發現醫院住院部的單日床位使用率跟就診日期、科室類別、是否重點科室等因素相關。因此，我們利用隨機森林算法，對某省兒童醫院待轉診科室在將來某天的床位使用率進行預測，并將其作為轉診智能決策模型得分的重要組成部分。

整個預測過程大致包括數據收集預處理、特征提取、建模、預測等步驟。經過數據收集預處理，加工得到某省兒童醫院30個科室7年（2013-2019年）共76650條數據作為樣本集，并以每個樣本中的就診日期、科室類別、是否重點科室、開放床位數、每日門急診數等5列作為特征來搭建模型。在具體實現中，有放回地從訓樣本集中隨機抽取80%的樣本數據作為訓練集，并且隨機選擇部分特征，來訓練決策樹。按照上述步驟，當訓練出多棵決策樹后，便構成了整個隨機森林模型。同時，從樣本集中隨機抽取20%的樣本數據作為測試集，來對訓練模型進行測試，評價模型效果。對于最終的預測結果，隨機森林是非常民主的算法，它會對各個樹預測得到的床位使用率相加求得一個平均值為最終回歸結果。具體流程如圖3所示。

方法的關鍵步驟是通過python里的sklearn庫來實現隨機森林的建立和預測。主要的實現步驟包括讀取樣本集、確認預測特征變量和選擇要訓練的特征、創建模型和訓練、用測試集預測床位使用率和使用（RMSE）均方對數誤差做評價指標等五個步驟。床位使用率預測輸出如圖4所示。

3? ?系統應用效果

基于所提出的決策方法，開發了醫聯體雙向轉診智能決策系統。在兒科醫聯體平臺中填寫轉診單時，提供轉入醫院查詢的功能，根據轉出醫院、轉入科室、轉入時間、診斷字段進行搜索，搜索后的結果也一并顯示出來，頁面上展示了5家評分較高的、滿足條件的待轉診醫院，并按綜合評分高低進行排序，醫生和病友原則上應選擇評分較高醫院進行轉診。具體應用效果如圖5所示。

用戶點擊選中醫院的詳情鏈接，可以看到該醫院在病房床位數、床位使用率、疾病治愈率、治療費用、相距距離等5個指標的具體得分，對其中某項指標特別在意者，可按其進行抉擇，這樣極大地方便患者進行轉診選擇。

4? ?結? ?論

基于某兒童醫聯體醫療數據資源庫數據，通過隨機森林算法對醫院將來時間點的床位使用率進行預測，提出并建立包括床位數、床位使用率、疾病治愈率、治療費用、相距距離五大指標的智能轉診評分模型，為醫護人員和病患朋友選擇轉診醫院提供數據支撐，取得了良好效果。為了達到最佳效果，從選擇子數據集個數和最大特征個數等方面對隨機森林模型進行持續優化將作為后續的工作重點和研究方向。

參考文獻

[1]? ? 梁宗強，趙延紅，黃若文，等.基于慢病管理和雙向轉診的區域分級診療信息化建設實踐與探討[J]. 中國數字醫學，2017，12（6）：15-17.

[2]? ? 梁勇，張檸.國外醫療服務體系對完善我國分機診療體系的啟示與借鑒[J]. 中國醫院，2015，18（8）：50-52.

[3]? ? 高闊，甘筱青.我國患者雙向轉診行為決策及影響因素研究[J]. 中國全科醫學，2015，28（003）：3393-3395.

[4]? ? 吳涵梅，李躍平.雙向轉診制度現狀及經驗概述[J]. 中國衛生事業管理，2010，27（7）：441-442.

[5]? ? 王瑾.面向醫聯體的醫療資源優化配置與雙向轉診研究[D]. 合肥：合肥工業大學，2018.

[6]? ? 沈晶磊，虞慧群，范貴生等.基于隨機森林算法的推薦系統的設計與實現[J]. 計算機科學，2017，44（11）：165-167.

[7]? ? 吳帥，趙方.基于隨機森林的老年人居住偏好預測研究[J]. 計算機工程與科學，2018，40（5）：924-930.

猜你喜歡

醫聯體隨機森林

隨機森林在棉蚜蟲害等級預測中的應用

安徽農學通報(2017年1期)2017-02-15

基于二次隨機森林的不平衡數據分類算法

軟件(2016年7期)2017-02-07

拱壩變形監測預報的隨機森林模型及應用

南水北調與水利科技(2016年6期)2017-01-06

醫聯體—家庭簽約服務制家庭式慢病管理模式的應用效果分析

中國當代醫藥(2016年29期)2017-01-03

淺析分級診療體系建設對醫院經濟的影響

現代經濟信息(2016年27期)2016-12-16

區鎮一體化緊密型醫聯體運行效果分析

中國現代醫生(2016年23期)2016-11-15

基于隨機森林算法的飛機發動機故障診斷方法的研究

電腦知識與技術(2016年23期)2016-11-02

松散“醫聯體”困境

財經國家周刊(2016年1期)2016-01-18

基于隨機森林算法的B2B客戶分級系統的設計

現代電子技術(2015年15期)2015-08-14

基于多視角特征融合與隨機森林的蛋白質結晶預測

現代電子技術(2015年8期)2015-07-09

計算技術與自動化2020年4期

計算技術與自動化的其它文章: 基于粒子群優化算法的動力定位非線性觀測器設計; 模擬帶負荷測試（系統）裝置的研究與應用; 基于門控遞歸神經網絡的電網日峰值負荷預測; 10 kV無源電子式電流互感器的輸出特性研究及應用分析; SF6氣體的過熱分解特性隨溫度的發展趨勢研究; 一種電力負荷預測混合模型研究

91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合