?

聚類算法及其在護理管理中的應用研究

2018-05-15 02:19降惠
軟件工程 2018年3期
關鍵詞:聚類算法層次護理管理

降惠

摘 要:在傳統的醫療過程中,醫護人員隨機分配,患者被動接受治療的護理管理模式不僅會浪費有限的醫療資源,使患者承受較高醫療費用,有時還會延誤最佳治療時機,引發并發癥,給患者和其家庭帶來更多的痛苦和困擾。文章通過將幾種常見的聚類算法在護理管理中的應用進行比較,最終選擇了先驗假設較少的層次聚類算法,基于R語言探討了層次聚類算法分類護理患者的實現過程,說明了層次聚類算法在患者與護理資源的最優匹配中的應用方法,為醫院開展科學護理管理提供一定的參考依據。

關鍵詞:聚類算法;護理管理;層次

中圖分類號:TP399 文獻標識碼:A

Abstract:In the process of traditional healthcare,health care providers are randomly assigned and patients are passive to accept various treatments.Besides the high expense of medical treatment and the waste of limited medical resources,it would delay the best treatment time and cause complications,bringing great suffering to patients and their families.By comparing clustering algorithms,this paper chooses the hierarchical clustering algorithm with fewer priori assumptions.Based on R Language,this paper elaborates on the implementation process of hierarchical clustering algorithm in clustering patients,and the methods of using hierarchical algorithm to optimally match the patients and nursing resources,thus providing certain reference and basis to the scientific nursing management.

Keywords:clustering algorithm;nursing management;hierarchical

1 引言(Introduction)

護理管理是醫療機構以改善和提高醫療水平,合理利用醫療設備,最大程度發揮醫護人員護理能力為目標的過程。然而,在傳統的醫療護理管理過程中,醫護人員隨機分配,患者被動接受治療方案,不僅會浪費醫療資源,使患者承受較高醫療費用,有時還會延誤治療,引發并發癥,給患者和其家庭帶來更多痛苦和困擾。隨著信息化“智慧醫療”時代的到來,醫院信息系統的普及,醫療數據采集、整理、分析不再受到傳統人工操作在時間、效率、成本和療效等方面的制約,取而代之的是高效、便捷、智能、科學的大數據分析處理過程?!盎ヂ摼W+醫療護理”的模式已悄然走近我們身邊。許多學者開始嘗試通過計算機算法精準識別患者、最優分配護理醫生、優化患者轉診流程等方式來提高護理效果和降低醫療費用。在識別患者和分配醫生時,為了更好地進行分類識別,聚類算法受到了廣泛關注。

2 聚類算法(Clustering algorithm)

聚類就是按照“物以類聚”的思想,將抽象數據集劃分成若干簇的過程,其中在每一簇中數據間具有高度的相似性[1,2]。聚類分析是當前數據挖掘中的重要手段。迄今,研究者已提出了多種聚類算法[3]。常用的聚類算法有基于劃分、密度、網格、模型和層次的方法等[4]。

2.1 基于劃分的聚類方法

基于劃分的聚類方法需要提前設定聚類的數目,如K均值法和K中心點法等。這類方法分析時需要首先在數據集中隨機選擇聚類數目的對象,每個對象作為該聚類的中心或平均值,通過距離遠近等方法將其余對象逐步聚類到每個類中?;趧澐值木垲惙治鼋Y果與初始值關系非常密切,不同的初始值往往會導致不同的聚類結果,通常會呈現出局部最優解?;谶@種情況,基于劃分的聚類方法在實際應用中往往要求窮舉所有可能的劃分。

2.2 基于密度的聚類方法

基于密度的聚類分析依據數據是否屬于相連的密度域將數據對象進行歸類。常用的基于密度的聚類算法為DBSCAN。這種聚類方法可以剔除噪聲點,同時可以發現任意形狀的聚類而不局限于球狀的類[5]。但DBSCAN必須指定鄰域半徑和最少點數這兩個參數,同時聚類的結果對這兩個參數的依賴性很強。

2.3 基于網格的聚類方法

基于網格的聚類方法將空間分成有限數目的多維網格,利用網格結構實現聚類。如CLIQUE算法和STING算法。CLIQUE算法主要適用于處理高維數據,同時它綜合了密度算法,可以發現其中的密集聚類。STING算法是一種將空間劃分成直方形網格單元,不同方形對應不同分辨率,以實現聚類分析的方法[6]。

2.4 基于模型的聚類算法

基于模型的聚類算法是通過尋找數據對每個類預先設置好的模型的最佳擬合而實現的。最典型的基于模型的聚類算法是COBWEB算法。COBWEB算法不需要用戶提供參數,可以自動劃分簇的數目[7]。

2.5 基于層次的聚類算法

基于層次的聚類算法對數據集按照凝聚或分裂的層次方式進行聚類。凝聚型將每個對象看作一個單獨的類,然后通過合并相近的類實現聚類。分裂型將所有數據歸到一個類中,然后通過迭代,分層分裂成小類。常見的基于層次的聚類算法有CURE、ROCK和Chamelemon。Chamelemon算法在合并類的過程中,可以綜合考慮類的內在特征、近似度和互連性,可以構造任意大小的聚集簇[8]。

2.6 幾種聚類算法比較分析

基于模型的聚類算法要求對象在每個屬性具有獨立的概率分布,但在實際生活中,這種假設是不存在的?;诰W格的聚類算法需要選擇合適大小的單元數目,基于密度的聚類算法和基于劃分的聚類算法需要用戶設置一定的參數來產生可接受的聚類結果。在基于層次的聚類算法中,執行合并或分裂后無法回退修正,其質量受到一定的影響,但由于層次聚類算法無需提前知道最終所需的集群數量,其先驗假設較少,因此通用性很強。目前,層次聚類算法已廣泛應用于各個領域。

3 護理管理中聚類算法的應用研究(The application of clustering algorithm in Nursing management)

3.1 算法選擇

在護理管理中,聚類可以幫助科研人員從醫院信息管理系統中區分患者,聚類分析作為數據挖掘的重要分析方法,可以發現每類患者更深層次的信息,歸納總結出每類患者的個體特征和臨床檢驗特征,有針對性的為患者提供精準治療,減輕患者心理和財力方面的負擔,縮短就醫療程,提高患者的生活質量。根據患者個體參數合理聚類患者往往不同于其他領域聚類分析。首先,患者的個體特征屬性并不滿足獨立的概率分布?;颊吣稠椫笜说钠x往往依賴于其他體征。其次,護理管理初期通過設置一定的參數來產生可接受的聚類結果,需要具備豐富的醫學經驗和較高的計算機理論水平,實際應用中難度很大。再者,患者病情差異較大,選擇合適大小的單元數目可操作性較低。綜合分析幾種聚類算法,層次聚類算法需要的先驗假設更少,對患者的聚類集群更科學,更適合當前大數據背景下醫院開展科學、高效的護理管理,因此本文基于凝聚型層次聚類算法探討聚類算法在護理管理中的應用。

3.2 數據預處理

護理管理中我們收到的患者數據往往具有異構性、冗余性、復雜性等特征,在對數據進行分析時首先需要進行集成、清理和歸約[9]。

數據集成:患者個體數據來源主要有幾個方面:(1)醫學檢驗中心;(2)體檢中心;(3)急診科室;(4)門診科室;(5)住院科室;(6)醫學影像診斷中心;(7)社區衛生服務中心;(8)縣級醫院;(9)??漆t院。不同的醫療機構對數據的存儲格式、方法和實體的命名規則不同,在數據集成過程中需要考慮統一實體、刪除冗余數據、處理沖突數據等。集成過程中可以考慮可視化分析和相關性分析等方法實現。

數據清理:由于醫療數據的特殊性,臨床檢驗數據獲取時間較長,人工填補缺失值困難大,而替代鄰近值處理噪聲數據又可能導致分析結果的不準確性,因此清理數據主要通過識別異常值并刪除相應元組的方法實現。

數據歸約:隨著大數據時代的到來,可獲得的患者個體數據越來越多,對患者屬性進行歸約處理可以有效地降低分析的時間復雜度,提高分析質量。因此,在分析過程中可以通過屬性約簡等方法歸約處理數據。

3.3 基于R語言的層次聚類算法及其在護理管理中的應用

在數據預處理的基礎上,將每個患者視為一類,利用歐幾里得距離、曼哈頓距離、切比雪夫距離等方法計算出每類之間的相似度。接著,將相似度最高的合并為一個類,重復計算,直至相似度大于某個終止條件值時結束聚類。簡言之,層次聚類算法是通過計算每個類中的數據點與所有數據點之間的距離來確定其相似性,距離越小,相似度越高[10]。在R語言中,具體實現步驟如下:

(1)計算距離矩陣:利用dist()函數計算患者間的距離矩陣。

d<-dist(x,method=”euclidean”)

其中,x為患者數據集,method表示計算距離的方法,常用的方法有euclidean、manhattan、maximum等。方法的選擇可根據患者具體數據而不同。

(2)聚類分析:在距離矩陣的基礎上,使用hclust( )函數合并聚類簇。

hc<-hclust(d,method=“ward.D2”)

其中,d為患者數據的距離矩陣,method表示合并的方法,常用的方法有complete、ward、median、average、centroid等。

(3)剪枝操作:在數據分析中,患者數據的層次聚類結果有時很復雜,cutree()函數可以實現對聚類結果的剪枝操作,分析時可綜合層次聚類結果和醫生數選擇合適的聚類數。

clusterCut<-cutree(hc,k)

其中,k為層次聚類結果的指定聚類數。最佳聚類數的選擇是層次聚類剪枝中最復雜的一個問題,可以使用mclust、Nbclust、factoextra等包計算出最優聚類數。

4 護理管理分析(The analysis of Nursing

management)

在實際護理管理中,廣義上講護理管理人員涵蓋的范圍不僅包括醫院護士、家庭護理人員[11],還包括專家和醫生。傳統的護理管理中,專家、住院醫生、護士隨機分配和組合,往往會產生不同的治療效果和醫療費用。為了改善這一現狀,部分學者開始探討優化護理流程、改善護理模式來提高護理質量。但這些方法雖然在某種程度上改善了護理質量,但護理方法的針對性較差。因此,在護理管理分析中,可以考慮事先仿真不同醫生對每位患者的治療效果。使用聚類分析方法,將患者進行科學分類,綜合聚類結果、患者最終的治愈情況和醫療費用,發現每類患者的最佳護理者,從而為醫院開展科學護理管理提供一定的參考依據。

5 結論(Conclusion)

隨著“互聯網+醫療護理”的發展,信息化技術在醫學中的運用一定會越來越普及,越來越智能。我們探討基于R語言的層次聚類算法在護理中的應用,就是要充分發揮層次聚類算法的先驗假設較少的優點,可以直接對患者進行科學分類,達到患者與護理資源的最優匹配,既有效提高臨床護理效率和效果,又能節省有限的醫療人力、物力、財力,最終達到醫患關系的和諧融洽,相信隨著互聯網時代的到來,人工智能、計算機算法必將滲透到醫療護理的每一個環節,深入學習探討各種算法在臨床護理實際中的運用,將具有較大的科研和現實意義。

參考文獻(References)

[1] 王有為,吳迪.聚類技術在醫學數據中的應用[J].河南教育學院學報(自然科學版),2016,2:32-35.

[2] 李雪梅,張素琴.數據挖掘中聚類分析技術的應用[J].武漢大學學報,2009,42(3):396-399.

[3] 陳黎飛,姜青山,王聲瑞.基于層次劃分的最佳聚類數確定方法[J].軟件學報,2008,19(1):62-72.

[4] Jiawei Han,MichelineKamber.范明,孟小峰,譯.數據挖掘概念與技術[M].北京:機械工業出版社,2004:1-262.

[5] 楊海斌.一種新的層次聚類算法的研究與應用[D].蘭州:西北師范大學,2011:8.

[6] 張鑫.層次聚類算法的研究與應用[D].贛州:江西理工大學,2008:19.

[7] 段明秀.層次聚類算法的研究及應用[D].長沙:中南大學,2009:9.

[8] 畢鵬.改進的Chameleon層次聚類算法在目標分群中的應用研究[D].杭州:浙江大學,2009:17.

[9] 尤婷婷.健康大數據預處理技術及其應用[D].成都:電子科技大學,2017:6-16.

[10] 張良均,謝佳標,楊坦等.R語言與數據挖掘[M].北京:機械工業出版社,2017(8):204-206.

[11] Katie M.Dean,Laura A.Hatfield,et al.Preliminary Data on a Care Coordination Program for Home Care Recipients[J].The American Geriatrics Society,2016(64):1900-1903.

作者簡介:

降 惠(1983-),女,碩士,副教授.研究領域:醫學計算機應用,數據挖掘.

猜你喜歡
聚類算法層次護理管理
K—Means聚類算法在MapReduce框架下的實現
基于K?均值與AGNES聚類算法的校園網行為分析系統研究
數學作業多元評價促學生發展
淺談日本職業技術教育體系
層級護理管理模式在外科護理管理中應用管理的方法及效果
基于改進的K_means算法在圖像分割中的應用
大規模風電場集中接入對電力系統小干擾穩定的影響分析
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合