?

醫院臨床數據分析智能分類處理技術研究

2018-03-08 09:05廖多楊
計算機測量與控制 2018年2期
關鍵詞:類別檢索準確率

廖多楊

(成都醫學院第一附屬醫院 信息管理部,成都 610500)

0 引言

現如今醫院的數據庫聚集了大量復雜的數據結構與多種信息,急需分類處理技術對臨床的數據進行處理[1-2]。但是傳統的分類處理技術缺乏結構化和規整化的分類特性,其分類處理的準確率也相對較低,存在速度慢、使用過程繁瑣、效率低等問題,不能滿足醫院對數據分類處理的需求[3-4]。文獻[5]中提出了一種基于VSM模型的數據分類處理技術,該技術能夠利用模型進行數據的統計,并在此基礎上對數據特征進行簡單明了的描述,進而進行分類處理。雖然該方法對數據處理的準確率較高,但是指定的過程比較困難、推廣性比較差,很難實現大規模的推廣應用;文獻[6]中提出了一種離散化的數據分類處理技術,該技術能夠提高算法的精準度,具有較強的伸縮性。雖然該方法能夠進行大規模的數據分類,但是進行數據存取與預處理的過程中效率較低;文獻[7]中提出了一種概念漂移的數據分類處理技術,該技術能夠將分類的誤差作為概念漂移的重要指標,其分類的模型可根據指標調整構建的大小,具有較大的靈活性。雖然該方法能夠方便的對誤差進行檢驗,但是降低了分類處理的泛化錯誤率。

針對上述的觀點,我提出了一種模糊分類處理技術對醫院臨床數據進行分析。首先對醫院臨床運營的各種數據指標進行了說明,根據指標分析了數據的特性;然后對臨床的數據使用了模糊的分類處理技術;最后進行了實驗。實驗結果證明,該技術的使用能夠改善傳統的分類的方法,提高數據分類的高效性與準確性,是對數據處理的重要技術手段,也是未來我國醫院大量數據分類處理必然的發展趨勢。

1 醫院臨床數據分析智能分類原理

1.1 臨床數據分析分類特性獲取

根據醫院業務的流程,建立臨床運營的指標數據,并分別從臨床的效率、臨床的負荷等方面對臨床的數據進行分析,如表1所示。

表1 臨床運營的數據指標

由表1可知:進行數據處理的時候應該根據最基本的原理來處理數據集Z={z1,z2,…zn},并按照相關的規則,將數據劃分到預定義的數據類別X={x1,x2,…,xm}中,具體處理流程如圖1所示。

圖1 醫院臨床數據分析智能分類處理流程

由圖1可知:對醫院臨床數據分析智能分類處理的過程中主要分為了兩個部分,分別是:訓練的階段、學習的階段。訓練的階段是需要大量的人工來標記醫院臨床數據,并使用聯機進行分析;學習的階段是對整個訓練的過程進行監督,需要對數據進行向量化[8],然后用向量的特征組來表示。

總體來說,醫院臨床數據分析智能分類處理的特點主要有以下幾點:

1)數據的分類需要先經過訓練再進行分析,因此對數據的樣本分類的質量具有影響,會產生較大的誤差。

2)分類模型的建立主要依據訓練的數據樣本而進行構建的,因此這種建立的模型是具有局限性,而在實際的數據樣本中,如果系統中沒有與之相關的具有反饋學習的功能,那么整個分類處理的性能都會大大地下降。

3)數據本身具有容量大、儲存復雜、屬性特征范圍廣、稀蔬性等特點,因此進行數據分類處理的時候僅僅依靠單一的處理模型,很難提高分類處理的準確性,必須采用不同的技術對數據的分類處理加以解決。

針對以上的特點,結合數據分類處理的特點,以及分析的高效性進行一些智能的處理,并從整個處理的過程中來優化分類的處理技術,從而完善醫院臨床數據分析智能分類的處理。

2 醫院臨床數據智能分類技術

對醫院臨床數據分析智能分類處理的過程中首先需要對數據進行檢索,然后將檢索出來的數據進行提取,根據數據的特點,使用模糊分類的技術對數據進行處理。

2.1 數據的模糊檢索與提取

進行數據檢索的時候需要對數據建模,根據醫院所處的工作環境以及對數據檢索的要求來滿足數據分類中的一些邏輯關系,并將檢索的數據分成兩個集合,分別是:匹配的集合和非匹配的集合。匹配的集合是指醫院臨床數據進行分類的時候,需要將數據進行匹配,再根據匹配的特征進行檢索;非匹配的集合是指醫院臨床數據進行分類的時候,需要將單個數據進行記錄,再根據記錄的單個數據特征進行檢索。這種匹配和非匹配的集合只能判斷出進行檢索的數據中是否與查詢有關。建立模型的優勢能夠使檢索的過程變得簡單,使檢索的速度加快。但是由于在匹配的過程中會出現二值的特性[9],因此無法對查詢的結果進行相關程序的排序,也就無法區分數據的特征對檢索過程是否重要進行權衡。在模型中,假設數據表示為A=(a1,a2,…,an),而用戶的檢索可以表示為B=(b1,b2,…,bn),其中ai表示的是第n個特征點中對數據內容的貢獻程度,取值范圍為[0,1];bi表示的是第n個特征點中對數據檢索內容的貢獻程度,取值范圍為[0,1]。由此可得出數據檢索的模型:

(1)

式(1)中,1≤k≤∝,取值的范圍為[2,6]。對ai、bi和k選取不同的數值,由此獲取不同的結果。當k趨向于∝,并且ai的取值只能為0或1,而bi的取值只能為1。

將醫院臨床數據分為i類,W=W′∪W″。W′表示的是訓練的數據集,W″表示的是待分類的醫院臨床數據。使用該方法將待分類的醫院臨床數據與已經進行分類的數據重心進行比較,從中選取最大程度相似的類別進行提取。第T類的向量可以表示為T=(t1,t2,…,tn),待分類的醫院臨床數據可以表示為W″=(w1,w2,…,wn),它們之間的相似度可以表示為:

(2)

式(2)中,Sim(T,W″)表示的是最大時的醫院臨床數據類別即為所提取的數據類別。

2.2 數據的模糊分類處理

將分類描述為:指定的判斷集合為d={1,2,…,m}作為每一個i∈d建立的推理線路。推理線路利用醫院數據的增益來度量核心的數據,即當某個數據的類別隸屬度[10]遠遠超過任何一個預定閾值的時候就被認定為核心的數據。核心數據的評價函數為:

(3)

模糊性指的是將核心的數據作為醫院本質特性的數據,在分類處理的過程中,對于待分類的數據在某種程度上都屬于一個同等的類別,并非是絕對的二值的邏輯關系。根據傳統數據模型進行分類處理的時候,往往得到的是待分類的數據屬于各個分類級別的數值信息,一般情況下根據最大的結果來判定數據分類的結果,但這種方法往往會丟失大量的數據信息,會產生較大的誤差。而模糊的分類處理技術則是根據數據本身的模糊性來使用模糊的規則進行數據的處理,從而更加真實反應出醫院的原始數據。因此,為了提高數據分類的智能性與準確性進行了模糊的分類處理。首先應該對數據分類的模型進行模糊化的處理,然后將具體的數據信息轉換成為模糊的變量,然后根據實際情況進行相應的模糊分類處理,具體的過程如圖2所示。

圖2 模糊分類的處理流程

由圖2可知,不同數據的類別進行模糊化的處理,根據相應的模糊規則進行模糊的推理,從而得出結果。

使用模糊分類處理技術,可以較好地處理數據分類過程中出現的兼類、拒類的情況,如果只有一個類別的處理準確性較高的時候,那么該數據的類別就是對應的分類;如果同時出現兩個或者更多的數據分類處理準確性都較高的時候,那么該數據的類別就可以被分成多種的類別,被稱作兼類;如果出現的多個數據分類處理準確性都較低的時候,那么該數據的類別就被稱作拒類。在分類的處理過程中能夠根據數據的特征進行準確的分類,提高了實際應用的高效性。由以上步驟,實現了對醫院臨床數據的智能分類。

3 實驗結果與分析

為了驗證模糊分類處理技術下的數據智能分類的有效性進行了如下的實驗,實驗的條件如下;

實驗中所用的數據選取自某醫院2015年1月1日至2016年1月1日的臨床數據,數據的總量為300M,經解析儲存在數據庫中。數據庫的服務器采用的是2.0GHz,智能的聯想微機搭建以及百兆的局限網絡使用環境;數據庫的服務安裝0.1.2.2的企業版管理的系統。

3.1 實驗步驟

選取醫院臨床數據200個,其中,傳統的數據處理技術下的數據為100個,基于模糊分類處理技術下的數據為100個,模擬實際醫院臨床的環境將2中技術下數據分類處理的準確率進行對比。根據醫院臨床實際的數據情況,對準確率的要求較高,相對數據的召回率可以適當的將要求放寬,保證準確率較高的前提下確保召回率一定即可,具體的對比情況如表2所示。

表2 不同閾值下的數據分類的準確率

由表2可知:閾值越高,那么數據分類處理的準確率就越高,因為閾值降低會造成一些數據的誤判,大大降低數據分類處理的準確率。

通過對醫院臨床數據進行智能的分析,可以對臨床門診的預約情況、入住的病人人數、臨床門診護士的排班、臨陣醫護人員的平均工作量、參加門診的次數、護士對病人的注射次數的數據進行檢索,并使用模糊分類處理技術進行分類,具體的處理情況如表3所示。

表3 不同臨床指標的分類處理相似度

由表3可知:不同臨床指標相似度強的數據占所有分類處理數據的百分比與相似度弱的數據占所有分類處理數據的百分比要大。因此,模糊分類處理技術的數據處理的相似度對于不同臨床指標來說具有較大的影響。

3.2 實驗結果分析

根據上述實驗的過程可知不同閾值影響數據分類的準確率,因此可將閾值恒定,對傳統分類技術與基于模糊分類處理的技術的分類處理結果進行對比,結果如表4所示。

表4 不同技術的數據分類處理準確率

由表4可知:在相同的處理時間下,傳統分類技術與模糊分類處理的技術的召回率相似,但是準確率相差較大。具體數據分類精度對比如圖3所示。

圖3 不同方法數據分類精度對比

由圖3可知,對相同的100個數據進行分類處理,通過傳統方法與所提方法進行對比出現了明顯的分類精度差別,傳統方法隨著分類數據的數量增多,精度一直處于40%一下,且實驗過程精度變化幅度較大,而所提方法數據分類精度一直保持在90%左右,且穩定性高,上下波動非常小,這進一步說明所提方法對醫院臨床數據的分類精度高,且該方法穩定性好,實用性更強。

而分類的速度的對比情況如圖4所示。

圖4 不同技術下數據分類處理速度

由圖4可知:在數據的大小一致的情況下,傳統分類處理技術的速度要小于模糊分類處理的技術。

由此可得出結論:模糊分類處理的技術對醫院臨床數據分析的時候,利用固定的內存進行實時的數據處理,具有較高的時空效率,其分類的性能遠遠高于傳統的分類性能,將分析優勢與智能的分類處理技術緊密的結合起來對數據進行分類處理,滿足了人們對數據處理的需求,隨著技術的不斷進步,該分類的處理技能能夠實現大容量的數據處理功能,發揮更大的作用。

4 結束語

數據的分類處理技術是在語言處理的過程中一個重要的組成部分,改善了傳統的人工分類的方法,提高了數據分類的高效性與準確性,這是一種對數據處理的有效手段,也是未來必然的發展趨勢,尤其是伴隨著科學技術的不斷發展,網絡逐漸成為了人們進行數據傳送與接收的重要途徑?,F代醫學臨床數據以極高的速度進行增長,在如此巨大的數據處理壓力面前,傳統的分類處理技術已經無能為力,為此模糊數據分類處理技術的使用,大大提高了分類的效率。

總之,模糊數據分類處理技術已經成為了醫院臨床數據分析智能分類處理的重要手段,也是必然的選擇。利用該技術不僅能夠實現處理的方便快捷性,還能節省大量的人力與物力,大大提高數據的利用效率,為我國未來的數據分類處理提供了科學的依據。

[1] 王德文,周 青. 一種電力設備狀態監測大數據的分布式聯機分析處理方法[J]. 中國電機工程學報,2016,36(19):5111-5121.

[2] 李 菲. 基于數據挖掘的商務智能系統的設計與實現[J]. 現代電子技術,2016,39(11):152-155.

[3] 竇 芳. 基于數據倉庫的科研成果管理決策支持系統的研究與實現[J]. 現代電子技術,2016,39(7):120-123.

[4] 陳麟鳳,李 卉,莊 遠,等. 臨床輸血智能管理與評估系統的構建與應用[J]. 中國輸血雜志,2015,28(9):1167-1173.

[5] 劉馨蕊,任鳳玉,雷國平. 領域本體驅動下企業聯機分析處理系統應用研究[J]. 計算機應用,2016,36(1):254-259.

[6] 巫麗娟,趙 丹,劉敏雪,等. 四川大學華西醫院腦卒中伴感染患者臨床數據分析[J]. 中風與神經疾病,2016,33(3):262-266.

[7] 張盛婕,王 楊,李 衛. 臨界點分析法在處理臨床研究缺失數據中的應用[J]. 中華流行病學雜志,2017,38(5):674-678.

[8] 張一洲. 基于VSM和偏好本體的個性化信息檢索技術的研究[J]. 情報學報,2015,34(7):711-716.

[9] 查光成,賈俐俐,史曉帆,等. 基于STL模型的漸進成形支撐體的離散化設計[J]. 鍛壓技術,2015,40(12):155-159.

[10] 丁 劍,韓 萌,李 娟. 概念漂移數據流挖掘算法綜述[J]. 計算機科學,2016,43(12):24-29.

猜你喜歡
類別檢索準確率
論陶瓷刻劃花藝術類別與特征
乳腺超聲檢查診斷乳腺腫瘤的特異度及準確率分析
不同序列磁共振成像診斷脊柱損傷的臨床準確率比較探討
2015—2017 年寧夏各天氣預報參考產品質量檢驗分析
頸椎病患者使用X線平片和CT影像診斷的臨床準確率比照觀察
一起去圖書館吧
瑞典專利數據庫的檢索技巧
在IEEE 數據庫中檢索的一點經驗
一種基于Python的音樂檢索方法的研究
選相紙 打照片
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合