?

基于深K近鄰和樸素貝葉斯分類算法的腫瘤診斷

2020-12-08 02:12申淑逸
數碼設計 2020年16期
關鍵詞:機器學習深度學習

摘要:本文試圖將深k近鄰和樸素葉貝斯分類算法來解決腫瘤診斷的問題。腫瘤現在已經成為我國乃至世界范圍內的常見病和多發病,盡早診斷和治療對腫瘤患者的未來至關重要。異型性是腫瘤異常分化在形態上的表現。腫瘤細胞異型性小,與正常組織相似,分化和低惡性。腫瘤細胞異型性大,與正常組織相似度小,分化程度低,惡性程度高。區別這種異型性的大小是診斷腫瘤,確定其良性、惡性的主要組織學依據,但最大的問題在于準確診斷存在困難。本文從概率的角度,結合深K近鄰與樸素貝葉斯分類算法開展研究,對盡可能準確的診斷提出合理的算法。

關鍵詞:K最近鄰分類算法;樸素貝葉斯分類算法;深度學習;機器學習

中圖分類號:TP391.41?? 文獻標識碼:A?? 文章編號:1672-9129(2020)16-0067-01

1 深K最近鄰算法腫瘤診斷的原理

K最近鄰(Deep-k-Nearest Neighbor,DNN)分類算法是最簡單的機器學習算法之一。該方法的思路是:在特征空間中,如果一個樣本附近的k個最近樣本的大多數屬于某一個類別,則該樣本也屬于這個類別。

本文建立在深度神經網絡上,索引為λ的層將前一層fλ-1的輸出作為其輸入,并應用非線性變換來計算其自己的輸出fλ。這些非線性行為通過一組參數θλ來控制,這些θλ是每個層的特定參數,這些參數將給定層的神經元鏈接到其前面的層的神經元。因此,對于給定輸入x,神經網絡f執行以下計算以預測其類:

fθ,x=fl-1(θl-1,fl-2(θl-2,…f0(θ0,x)))

2 樸素貝葉斯分類算法原理

設w為腫瘤組織與正常組織異型性的特征向量,表示組織異型性數值大小是否達到惡性腫瘤的值,1表示異型性達到,0表示未達到。用ci表示腫瘤的類別,分為良性腫瘤和惡性腫瘤,1表示惡性腫瘤,0表示良性腫瘤,則核心公式如下:

pci|w=p(w|ci)p(ci)p(w)

由于對腫瘤組織與正常組織異型性的診斷需要對多個節點進行測試,可以進一步將w擴展為多個屬性節點Xi,令每個屬性節點相互獨立,只與該節點的相應組織C相關。那么各屬性節點與組織C的關系就可表示為一個離散隨機變量的有限集X1,X2,…,Xn,C,條件屬性值xi是屬性Xi的取值,條件屬性值ci是屬性C的取值,則本組織屬于ci類腫瘤的概率由貝葉斯定理可表示為:

pci|w=p(x1,x2,…,xn|ci)p(ci)p(x1,x2,…,xn)

3 基于K最近鄰算法和樸素貝葉斯分類算法的腫瘤診斷流程

DNN分類算法的主要思想是:首先算出待分類樣本與已知樣本之間的距離,進而找到距離與待分類樣本數據最接近的K個樣本,再根據這些樣本所屬的類別來判斷待分類樣本數據類別的分類。因為同時使用多個參數值不同的DNN算法對待同一特征數據分類得到的結果相互獨立,符合樸素貝葉斯算法中所有屬性相互獨立的假設,所以結合樸素貝葉斯算法可以提高DNN分類的性能。

組合算法構造算法步驟如下:

Step 1:設樣本集

D={(x11,x12,…,x1n,C1),(x21,x22,…,x2n,C2),…,(xm1,xm2,…,xmn,Cm)}為提取的組織C和該屬性的屬性節點特征向量的集合,其中Ci(i=1,2,…m)表示樣本類別,取值為c1,c2,…,cn。

Step 2:將樣本集D分為訓練集Dtrain和測試集Dtext兩部分。

Step 3:分別對屬于Di的子樣本集進行計算,計算出其中特征Xi=ai的概率,p=(Xi=ai|C=Ci)

Step4:計算訓練集樣本數據和測試集樣本數據的距離,為測試集樣本數據選擇若干個與其距離最小的樣本,對每個測試樣本統計出最鄰近若干個樣本中大多數樣本所屬的分類。

Step5:針對測試集Dtext,得到C(C1,C2,…,Cn)對每個特征屬性計算所有劃分的概率PC=Ci|X=xtext=p(C=Ci)Πnj=1p(Xj=xtextj|C=Ci)。

4 結論

本文實現了將樸素貝葉斯分類算法合并到k深度近鄰算法之中,以便提高它的效率,提高診斷的準確率,為抽象的據概率分類的算法整合出具體的步驟。雖然腫瘤診斷需要考慮的因素更加復雜,本文中形成的簡單系統總體上可能不如更加復雜的系統有效。盡管如此,考慮到明顯簡化而達成的算法,可以認為這種簡化的系統是有效的。

參考文獻:

[1]李雙杰,張開翔,王士棟,王淑琴.基于加權K近鄰的特征選擇方法[J].天津師范大學學報(自然科學版),2020,40(02):63-67.

[2]何偉. 基于樸素貝葉斯的文本分類算法研究[D].南京郵電大學,2018.

作者簡介:申淑逸(2000—),女,漢族,籍貫:山東臨沂,學歷:本科,單位:曲阜師范大學,計算機學院。

猜你喜歡
機器學習深度學習
基于詞典與機器學習的中文微博情感分析
有體驗的學習才是有意義的學習
電子商務中基于深度學習的虛假交易識別研究
MOOC與翻轉課堂融合的深度學習場域建構
大數據技術在反恐怖主義中的應用展望
基于網絡搜索數據的平遙旅游客流量預測分析
前綴字母為特征在維吾爾語文本情感分類中的研究
深度學習算法應用于巖石圖像處理的可行性研究
基于深度卷積網絡的人臉年齡分析算法與實現
基于支持向量機的金融數據分析研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合