?

基于MLS方法的本體算法

2015-02-24 02:45何國英高煒
紅河學院學報 2015年5期
關鍵詞:頂點本體排序

何國英, 高煒

(1.云南師范大學經濟與管理學院,昆明650500;2.云南師范大學信息學院,昆明650500)

基于MLS方法的本體算法

何國英1, 高煒2

(1.云南師范大學經濟與管理學院,昆明650500;2.云南師范大學信息學院,昆明650500)

MLS模型作為一種逼近模型被廣泛應用于數據光滑、數值分析和統計等諸多領域.文章將MLS模型用于最優本體函數的計算,將本體圖中每個頂點映射成實數后,通過頂點對應實數間的差值來確定它們的相似度.將新本體算法應用于GO本體和物理教育本體,通過實驗結果表明新算法對特定應用領域的相似度計算和建立本體映射是有效的.

本體;相似度計算;本體映射;MLS方法

順著大數據時代的到來,日常的信息處理數據量日趨龐大,各種學習算法被廣泛應用于本體相似度計算和本體映射.設本體用其圖結構G=(V,E)表示.其中一類本體學習算法是通過樣本的學習得到一個得分函數f:.該得分函數將本體圖中每個頂點映射成實數,而概念對應頂點之間的相似度則通過計算頂點對應實數間的差值的大小來判定.此類技術的優點在于:直觀性強,適合大數據本體相似度計算和大數據本體之間的本體映射的創建.

[1]通過排序學習方法得到本體頂點集上的得分函數f,并將此方法應用于在不同本體之間建立本體映射;[2]從本體圖邊權重的計算入手,通過圖學習方法得到實值得分函數,進而得到對應的本體算法;[3]和[4]則是利用正則化模型得到最優本體函數f,并分別得到對應的本體相似度計算和本體映射算法;[5]提出k-部排序半監督學習算法,將k-部排序和半監督算法相融合,并應用于本體相似度計算.文獻[6-7]對這些本體算法的收斂性進行了理論上的分析.

本文嘗試將其他的學習算法應用于本體相似度計算和本體映射.將MLS(Moving least-square)方法應用于得分函數f的計算,并由此得到新的本體算法.組織結構如下:首先介紹MLS方法的基本思想和對應計算模型;其次對基于MLS方法的新本體相似度計算和本體映射算法進行描述;最后將此算法應用于生物學“GO”本體和物理教育學本體,通過實驗數據的對比分析來說明MLS方法對于特定領域本體相似度計算和本體映射的構建是有效的.

1 MLS方法介紹

首先,將本體圖中每個頂點的對應信息分別用一個n維向量來表示.為了方便標記,本文中使用v來表示頂點以及它對應的向量.這樣,本體頂點集合V可以假設成的緊子集.設標記集合.選取樣本集S={(v1,y1),(v2,y2),…,(vm,ym)}.學習的過程是通過樣本集S的學習得到本體得分函數f:.

(2)存在常數cq>0,使得對任意,都有成立

三是粗度。就是主從分明。前面講過,主枝粗度不能超過同部位主干粗度的1/3,結果枝組粗度不能超過同部位主枝粗度的1/4。

這里,H是假設空間,一般取再生核希爾伯特空間.>0稱為比例參數.

2 本體算法描述

由以上分析,我們得到基于MLS方法的本體算法,其整體描述如下:

算法A:基于MLS方法的本體相似度計算算法

A1:對本體圖進行預處理.將本體圖中每個頂點的信息用一個向量表示.

A2:選取樣本集,計算標記從而得到S.

A3:通過模型(1)得到最優本體函數f.

A4:通過計算兩頂點對應實數的差值來計算本體頂

點之間的相似度.

算法B:基于MLS方法的本體映射算法

B2:選取樣本集,計算標記從而得到S.

B3:通過模型(1)得到最優本體函數f.

B4:通過計算來自不同本體的兩頂點對應實數的差值來計算不同本體頂點之間的相似度.

B5:根據B4得到的相似度,選擇映射策略生成本體映射.

3 實驗

在這一節中,我們將基于MLS方法的本體算法應用于兩個具體領域.通過兩個具體的實驗來分析新算法對于本體相似度計算和本體映射的有效性.

3.1 本體相似度實驗

第一個實驗是采用生物GO本體O1(http:// www.geneontology.org,大致結構可參考圖1)來驗證算法A的效率.該本體結構是一個樹性結構,其頂點被分成“Molecular function”、“Biological process”和“Cellular component”三個分支.通過本體頂點相似度計算,可以了解不同分子功能、化學細胞結構和生物過程之間的聯系,從而幫助生物學家和基因研究者了解基因和化學結構以及分子化學作用之間的相互聯系.因此,對GO本體的研究對生物學、醫學和制藥學都有重要的意義.本實驗結果采用P@N[8]平均準確率來衡量.

圖1 GO本體O1

另外,分別將本體回歸算法[9]、快速排序算法[10]和標準本體排序算法[1]作用于GO本體.將這三種算法得到的P@N準確率與本文算法A得到的準確率進行比較,部分數據如下:

表1 實驗1部分數據

由表1準確率對比可知,算法A對于GO本體的效率明顯高于本體回歸算法、快速排序算法和標準排序算法.

3.2 本體映射實驗

本文的第二個實驗是采用下面兩個“物理教育”本體O2和O3來驗證算法B的效率.這兩個本體是將中學物理教育中的一些基本教學元素通過它們的從屬關系串聯成本體結構圖.通過相似度計算從而在這兩個物理教育本體之間建立本體映射,有助于了解由物理教育學元素以不同的方式構成的不同結構圖之間的元素相互聯系,從而可以幫助教學工作者進行物理教學元素的統籌以及設計整體教學規劃方案.

圖2 “物理教育”本體O2

圖3 “物理教育”本體O3

同樣地,分別將本體回歸算法、快速排序算法和標準本體排序算法作用于“物理教育”本體,將這三種算法得到的P@N準確率與本文算法B得到的準確率進行比較,部分數據如下:

表2 實驗2部分數據

由表2準確率對比可知,算法B對于“物理教育”本體O2和O3間建立本體映射的效率明顯高于本體回歸算法、快速排序算法和標準排序算法.

4 結束語

本體作為一種結構化數據表示模型,被應用于工程科學的各個領域,比如生物基因科學和教育學中.不同的機器學習方法可以產生不同的本體函數算法,本文嘗試將MLS方法應用于本體相似度計算和本體映射.通過MLS方法得到本體函數進而使用本體函數值來計算本體圖中不同概念對應頂點之間的相似度,同時在多本體圖之間通過得到的相似度建立本體映射.事實證明,該方法對于特定應用領域的本體相似度計算以及構建本體映射是有效的.

[1]高煒,蘭美輝.基于排序學習方法的本體映射算法[J].微電子學與計算機,2011,28,(9):59-61.

[2]高煒,梁立,張云港.基于圖學習的本體概念相似度計算[J].西南師范大學學報(自然科學版),2011,36,(4):64-67.

[3]高煒,梁立.基于超圖正則化模型的本體概念相似度計算[J].微電子學與計算機,2011,28,(5):15-17.

[4]高煒,朱林立,梁立.基于圖正則化模型的本體映射算法[J].西南大學學報(自然科學版),2012,34,(3):118-121.

[5]高煒,梁立,徐天偉,等.半監督k-部排序算法及在本體中的應用[J].中北大學學報(自然科學版),2013,34,(2):140-146.

[6]高煒,張云港,梁立.Cs相似度函數下正則譜聚類的收斂階[J].蘭州大學學報(自然科學版),2011,47,(2):109-111.

[7]高煒,周定軒.與一般相似度函數相關的譜聚類的收斂性[J].中國科學:數學,2012,42,(10):985-994.

[8]Craswell N,Hawking D.Overview of the TREC 2003 web track [C].Proceedings of the Twelfth Text Retrieval Conference. Gaithersburg,Maryland,NIST Special Publication,2003:78-92.

[9]Gao Y,Gao W.Ontology similarity measure and ontology mapping via learning optimization similarity function[J]. International Journal of Machine Learning and Computing. 2012,2(2):107-112.

[10]Huang X,Xu T,Gao W,Jia Z.Ontology Similarity Measure andOntologyMappingViaFastRankingMethod[J]. International Journal of Applied Physics and Mathematics,2011,1(1):54-59.

[責任編輯魯海菊]

Ontology Algorithms Based on MLS Method

HE Guo-ying1,GAO Wei2
(1.School of Economy and Management,Yunnan Normal University,Kunming 650500,China 2.School of Information,Yunnan Normal University,Kunming 650500,China)

Moving least-square method is an approximation method for data smoothing,numerical analysis,statistics and many other fields.We apply MLS method to get the optimal ontology function,and then each vertex is mapped into a real number.The similarity between two vertices is determined by virtue of the difference of their corresponding real numbers.The new ontology algorithm is applied to the Go and the physical education ontologies,and the experiment results show that the new algorithms with efficiency in specific applications for similarity measure and ontology mapping building.

Ontology;Similarity measure;Ontology mapping;MLS method

TP393.092

A

1008-9128(2015)05-0014-03

2014-09-15

國家自然科學青年基金資助項目(11401519);教育部科學技術研究重點項目(210210).

何國英(1986-),女,云南大理人,助教,碩士,研究方向:思想政治和課程教學及教育技術研究。

猜你喜歡
頂點本體排序
排序不等式
過非等腰銳角三角形頂點和垂心的圓的性質及應用(下)
過非等腰銳角三角形頂點和垂心的圓的性質及應用(上)
眼睛是“本體”
恐怖排序
節日排序
基于本體的機械產品工藝知識表示
專題
Care about the virtue moral education
數學問答
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合