?

基于本體的蒙古語災害信息檢索模型

2016-10-18 09:11蘇依拉竇保媛吉亞圖
北京工業大學學報 2016年7期
關鍵詞:蒙古語本體檢索

蘇依拉,竇保媛,吉亞圖

(內蒙古工業大學信息工程學院,呼和浩特 010080)

基于本體的蒙古語災害信息檢索模型

蘇依拉,竇保媛,吉亞圖

(內蒙古工業大學信息工程學院,呼和浩特 010080)

由于蒙古語文本數據的匱乏以及語言分析困難等原因,蒙古語信息化處理發展緩慢.針對該問題,利用語義網本體技術,以自然災害為本體構建了一個面向蒙古語自然災害信息的跨語言檢索模型,實現了蒙英自然災害信息間的跨語言檢索.同時,本文提出的跨語言檢索模型具有一定的通用性,可為類似應用研究提供參考.

災害本體;蒙古語;WordNet;跨語言

由于互聯網的廣泛使用和自然語言處理技術的發展,本體以使用結構化的、機器和人都能理解的方式來組織和共享知識為契機,成為許多知識密集型應用的重要組成部分[1].本體最為著名并被廣泛引用的定義是由Gruber提出的“本體是概念模型的明確的規范說明”[2].而本體學習(ontology learning)的目標是利用機器學習和統計自然語言處理等技術,自動或半自動地從已有的數據資源中獲取期望的本體[3-4].

自提出基于本體學習的知識獲取方法以來,英語和漢語的知識獲取方法都獲得迅速的發展.目前少數民族自然語言處理仍處于知識獲取方法的基礎技術研究階段,由于蒙古語編碼的特性(如編碼不統一)、蒙古語的使用不普遍等原因,相關的應用研究更是缺乏[5].內蒙古在中國屬于自然災害多發地區,目前與之相關的研究多是著眼于單一災害,對于并發或災害源引發系列災害的整體狀況考慮較少[6].

目前,跨語言信息檢索主要有基于雙語詞典、機器翻譯和基于平行語料庫這3種方法,中間語言方法作為一種新的檢索處理方式也受到了各方的關注,它是伴隨檢索和翻譯過程協同處理思路逐步發展起來的一種方法.而今,跨語言信息檢索技術發展迅猛,Google頁面的“用戶偏好”就提供了跨語言檢索的功能,支持多種查詢語言以及對不同語言構造網頁的檢索.2012年Google推出第1版知識圖譜,在學術界和工業界掀起了一股熱潮[7].國內學者對于跨語言檢索模型的研究主要集中于中英文信息檢索處理,且相對較少,而對于蒙古語、漢語之間的檢索研究則更少.對于蒙漢語間的檢索還處在起步階段,內蒙古大學對蒙漢雙語對齊語料庫詞性標注、詞匯對齊和詞法分析做了研究,通過對比蒙漢雙語簡單句子的句子成分、分析短語結構的對應關系,從而總結出蒙古語簡單句結構轉換為漢語對應句子結構的規律[8].

本文將語義Web引入蒙古語信息處理過程中,借助“本體”這一概念,利用漢語作為中間語言,構建了一個面向蒙古語自然災害信息檢索的跨語言檢索模型.通過構建蒙漢詞典及中文WordNet數據庫,將蒙古語災害信息轉換為對應的英文形式,再使用基于WordNet的相似度算法將該英文形式與自然災害本體類名進行匹配,從而完成本體相關信息的查詢.本文提出的跨語言檢索模型提供了一種跨語言檢索的實現方法,這種具有通用性的設計模式可以為類似應用研究提供參考.

1 基于本體的蒙古語自然災害信息檢索模型

基于本體的蒙古語自然災害信息檢索模型需要對輸入的蒙古語災害信息進行多個層次的處理,具體包括對蒙漢詞典的查詢、中文WordNet漢英信息的轉換、英文單詞組合同本體中類的匹配和災害本體信息的查詢等.

該設計流程可分為3個部分,分述如下.

1)自然災害本體的構建

本文使用Protégé工具進行自然災害本體的構建,構建好的本體將被存入數據庫,便于后續過程中對本體信息進行檢索.

2)對輸入的蒙古語信息的處理、轉換

對于用戶輸入的蒙古語自然災害信息,首先調用蒙漢數據庫詞典查找對應的中文信息,如果查找失敗則發出錯誤提示,程序中止;如果查找成功則轉到中文WordNet中查找中文信息對應的英文信息.在中文WordNet中進行查詢的過程中,如果查找到相關的英文信息,則進入下一個處理步驟;如果查找不到對應的英文信息,則使用分詞工具對上述中文信息進行分詞后再轉到中文WordNet中進行查詢,若此次查找成功則進入下一個處理步驟,否則發出錯誤提示,程序中止.

3)基于WordNet的詞匯匹配并輸出查詢結果

若用戶輸入的蒙古語自然災害信息查找到相關的英文信息,則使用基于WordNet的詞匯匹配算法計算該英文信息與本體中類名的相似度,選取相似度值最高的類作為匹配結果,然后調用SparQL對匹配到的類進行相關查詢,并將查詢結果返回給用戶.

1.1本體構建

在構建本體時,可以使用斯坦福大學開發的本體圖形化設計工具Protégé,結合XML、RDF、OWL等進行蒙古語自然災害本體的創建.

在創建自然災害本體時,遵守了由Gruber提出的本體構建基本原則[3].首先需要搜集各類自然災害的詳細信息,由于這類信息來源較廣,此一些專業性強的領域信息獲取過程更容易.獲取到自然災害的詳細信息后需要對自然災害依據一定原則進行分類,將自然災害按形成過程分為兩大類,即突發性自然災害和緩發性自然災害.在此基礎上將繼續根據自然災害間的聯系性繼續進行劃分,如突發性自然災害又可劃分為地質災害、氣象災害等,直至將災害類型框架建立起來.具體的本體構建流程如圖1所示.

具體步驟如下:

1)創建特定類名Nature_disaster.

2)建立自然災害類的子類.

首先可以將災害劃分為突發性自然災害和緩發性自然災害,接著繼續為其構建具有從屬性關系的類,如突發性自然災害又可以分為地質災害、氣象災害等,如地震(earthquake)、崩塌(collapse)等都屬于地質災害,酸雨、干旱等屬于氣象災害,依級在Protégé中創建各個類,得到如圖2所示的樹結構.

3)為本體中創建的類添加聲明.

通過為本體中創建的類添加聲明,使概念的定義更加明確,因為某一類具體災害不可能既屬于地質災害又屬于氣象災害.因此,突發性自然災害下屬一級的類之間就有了互斥關系,例如突發性自然災害(父類)包括:旱災、洪澇、臺風、風暴潮、凍害等(子類),若子類屬于旱災的話,則一定不會屬于父類中的其他類別,因此旱災與其他子類之間存在互斥關系.同理也可為各個層次的兄弟類之間都添加此類聲明.

上述過程主要通過建立本體類屬性來實現,其中主要用到類的數據類型屬性(datatype property)以及對象屬性 (object property).本文以地震(earthquake)類屬性的構建為例予以說明.

1)構建earthquake類的對象屬性

利用Properties標簽,新建一個對象屬性,重命名為caused_by,代表被引發.再建立一個對象屬性give_rise_to(引發),在其右下角Inverser框中選擇caused_by屬性,表明它是屬性caused_by的逆關系(owl:inverseOf).

2)構建類的數據類型屬性

利用Properties標簽,新建一個數據類型屬性Pre(應對措施),在Domain(定義域)中定義該屬性的主體的類是earthquake,Ranger選取String字符串類型.通過類似的添加可以為所有需要定義的類添加Pre屬性,對于Pre的具體值可以依據不同類別的特征加以描述,如為earthquake類的Pre屬性可以添加如下值:

(就地選擇開闊地避震)

(避開高大建筑物或構筑物)

對于上述定義好的類,可為其添加實例,這里暫定其名稱為earthquake_2.

如上所述,可以為與earthquake有聯系的災害類創建類似實例,這樣就可以為earthquake_2這個實例添加謂語“give_rise_to”及賓語“collapse_1”等.

由于本文是對基于本體的蒙古語災害信息檢索模型的研究,其輸入的查詢內容及輸出的結果均需包含蒙文信息.因而,擬將earthquake_2這樣的實例名改為蒙古文的形式,具體查詢過程為首先找到相應實例,然后對該實例的comment屬性值進行查詢,即可得到包含蒙文的查詢結果.

對于已構建好的本體,可通過Jena來實現對本體的后續處理,如一致性檢查、本體內信息檢索等. Jena是由Java語言編寫的本體資源框架模型處理工具,能夠支持語義網的有關應用.本體一致性檢查以及本體內信息檢索均可以通過Jena實現;Jena具有推理功能,為信息處理過程中的推理提供支持;Jena也支持基于SparQL(simple protocol and RDF query language)的本體信息查詢,具體過程可以如圖3所示.

1.2基于WordNet的詞類匹配

本文研究的一個主要問題就是在蒙文輸入轉換為英文后如何實現與本體文件中概念的匹配,所以設計過程需要研究英文單詞或詞組的匹配問題.由于WordNet的相關研究已經包含一些相似度的計算方法,因而擬采用WordNet的相似度算法獲取輸入信息與本體中類名的最佳匹配結果.

基于WordNet的語義相似度算法,主要有基于信息內容(information content,IC)的相似度和基于語義距離的相似度計算方法[9].基于語義距離的相似度計算可以參考由Wu等[10]提出的經典算法,該算法考慮了WordNet中2個概念的公共父節點、深度(由于WordNet的層次圖結構,因而具有深度一說)以及語義距離.公式為

式中:lso(c1,c2)代表c1、c2兩個概念的最近公共父節點;depth(lso(c1,c2))代表這個父節點的深度;len(c1,c2)代表2個概念的語義距離.由此得出:2個概念在最近公共父節點一致的情況下,語義距離越短,相似度越大;概念間語義距離一定的情況下,最近公共父節點深度越大,概念劃分越具體,相似度越高.

在基于IC的相似度計算中,主要依靠信息量的大小來衡量概念相似度.Lin算法即為基于IC的相似度算法,其計算方式[11]為

式中lso(c1,c2)為c1、c2的最近公共父節點.對于IC(x)的計算,本文采用 Nuno[12]提出的基于WordNet本體結構的方法的信息量計算方法,具體為

式中:hypo(c)為概念c的下位詞集的個數;maxwn為WordNet詞集中所有名詞概念的個數.需要注意的是此處概念c下位詞集的個數,不僅僅是概念c的直接下位詞集的個數,而且是從概念c出發的直到葉子節點的所有無重復的下位詞集的個數.

為減少每次實驗過程中計算信息量的時間,本文通過編程預先計算所有概念的Nuno信息量并保存到文件中,在后續計算語義相似度的過程中遇到信息量計算時直接讀取信息量文件即可.

通過使用上述信息量的計算方法,將其計算結果帶入Lin算法的公式中,就可以得到相應的相似度計算結果.

綜上所述,這2種計算相似度的方法,都考慮了2個概念的最近公共父節點,不同之處在于前者同時考慮了概念間的相互距離.而本文采用的基于信息內容的相似度算法在計算信息量的過程中用到了節點的下位個數.參考計算語義相似度的相關文獻,語義距離、節點的深度及節點下位個數都是與相似度有關的屬性,所以擬將這3個要素都加以考慮,這可以通過結合Wu等及采用Nuno計算信息量的Lin算法予以實現.

JWS(Java WordNet similarity)中已經實現了Lin算法,其中概念的信息量是通過統計在一個大型語料庫中概念出現的概率對數的相反數獲得的,如

式中p(c)通過統計概念c在語料庫中出現的概率來獲取.

根據式(1),需要計算2個概念(c1,c2)的公共父節點lso(c1,c2)以及其深度depth(lso(c1,c2))和2個概念的語義距離len(c1,c2).

JWS中采用

用2個概念的深度和來代替式(1)中的分母,簡化了運算過程.2種方法的結合,綜合考慮了路徑與信息量對于相似度的影響,理論上具有可行性. Simwup表示使用Wu and Palmer計算所得2個詞的相似度,SimLin為使用 Lin算法所得相似度,用Simwn=kSimwup+(1-k)SimLin作為最終的相似度結果.對于k的取值,通過相似度數據測試集來確定.對于一個已有人工取值的數據測試集,可以用選定算法計算相似度,根據人工值和計算值的相關度來判斷算法的優劣[13].通過閱讀相關文獻,可以看到這種判斷方法為很多研究人員認可并實踐.相關性計算公式為

式中:Cov(x,y)=E((x-E(x))(y-E(y)));D(x)、D(y)表示方差;ρxy的值越大表示相關性越高.

本文選用WordNet similarity 353數據集作為測試數據集.WordNet similarity 353測試集分為3列,分別為word1、word2和兩詞之間的相似度的人工取值.測試集中的相似度范圍為[0.23,10],而Simwn的范圍為[0,1],所以在找出最佳的k值之前首先要將測試集中相似度的數值映射到[0,1],方法為

式中:Sim353為測試集中初始的相似度;Sim′353為映射到[0,1]的相似度;Max(Sim353)、Min(Sim353)分別取Sim353的最大值和最小值.

接著令k從0.01開始,每次循環都需計算并將k遞增0.01,再通過控制循環找到使得與相關系數最大的 k.通過計算得到相關性最高的系數為k=0.1,說明該算法中Lin的方法起的作用更大.

隨后,本文基于由Rubenstein和Goodenough提供的RG(Rubenstein&Goodenough)測試數據集[9],分別采用Wu等、Lin及兩者結合的方法計算RG測試數據集相似度,然后同人工取值相比較,根據式(6)計算相關性,具體如表1所示.

表1 相關度計算結果Table 1 Calculation result of correlation

通過上述過程可以得知,使用基于信息量和路徑結合的相似度算法可以得到更高的相關度值,該方法具有可行性.因而可以使用它進行英文檢索詞與本體類名的相似度計算,實現匹配目標.

2 模型檢驗

在實驗模型的檢驗過程中,本文采用自上而下的設計步驟,包含蒙古語到英語的轉化流程,本體模型的存儲及調用過程,基于WordNet的匹配算法用以實現檢索關鍵詞與本體信息的匹配,使用SparQL實現本體中信息的檢索以及最終的處理結果展示.檢索模型的實現采用MySQL及Java作為數據庫及編程語言.

2.1實證分析

1)文本轉化

對于輸入的蒙古文查詢詞,需要通過處理轉化為英文查詢詞,進而與本體中的類名進行匹配.設計過程中使用蒙科立整詞輸入法作為蒙古文的輸入環境.本文使用該輸入法、結合MySQL及數據庫可視化軟件Navicat構建的蒙漢詞典為如圖4所示.

對于蒙古文查詢請求,在數據庫中進行蒙漢匹配,得到對應的中文詞匯集合.調用蒙漢詞典數據庫,以實現該處理過程.

在蒙古文轉換為英文的過程中,用到了漢語作為中轉語言,在蒙英翻譯工具偏少的情況下,通過這種處理方式間接實現中文輸入的跨語言檢索.

對于中文詞匯的處理結果,可以通過在中文WordNet數據庫的相關表中找到它們對應的中文詞匯信息,再根據這些信息找到對應的英文單詞信息,從而將中文詞匯集合轉換為英文詞匯集合.根據對中文WordNet中表內容的分析,對帶有蒙漢對照的表進行聯合查詢,可以得到處理后的英文單詞組合.

本文使用wn_synset表中的word字段+ss_type字段 +sense_number字段(這 3個字段與英文WordNet中是對應的)來定位英文WordNet中的一個同義詞集.本體中的類名由名詞和形容詞組成,因為在英文WordNet中沒有定義形容詞的上下義及其他關系,無法為形容詞計算相似度,所以在處理過程中將形容詞過濾,ss_type字段均為n(名詞),即可以使用中文WordNet中wn_synset表的word字段+ sense_number字段來定位英文WordNet中一個名詞的同義詞集.

如果轉化后的中文詞匯在中文WordNet中找不到相應的記錄,則調用中文分詞工具對該中文詞匯進行分詞,接著在中文WordNet中對分詞后的結果進行查詢,如果可以找到相應記錄則進行后續匹配處理,否則返回空值并退出.

2)信息匹配

對于經中文WordNet查詢得到的英文單詞集合,需要與本體中的類名進行匹配,這也是本文實現的關鍵性問題.實現這一過程需要用到英文單詞與英文本體類名的匹配實現,本文采用基于WordNet的詞匹配方法,綜合考慮詞匯的語義距離、深度以及下義詞集個數的算法來實現匹配過程.

對災害本體中所含類,可以對數據庫中取出的本體模型調用listClasses()方法迭代獲??;對于處理后帶編號的英文單詞集,將集合中的單詞同所有類名一一進行相似度的計算,所得的相似度最大的作為匹配結果,匹配分為單個搜索詞匹配與多詞匹配過程.本文以“酸雨”為例說明多詞匹配過程:

首先“酸雨”經過分詞并在中文WordNet中進行多表聯合查詢后得出如下結果:

{雨 =[selva-1,water-6,Hyla-1,raindrop-1,monsoon-1,mack-1,monsoon-3,monsoon-2,Apus-2,thunderstorm-1,Apus-1,pluviometer-1,swift-3,swift-4,scud-1,Pluviose-1,flashing-1,flashing-2,storm-1,storm-3,storm-2,…,brashness-1,soaker-2,rainmaker-2,brashness-2,rainmaker-1,Huguenot-1,water-2,water-3,water-4,water-5,drizzle-1,soaker-1,water-1,rainforest-1,slicker-1,slicker-2,Burberry-1,slicker-3,Apodidae-1],

酸=[fox-2,fox-3,lactobacillus-1,Oxydendrum-1,propenoate-1,fox-1,Austerlitz-1,acidimetry-1,borosilicate-1,Austerlitz-2,ribose-1,Garibaldi-1,lysine-1,tannin-1,ribonuclease-1,asphyxiator-1,…,bichromate-1,oxalacetate-1,folacin-1,benzoate-1,Narcan-1,fulminate-1,lypressin-1,clabber-1,nuclease-1,aerator-1,lime-1,lime-3,lime-2,ketoprofen-1,lime-5,lime-4,lime-6,sourness-3,sourness-1,bluestone-1,sourness-2]}

再將上述結果與本體中所有類名計算相似度得出如下結果:

{acid_rain=0.695 738 646 197 844 9,torrent_ rain=0.631 658 119 005 674 3,

thunder_storm_wind=0.610 877 292 153 405 5,sand_dust_storm=0.598 911 659 125 960 1,

typhoon_storm_tide=0.589 161 739 304 375 7,…,beach_erosion=0.229 200 143 317 986 63,red_tide= 0.223 953 777 856 392 26,

drought=0.215 051 739 750 191 54,soil_ salinization=0.208 536 674 373 103 5}

由上述結果可知“酸雨”與acid_rain的相似度最高,所以取acid_rain作為“酸雨”的匹配值.

在實現過程中,可以使用同樣的代碼對單詞或者多詞進行處理,因為單詞的分詞結果還是單詞本身,不會影響后續的相似度的計算.

2.2結果呈現

依據本文闡述的方法找到搜索詞對應的本體類名后,可以通過SparQL查詢得到災害的應對屬性及其引發的災害類型.

如匹配后得到的災害類型為earthquake,可通過對其實例的相關查詢最終可以得earthquake的應對信息及其引發的災害類型,實例的查詢通過OntClass(本體類)的listInstances()方法實現.

如在找到 earthquake類的實例 earthquake_2后,利用:

SELECT?pre WHERE{base:earthquake_2 base:Pre?pre}

可以獲得災害的應對信息,然后借助:

SELECT?caused_by_earthquake_2 WHERE {base:earthquake_2 base:give_rise_to?caused_By_ earthquake_2}

獲得earthquake可以引發的災害類型實例.

由于實例中并不含有蒙文信息,故對于得到的災害實例,需要輸出其comment屬性的值,因為該屬性值包含了希望得到的結果(所需的蒙文信息).所以實際查詢為得到地震引發的災害實例,然后對這些實例進行comment屬性的查詢,以查詢地面沉降相關的蒙文信息為例,相應的查詢語句為:SELECT ?id WHERE {base:land_subsidence_1 rdfs: comment?id},查詢結果如圖5所示,從圖中可以發現關于地面沉降的應對措施以及其可能誘發的自然災害,如滑坡、坍塌等.

3 結論

1)將自然災害間的關系納入本體構建過程,利用機器學習和統計自然語言處理等技術,使用斯坦福大學開發的本體圖形化設計工具Protégé構建災害本體,通過為本體中創建的類添加聲明,使概念的定義更加明確.

2)在基于WordNet的詞類匹配過程中,使用基于信息量和路徑結合的相似度算法可以得到更高的相關度值.因而,可以使用它進行英文檢索詞與本體類名的相似度計算,實現匹配目標.

3)在蒙古文轉換為英文的過程中,用到了漢語作為中轉語言,在蒙英翻譯工具偏少的情況下,通過這種處理方式間接實現了中文輸入的跨語言檢索.

[1]VALARAKOS A G,PALIOURAS G,KARKALETSIS V,et al.Enhancing ontological knowledge through ontology populationandenrichment[M].Berlin:Springer Engineering Knowledge in the Age of the Semantic Web,2004:144-156.

[2]BAKHSHADEH M,MORAIS A,CAETANO A,et al. Ontology transformation of enterprise architecture models [M].Berlin:SpringerTechnologicalInnovationfor Collective Awareness Systems,2014:55-62.

[3]杜小勇,李曼,王珊.本體學習研究綜述[J].軟件學報,2006,17(9):1837-1847. DU X Y,LI M,WANG S.A survey on ontology learning research[J].Journal of Software,2006,17(9):1837-1847.(in Chinese)

[4]SURE Y,SCHNURR H P,STUDER R,et al.Knowledge processes and ontologies[J].IEEE Intelligent Systems,2001,16(1):26-34.

[5]趙小兵,邱莉榕,趙鐵軍.多民族語言本體知識庫的構建技術[J].中文信息學報,2011,25(4):71-74. ZHAO X B,QIULR,ZHAOTJ.Construction technology of ontology knowledge base in multiple minority languages[J].Journal of Chinese Information Processing,2011,25(4):71-74.(in Chinese)

[6]趙蘭.我國政府在自然災害應急管理中的職能問題研究[D].成都:電子科技大學,2011. ZHAO L.Research on the function of the government in the emergency management of natural disasters[D]. Chengdu:UniversityofElectronicScienceand Technology,2011.(in Chinese)

[7]王新才,丁家友.大數據知識圖譜:概念、特征、應用與影響[J].情報科學,2013,31(9):10-14. WANG X C,DING J Y.Mapping knowledge domain of big data:concept,feature,application and impact[J]. Information Science,2013,31(9):10-14.(in Chinese)

[8]阿拉塔.蒙漢雙語簡單句結構比較研究[D].內蒙古:內蒙古大學,2013. A L T.Comparative study of mongolian Chinese bilingual simple sentences structure[D].Inner Mongolia:Inner Mongolia University,2013.(in Chinese)

[9]王桐,王磊,吳吉義,等.WordNet中的綜合概念語義相似度計算方法[J].北京郵電大學學報,2013,36 (2):100-106. WANG T,WANG L,WU J Y,et al.Semantic similarity calculation method of comprehensive concept in WordNet [J].Journal of Beijing University of Posts and Tele Communications,2013,36(2):100-106.(in Chinese)

[10]WU Z,PALMER M.Verb semantics and lexical selection [C]∥Proceedings of the 32nd Annual Meeting of the Association for Computational Linguistics.New Mexico: ACL,1994:133-139.

[11]FELLBAUM C,MILLER G.Combining local context and WordNet similarity for word sense identification[M]∥WordNet:An electronic lexical database.Berlin:MIT Press,1998:265-283.

[12]MAEDCHE A,MOTIK B,Silva N,et al.Mafra-a mapping framework for distributed ontologies[M]∥Knowledgeengineeringandknowledgemanagement: ontologies and the semantic Web.Berlin:Springer,2002:235-250.

[13]張凱勇.基于WordNet的詞語及短文本語義相似度算法研究[D].長春:吉林大學,2011. ZHANG K Y.Research on semantic similarity between words and between short texts based on WordNet[D]. Changchun:Jilin University,2011.(in Chinese)

(責任編輯 呂小紅)

Mongolian Disaster Information Retrieval Model Based on Ontology

SU Yila,DOU Baoyuan,JI Yatu
(College of Information Engineering,Inner Mongolia University of Technology,Hohhot 010080,China)

The development of Mongolian language information is slow due to lack of electronic text data and massive difficulty of language analysis.In order to solve the problem mentioned above,a cross language retrieval model oriented to Mongolian natural disaster information was constructed by using Semantic Web ontology technology.Model test results show that this model can achieve a better cross language retrieval effect.At the same time,the cross language retrieval model proposed in this paper has a certain commonality,which can provide reference for similar applications.

disaster ontology;Mongolian;WordNet;cross-language

TP 391

A

0254-0037(2016)07-1017-07

10.11936/bjutxb2015100070

2015-10-24

國家自然科學基金資助項目(61363052);內蒙古自然科學基金資助項目(2012MS0904)

蘇依拉(1964—),男,教授,主要從事人工智能、機器翻譯方面的研究,E-mail:suyila@tsinghua.org.cn

猜你喜歡
蒙古語本體檢索
基于MFI4OR標準的本體融合模型研究
眼睛是“本體”
CNKI檢索模式結合關鍵詞選取在檢索中的應用探討
提高翻譯水平對年輕一代蒙古語廣播工作者的重要性
瑞典專利數據庫的檢索技巧
2019年第4-6期便捷檢索目錄
蒙古語呼倫貝爾土語“r”和“l”的語音差異及發音方法研究
英國知識產權局商標數據庫信息檢索
專題
Care about the virtue moral education
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合