?

基于范疇論的Web本體論描述研究

2011-07-05 08:42葉丹丹汪海濤
關鍵詞:論域本體論范疇

葉丹丹,汪海濤

(昆明理工大學 信息與自動化學院,昆明 650500)

隨著互聯網的不斷發展,人們不僅從互聯網中獲取到了信息,還進行電子商務、在線聊天等活動。它擯棄了傳統方式在時間和空間上的局限性,讓人們便利的獲取各種信息。下面介紹一下Web的演變。

Web 1.0是Web的第一階段,用戶主要是閱覽網站的內容。信息只是用戶和互聯網之間的單項傳輸。到Web 2.0時,用戶既是網站信息的閱覽者又是創建者。例如Blog、Wiki、RSS等為典型的運用,通過這摒棄了傳統方式中由于時間和空間的局限性獲取信息的模式。在Web2.0的環境下用戶能夠自己創建內容,此時互聯網的信息日益增多。這時用戶不能夠非常便捷、高效、準確地獲取自己所需的信息。于是Web3.0就以個性化、友好化等特點為核心應運而生。 Web3.0是在用戶行為習慣和信息的集聚下產生的。它將在Web2.0的基礎上向用戶提供個性化、高效化等的服務。圖1為Web的演變過程。

圖1 Web演變過程Fig.1 Evolution of Web

實現Web3.0的關鍵是語義網。語義網的技術是得出本體實現的關鍵。本文還利用范疇論來進行本體論的研究。

1 語義網

語義網概念是互聯網創始人英國科學家Tim Berners-Lee于2000年12月18日在XML2000的會議上正式提出來的。他對語義網的定義如下:“語義網是一個網,它包含了文檔或文檔的一部分,描述了事物間的明顯關系,且包含語義信息,以利于機器的自動處理?!闭Z義網是為了改變現有互聯網依靠文字信息來共享資源的模式,而利用本體來描述語義信息,以到達語義級的共享,使得網絡服務智能化。

語義網是運用一套通用的標簽把數據信息進行結構化的。由于這些標簽具有預定義的語義,當網絡進行信息處理的時候,通過讀取這些標簽來關聯數據,因此網頁才具有了語義。一個典型的Web網頁是用HTML標記語言來表現的。如下:

上面的信息用戶通過瀏覽器,可以明白其表達的語義。但是對于處理其數據的計算機來說,它們是無法理解”name“、”birthday“等信息的語義的。

使用通用“標簽”來標識數據則可以解決這個問題。它也逐漸成為了定義Web數據的通用語言,這稱為元數據(metadata)。于是,上面用HTML標記語言表示的數據可以表示為:

應用上面通用標簽的思想為描述Web數據定義一套通用元數據,從而形成了本體的概念。

2 本體概念

本體論最早是來源于哲學,它研究物質世界中存在的本質(nature of existence),即研究哪些客體是真實存在的,以及如何描述它們。在計算機科學領域中,本體被稱為“對概念的顯示和形式化的規格說明(explicit and formal specification of a conceptualization)”。下面是本體論形式化的描述定義。

本體結構O可以用一個四元組(C,R,Hc,rel)表示,其中,C表示概念集合;表示概念(c∈C),概念是特定領域中的一組或一類實體或者事物,每個概念可以由屬于分別描述其不同方面的特點;R表示關系集合,r表示關系(r∈R),關系描述了概念與概念之間或者屬性與屬性之間的關系,關系可以分為2類:分類關系和連接關系;Hc表示分類關系,是概念與概念之間的父類、子類等上下位的層次關系,HC?C×C;rel表示連接關系,是除了上下位層次關系以外的其他關系,rel:R→C×C 。[1]

為了在Web中表現本體論的結構,則用描述概念和概念之間的關系——元數據來表示。萬維網聯盟提供了一系列定義元數據和元數據的推薦標準,如下:

XML(Extensible Markup Language):提供了機構化文檔的表層語法,但是沒有任何具體的語義限制。

XML Schema:用于限制XML文檔的結構。

RDF(Resource Description Framework):用于定義對象(“資源”)和對象之間的關系,它提供了對象模型的簡單的數據語義,并且使用基于XML的語法表達出來。

RDF Schema:是一種詞匯描述語言,用于描述RDF資源所示的概念和屬性之間的關系。

OWL(Web Ontology Language):它是一種用于描述元數據的本體語言,用于描述概念,屬性,已及它們內部及之間的關系,包括概念的所屬關系,不交關系,基數限制,屬性的類型,相等,枚舉等。

3 范疇論

范疇是從數學的各個領域中概況出來的一個高度抽象的數學系統。它的提出被普遍的運用到了計算機科學的各個領域,解決和解釋其領域的科學問題。下面先介紹一下范疇論中需要用到的知識。

一個范疇C由下列內容組成:

(1)一個對象類ob(C),ob(C)的元稱為C中的對象,通常用A,B,…等表示范疇的對象。

(2)一個態射類Mor(C),Mor(C)的元稱為C中的態射。對于C中對象的每個有序偶(A,B),對應有唯一的一個集 HomC(A,B),簡記作 Hom(A,B)。Hom(A,B)中的元稱為C中以A為論域,以B為余論域的態射。

若f ∈Hom(A,B),則記作f:A→B.有時也用dom(f),cod(f)分別表示f的論域A,余論域B。

(3)對于C中對象的每個有序三元組(A,B,C)對應一個稱為合成(或復合)的映射Hom(A,B)×Hom(B,C)→Hom(A,C),即(f,g)∣→ g。f,g。f稱為f和g的合成(或復合)。

要求C中的對象和態射滿足下列公理:

(1)若(A,B)≠(C,D),則Hom(A,B)∩Hom(C,D)為空;

(2)若f∈Hom(A,B),g∈Hom(B,C),h∈Hom(C,D),則(h。g)。f=h 。(g 。f);

(3)任意 A∈ob(C),存在 idA∈Hom(A,A),使得任意f∈Hom(A,B),任意g∈Hom(C,A)有f。idA=f,idA。g=g,idA稱為A上的恒同態射。

圖是定義范疇的基礎,范疇是圖加上滿足某種條件的圖中箭頭的合成規則。于是范疇則可看成為一個有向圖,如圖2所示。圖中的節點對應范疇中的對象,箭頭對應范疇中的態射,每個箭頭有一個源(source)(或論域(domain))節點和目標(target)(或余論域(codomain))節點。

圖2 范疇圖形表示Fig.2 Graph of category theory

4 用范疇論研究Web中的本體

現在我們用范疇論的思想來描述研究Web中的本體論,首先要構造范疇論中存在的對象和對象之間的關系。從本體論概念出發,我們知道本體論描述的是概念的集合和概念之間關系。通過概念的組合可以表現具體的事物,即我們可以把概念的組合關系看成是對象間的關系。如“小王是學生”,”小王“是姓名的概念,“學生”是教學方面的概念。但是把其兩個概念組合成一塊,“小王”具有了人的特征,“學生”也具有了學生中的某些特征。我們把人和學生是抽象化時,它們就是為類,通過類在把其實例化為對象。于是我們有理由知道,”小王“是人類的對象,并且“小王”還是學生類的對象。對本體概念的組合就是對象,表現了一個具體有意義的事物。而概念間的關系就轉化為對應的對象和對象之間的關系,這個關系可以表示為范疇論中對象和對象的關系,即態射。

現在我們用形式化的方式來表示本體,根據本體論的定義我們設本體對象O1(C,R,Hc,rel),則c1∪c3∪…∪cn∈A,c2∪c4∪…∪cn+1∈B 為對象,而(c1,c2…)∈C。因c1,c2…概念中存在的關系R,于是A和B之間也存在著關系。A—>B的態射為概念之間的關系f∈R,即R是由概念和概念之間的關系來確立對象和對象之間的關系。如學校層次結構關系,“小王是學生”,“李xx是老師”。在學校層次結構中,概念“學生”和“老師”有明確的關系。老師是學校教職工,學生是學校的學員,他們之間有授課與聽課的關系。通過這樣的規則,此時用概念間的關系來對應對象間的關系“小王是李xx的學生”。這樣就得到了一個通過集成的信息。

在本體論中存在了概念和概念之間的關系,如層次關系等,通過這些關系才能把實體數據給聯系在一塊。根據范疇的合成、推出和拉回,通過概念和概念之間的關系把對象和對象連接起來,使得世界就像一張網。如圖3所示,實例本體的關系。

圖3 實例本體關系Fig.3 The instance ontology relationship

當用戶查詢信息時,代理軟件可以掃描和解釋網頁上的信息通過的就是本體論的概念。根據概念來查詢信息,并把和其概念的相關信息進行篩選來得到用戶想要的數據。

5 結束語

由于互聯網的運用越來越廣泛,并且推動著互聯網的發展。人們對Web的研究也一直在繼續,于是Web就經過了不斷的演化來符合人們的需求?,F在Web研究人員正熱衷于Web3.0的研究。語義網是實現Web3.0的關鍵技術,而要使計算機能夠解釋網頁則要通過本體來實現。因為本體是表示概念與概念之間的關系,于是利用范疇論的原理來對本體論進行了研究,為Web的研究提供了數學理論。隨著人們的對Web的研究,將最終實現便利人們生活和工作方式的Web誕生。但是對于人類不斷改變的需求,Web的研究也將不會停止。

[1]楊先娣,何寧,吳黎兵.基于范疇論的本體集成描述[J]. 計算機工程,2009,35(6):76-78.

[2]Jams,Hendler.Web 3.0:Chicken Farms on the Semantic Web[J].Computer,2008(41):106-108.

[3]Jams,Hendler.Web 3.0 Emerging[J].Computer,2009(42):111-113.

[4]Jams,Hendler.Web3.0:TheDawnofSemantic Search[J].Computer,2010(43):77-80.

[5]Malik Muhammad Imran Pattal,LI yuan,ZENG Jianqiu.Web3.0:A real person Web![J].2009 Third International Conference on Next Generation Mobile Applications,Services and Technologies,2009:125-128.

[6]羅泰曄.Web3.0初探[J].情報檢索,2009(2):101-103.

[7]陳意云.計算機科學中的范疇論[M].安徽:中國科學技術大學出版社,1993:65-113.

[8]鄭崇友,樊磊,催宏斌.Fram與連續格[M].北京:首都師范大學出版社,2000:1-38.

[9]Grigoris Anotoniou,Frank van Harmelen.語義網基礎教程[M].陳小平,等,譯.北京:機械工業出版社,2008:1-15.

猜你喜歡
論域本體論范疇
批評話語分析的論辯范疇研究
正合范疇中的復形、余撓對及粘合
基于變論域模糊控制的Taylor逼近型內模PID算法
Clean-正合和Clean-導出范疇
CP論題能為本體論論證提供辯護嗎?
張栻的本體論建構及其體用邏輯探析
變論域自適應模糊PID控制系統仿真與應用
張載哲學的本體論結構與歸宿
雙論域粗糙集在故障診斷中的應用
微電影本體論辨析
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合