?

基于M2M語義的智慧健康應用平臺解決方案

2015-05-13 22:49李建功李士寧賈雪琴毛峻嶺
信息通信技術 2015年5期
關鍵詞:本體語義架構

李建功 李士寧 賈雪琴 毛峻嶺

1 中國聯通研究院 北京 100032

2 西北工業大學 西安 710072

1 基于M2M語義的技術架構

語義是指數據的含義,被賦予含義的數據就轉化為了信息,數據的含義就是語義。語義具有領域性特征,M2M語義即是指物聯網領域的數據含義,物聯網領域的一些術語和數據在解釋上存在差異、理解不同。需要由統一的M2M語義描述物聯網術語和數據的解釋,也就是用戶用來聯系物聯網環境里現實世界的途徑。

海量的M2M終端帶來的異構性問題給物聯網資源互通帶來挑戰?;贛2M可理解的語義技術,目前,正逐步運用于資源描述,共享和信息整合領域,加入語義將有助于在物聯網領域建立M2M可理解的自描述數據。然而M2M語義技術還處于起步階段,在跨平臺的資源互操作性上效果不顯著。 本文結合現有的物聯網本體參考模型及功能架構,提出物聯網語義架構,以促進物聯網資源的互操作性。

1.1 語義參考模型

本文考慮的物聯網語義參考模型基于通用M2M總體架構設計[1-3],如圖1所示。其中考慮的參考模型主要關注在公共服務層提供語義能力,用以支撐物聯網應用對語義能力的需求。

圖1 物聯網語義參考模型

在語義參考模型中,主要包含應用和語義服務中間件兩個實體,其中應用實體位于應用層,與通用M2M總體架構中的應用實體一致。語義服務中間件實體位于公共服務層,包含于通用M2M總體架構中的CSE(Common Service Entity,共同服務實體)中。應用和語義服務中間件之間通過Mca參考點相連,語義服務中間件之間通過Mcc參考點相連,Mcc’參考點用于語義服務中間件與外部語義服務設施的連接。

應用可以通過Mca參考點調用語義服務中間件提供的語義能力實現應用需求。當語義服務中間件無法提供應用所需的語義能力時,語義服務中間件可以通過Mcc參考點或者Mcc’參考點調用其他語義服務中間件或者外部語義服務設施提供的語義能力。

1.2 語義功能架構

物聯網基本語義功能架構如圖2所示,其功能大致可以分為三個層面[4-5]。

第一個層面,設備抽象、M2M數據和數據倉庫等功能模塊構建了M2M底層的抽象設備和數據等資源的數據庫,提供可調用的底層資源。

第二個層面,本體模型、本體和語義注釋等功能模塊將底層資源做語義增強,對底層資源增加語義的描述,提供語義化的資源。

第三個層面,語義分析和查詢、語義mash-up和推理提供對語義化的資源進行語義查詢和處理的能力,讓應用可以根據需求找到目標資源。

圖2 物聯網基本語義功能架構

2 智慧健康應用場景語義技術需求

2.1 智慧健康應用場景

智慧健康應用是以個人全生命周期電子健康檔案(PHR)為中心,對接多種類型的健康監測設備,包括企業/社區健康小屋設備、家庭便攜健康監測設備、可穿戴式健康監測設備,承載異構健康檔案數據,包括社區電子健康檔案數據、體檢報告數據、慢病數據、運動健康等數據,結合用戶標示與健康設備M2M標示,以及個人電子健康檔案數據,實現統一信息綁定和認證,為對外提供全生命周期的健康信息服務提供技術保障。

智慧健康應用架構圖如圖3所示,左側展示智慧健康的感知層,感知層中包括便攜式健康終端、健康小屋類采集終端、智能手機終端,終端采用移動網和固網接入;中間展示為智慧健康的網絡層,主要包括運營商的接入網、傳輸網以及M2M業務支撐平臺,圖中右側為架構的應用層,主要為智慧健康(健康管理)平臺及數據中心。

2.2 智慧健康場景語義技術需求

智慧健康場景中涉及實體較多,有健康采集設備、移動通信終端、業務支撐類系統、健康應用類系統等,由于這類實體在智慧健康場景中沒有定義,極大地影響了智慧健康場景中終端與系統之間的互操作性。

圖3 智慧健康應用架構圖

在該場景中,健康采集設備包括便捷式健康終端、可穿戴式健康終端、健康小屋等采集設備;移動通信終端包括智能手機類終端、家用數據網關類終端;需要對不同類健康終端、通信終端進行定義和標準化語義,而且終端的數據接口定義需要進行語義標準化。

研究智慧健康場景中M2M語義功能中本體的層次定義,一方面有助于提高本體的靈活性,另一方面有助于增加本體的可擴展性。結合智慧健康應用本體分類以及健康本體層次需求,提出了健康本體模型,具體包括多層次本體架構、每個層次本體的定義和范圍及層次之間的關系模型等。

需要將智慧健康場景中所產生的數據進行資源抽象,抽象為以統一格式描述的資源,然后將這些資源以及資源之間的關聯關系在本體構建模塊進行信息提取、知識元建立和本體構造,形成該智慧健康應用系統的本體模型,并保存在本體庫中,也可與已經存在的上層本體、領域本體進行關聯,形成統一本體知識庫。上層M2M應用可以基于統一本體庫及開放接口、mashup等模塊,構建基于語義的M2M應用。

圖4 健康域本體構建架構圖

需要將智慧健康場景中涉及的對文本信息源進行分詞、去停止詞等預處理;通過模式提取從文本信息源中獲取知識元組(知識元組由概念與概念間的關系組成);計算知識元組全集中概念、關系的語義相似性,合并相似的概念、關系構成初始化本體;計算初始化本體中概念、關系的重要度及布爾關系,構成層次化的本體[4]。健康領域本體構建結構如圖4所示。

3 基于M2M語義的智慧健康應用平臺解決方案

3.1 健康本體模型搭建

目前的物聯網本體都是基于領域專家人工構建,較權威的有W3C語義傳感器網絡孵化器構建的SSN本體,此外還有CSIRO、MMI、CESN、A3ME、OntoSensor等十余個物聯網領域本體。這些本體以粗粒度方式描述了物聯網領域的基本概念,但受限于人工構建速度的局限和物聯網技術的飛速發展,這些本體缺乏對特定系統特征、新興概念的描述,不適合直接運用在特定的物聯網系統中。本文將通過健康領域的語義本體需求考慮如何自動構建健康本體模型[6-9]。

健康本體是健康領域相結合的知識庫,按照健康業務定義的概念及概念間關系的方式為整個領域建立網狀的知識系統。在智慧健康業務場景中實現異構數據的互操作是一個核心問題,需要整合各種信息系統的數據,如電子健康檔案、健康檔案、實驗室檢查系統(LIS)等。以上所述信息系統數據的結構化表達就是采用基于XML的數據表達形式,為計算機系統對這些數據進行自動化處理提供基礎。這個基于XML的結構化表達并沒有涉及到數據本身在語義層面上的關聯性。

為實現這些結構化數據之間的互操作,通常需要引入規范化的術語,使得異構系統之間采用共同的結構化表達方式以及規范化的術語來實現數據表達上的一致性。這種采用統一標準的結構化處理方法限制了現有的不同系統所開發的健康信息系統的整合與數據共享。

健康場景中涉及的數據互操作并非要求我們把不同的健康監測終端、健康信息系統改造成一個統一的標準化系統。我們只需要采用一種國際標準化的數據描述語言作為中介語義實現其異構數據之間的互操作就可以達到目的。

語義數據描述語言為這種數據互操作提供了技術基礎。首先,結構化是語義化的基礎,同時,語義化還實現了面向概念的關聯性描述,支持知識處理與推理,及最大程度的數據共享。

如圖5所示,本體按照描述粒度和概念覆蓋面可以分為三個層次,即上層本體、領域本體和系統本體。上層本體描述了一個領域中最普遍的概念。選擇領域中合適的現有本體作為上層本體可以充分利用現有的權威領域知識,同時,下層不同本體中的概念都可以通過上層本體建立關系,實現跨本體的知識互通;領域本體為領域知識提供了更為細粒度的知識,并可以按照不同的描述側重分為不同的類型,現有的物聯網領域本體可以分為設備描述本體和觀測描述本體;系統本體將特定系統的知識與領域知識相結合,為特定的一個或多個系統制定知識庫,為系統內部的語義搜索、服務組合提供支撐。

圖5 健康物聯網本體體系

3.2 健康信息模型搭建

一般來講,信息模型是對實體的抽象,包括實體的屬性、實體之間的關系以及對實體的操作。在智慧健康場景中,健康信息模型描述實體之間的接口,即接口的數據類型和結構。

通常各個健康應用之間交互的數據結構是不需要暴露給CSE[3]的。在這種情況下,健康應用之間的接口包含一個“容器”子資源。CSE不需要了解容器的內部結構,容器甚至可以被加密。當CSE需要為智慧健康應用提供相關的代理功能時,智慧健康應用應該向CSE暴露其數據類型和結構。

描述健康實體接口結構的信息,即信息模型,包括參數名稱、取值范圍、層級結構等。如果接口使用了過程調用,還需要包含輸入或者輸出參數的信息。

現有信息模型主要由系統專家手動構建,缺乏上層規范、通用知識體系的約束,影響了跨系統數據在知識理解層面上的互通性?;谏瞎澖榻B的本體所構建的知識系統,定義和關聯資源描述schema中的各個標簽名和標簽關系,從而達到不同資源描述schema基于本體互聯互通的目標。

以上介紹所構成的語義本體庫,包括電子健康檔案基礎語義本體庫、健康小屋編號語義庫、監測設備語義本體庫、健康項目語義本體庫。

以健康小屋中身體成分分析終端所采集數據的語義為例,說明如下。

3.3 基于語義的健康應用平臺方案

結合健康應用的特點,參考健康物聯網本體庫定義和健康信息模型,設計基于語義的健康應用平臺方案。該平臺架構如圖6所示。

較之智慧健康基礎應用架構(如圖3所示),該平臺架構在專用網元和應用平臺之間增加了應用支撐平臺(M2M平臺),相應在支撐平臺側增加了M2M語義庫網元。

信息模型在語義物聯網邏輯架構中涉及到資源抽象層和數據層兩個層次。其中,資源描述模型是資源抽象層的核心內容,通過約束屬性及屬性層級關系的方式規范了一個集合內數據信息的描述模型,從而可以屏蔽系統內同層次數據在資源描述模型上的異構;資源描述文件是將具體數據填入資源描述模型后得到的單個資源的映射,屬于數據層。

從知識覆蓋面來說,本體是資源描述的知識源。本體涵蓋了領域/系統中的全部通用知識,資源描述模型結合資源自身特點,選取部分知識節點構造出樹形描述框架。

圖6 基于語義的智慧健康應用平臺架構

圖7 智慧健康業務平臺數據展示界面

從資源使用來說,資源描述是資源開放的實質性內容,用戶通過調用資源描述來獲取資源的信息。本體對用戶可暴露也可隱藏。

從知識的互聯互通來說,跨描述模型的知識互聯互通需要借助物聯網本體來實現,不同描述模型的不同標簽可借助本體的知識全集和關系建立關聯,從而實現知識的跨系統理解。

M2M語義庫主要是按照健康場景和架構定義對健康模型進行語義定義,如健康終端(health device)對其采集數據項(如,blood pressure、heart rate等)語義的含義、取值、關系進行定義。

M2M平臺作為該平臺架構的主要組成部分,主要承擔的基本功能包括健康采集設備和網關的注冊、認證,應用平臺的注冊、認證,還有部分通用支撐能力的保障。針對M2M語義能力的保障,主要體現在M2M語義解析,根據健康領域M2M語義庫的定義,實現各類異構健康數據的解析、標準化。如圖7所示。

基于語義的智慧健康應用平臺,在完成標準語義轉化后可以通過支撐平臺與M2M語義庫交互,在業務層面可滿足多類健康M2M語義建模、語義查詢、語義推理和語義組合;在數據層面,更加便于異構健康數據的相互識別、共享和新型業務模式的構建。

通過實現基于語義的智慧健康應用平臺方案,獨立于各第三方健康應用系統的統一數據表達格式,便于融合各第三方的現有數據,也有利于未來系統功能的擴展,同時,便于知識提取和知識表達,代替現有大量人工干預的枯燥工作。引入知識處理,提高了處理問題的精度和效率;通過提供知識管理與推理,對宏觀把握信息系統提供決策支持,為未來大數據應用奠定基礎。

參考文獻

[1] ITU-T Y.2060: Overview of Internet of Things[S]

[2] oneM2M TR-0007: Study of Abstraction and Semantics enablement [S]

[3] oneM2M TR-0007: oneM2M Functional Architecture[S]

[4] CCSA TC10.語義物聯網中的本體構建和資源描述構建技術研究[S]

[5] 毛峻嶺,賈雪琴,劉紅旗.物聯網語義架構和語義關鍵技術研究[J].信息通信技術,2014,8(5):26-3

[6] Shih Cho Wei,Chen Ming Yen,Chu Hui Chuan,et al.Enhancement of domain ontology construction using a crystallizing approach[J]. Expert Systems with Applications,2011,38(6):7544-7557

[7] Lee Chang Shing, Kao Yuan Fang,Kuo Yau Hwang,et a l.Automatedon to logy construction for unstructured text documents[J].Data &Knowledge Engineering 2007,60(3):547-566

[8] Mohamed Yehia Dahab,Hesham A.Hassan,Ahmed Rafea.TextOntoEx:Automatic ontology construction from natural English text,Expert Systems with Applications 2008,34(2):1474-1480

[9] Amal Zouaq,DraganGasevic,MarekHatala.Towards open ontology learning and fi ltering,Information Systems 2011,36(7):1064–1081

猜你喜歡
本體語義架構
基于FPGA的RNN硬件加速架構
功能架構在電子電氣架構開發中的應用和實踐
眼睛是“本體”
語言與語義
基于云服務的圖書館IT架構
WebGIS架構下的地理信息系統構建研究
基于本體的機械產品工藝知識表示
批評話語分析中態度意向的鄰近化語義構建
“社會”一詞的語義流動與新陳代謝
“吃+NP”的語義生成機制研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合