?

XML數據交換技術在中醫智能化診斷數據集成中的應用

2015-12-02 20:37余江維余泉
現代電子技術 2015年22期
關鍵詞:數據集成中醫

余江維+余泉

摘 要: 在中醫四診信息融合智能化診斷系統中,四診信息來自于多個不同的異構數據源。針對目前數據集成問題的研究現狀,分析異構數據源的結構,結合中醫智能化診斷系統,利用XML Schema設計MDD(元數據字典)的通用模型、處理XML文檔的DOM對象模型、以及數據庫連接的OLE DB技術,提出一種以XML文件為中介的數據集成方法,實現了中醫智能化診斷系統中四診信息的有機集成。

關鍵詞: 中醫; 智能化診斷系統; 數據集成; 異構數據源; XML

中圖分類號: TN958?34; TP391.4 文獻標識碼: A 文章編號: 1004?373X(2015)22?0048?03

0 引 言

中醫智能化診斷是根據中醫的四診理論,利用計算機人工智能技術進行中醫證候的自動化診斷過程。在此過程中,計算機對中醫知識的獲取、表現方式及內部的推導機制是核心內容。中醫的四診包含望診、聞診、問診、切診等諸方面。本研究主要探討在四診信息的獲取中,四診信息異構數據源的集成問題。

1 異構數據源

當前數據信息源在形式上差別較大,無統一模式。數據庫類型、運行平臺、數據格式、數據的加載和卸載方法等千差萬別。在異構數據源環境中,有文本、Oracle,Sybase,SQL Server,DB2,Access等多種類型。

不同數據源有不同的存儲結構、組織表達形式、信息描述等差異,進而造成數據的抽取困難。在異構數據源環境中,必須建立一個數據源與數據源之間的中間層,作為數據通信的中間接口。集成數據庫的命令通過中間接口傳送到不同的數據源;各數據源把發送的數據轉換成中間接口的格式,通過中間接口發送到集成數據庫中[1]。

2 中醫智能化診斷系統框架

按中醫四診原理,智能化診斷系統由舌診、脈診、面色診、問診及穴位診等子系統組成,其構架如圖1所示。其中,綜合診斷系統與SQL數據庫在服務器端,其他子系統位于不同PC的客戶端。各子系統之間、子系統與綜合診斷系統之間存在異構性。

3 XML數據交換技術

XML又稱為可擴展標記語言(Extensible Markup Language),是一種元標識語言,提供了結構化資料的一種自我描述,是一種開放的數據結構。XML不但描述數據內容,而且描述數據的結構,使數據之間的關系得到很好的體現。XML具有結構化程度高、平臺獨立性強、保存格式簡單、便于擴充延展及網上傳輸等特性,因此XML非常適合于不同數據庫間的信息交換。以XML為中介實現數據交換是當前研究的熱點,正成為網絡資料交換的標準。

XML數據交換,一是從數據源中抽取交換的數據,轉化為XML交換文檔;二是對交換文檔的格式進行轉換,并映射數據源和目的庫中的相關字段,進而把數據載入到目的庫中。在不同的應用系統中,采用統一的XML標簽和格式生成XML文檔,是實現數據動態交換的基本要求。

目前常見的數據交換技術主要有[2]: EDI系統、中介層、數據倉庫和中間數據等方式。XML采用中間方式,利用XML文件作為中間數據,提供數據通用格式,達到數據交換的目的。

4 基于XML的Web異構數據源之間的數據集成

數據集成是將多個數據庫、數據多維立方體或一般文件中的數據,存放在一個格式統一的數據庫中。

在數據集成的邏輯關系中,Web服務在客戶與數據倉庫之間??蛻魧颖仨毥涍^XML接口訪問數據源數據,保證了源數據的安全。標準XML編碼,能很好地支持異構數據源之間的數據交換;同時,基于HTTP和SOAP協議的Web服務技術,讓數據可以無障礙地越過防火墻。邏輯結構如圖2所示。

元數據(Metadata)是“關于數據的數據”,是對數據源信息的描述[3],是標準的XML文件。元數據字典(MDD)對元數據進行管理,依靠XML的XML Schema技術設計和建模,與公共數據模型保持一致性,方便與XML數據集成器合作。元數據字典必須注冊所有參與的數據源。

XML數據集成器并不存儲具體數據,只存儲所有數據的集成模式。XML數據集成器,對客戶層屏蔽數據源的差異,向客戶層保證相同的數據視圖,充當數據總線,把實際數據源轉變成用戶數據視圖。對不同數據源的數據,用XML Schema技術設計一個公共數據模式(Common Data Model,CDM)進行統一處理。不同數據源有不同的模式,對他們進行集成時,數據字典(MDD)是解決他們異構性[4??5]的重要方法。

(1) 命名異構:一是相同的對象和屬性在不同的源數據中用不同的名字表示(異名同義),二是不同的對象用相同的名字表示(同名異義)。命名異構成為不同模式之間語義沖突的重要原因。在設計集成系統時,必須在元數據字典(MDD)中利用一個統一的名字表示每個數據源相應的字段。例如商品的價格,在兩個數據源中,一個用price,一個用cost,在MDD中統一用Price表示。

cost

(2) 結構異構性:指元數據信息的組成方式在數據源間各不相同。用定義全局模式的方法解決。關心的數據成分在全局模式中定義,并許可在集成數據時讓某些成分為空(Nul1)。

例如,在定義全局模式時,允許價格(Price)為空。

·····

(3) 值的異構性:數據單位、數據精度在不同的數據源中不同??梢栽谠獢祿卸x數據單位、數據精度,進而與全局模式中定義的數據進行響應轉換。

price

(4) 數據模型的異構性:不同數據源通過各自的Wrapper/Agent解決數據模型的異構性。首先定義一個公用的統一的數據模型(CDM),再把從單個數據源中提取的局部數據轉換成CDM中間模型數據。事實上,單個數據源通過自身的Wrapper/Agent結構,就能把從中提取的局部數據轉變成符合CDM要求的XML文檔數據。

(5) 時間異構性:隨著時間的推移,數據源的結構描述、屬性表示和取值發生變化??梢酝ㄟ^MDD管理軟件對數據源的元數據描述進行增添、刪除或修改。

6 結 語

在數字化網絡化信息環境中,以XML為代表的技術體系已經成為信息組織、處理和交換的基本技術。XML技術和數據庫技術的結合,得到廣泛使用。本文介紹了基于XML數據交換的實現原理,分析了利用MDD解決模式集成中異構性的方法,以及在中醫智能化診斷系統中的主要應用。實驗表明,基于XML Schema技術設計的MDD模型能夠高效地管理異構數據源數據[6]。XML數據交換技術在中醫智能化診斷系統中,對異構數據源之間的數據交換與集成有非常重要的作用。

參考文獻

[1] 謝星峰,鄒平.基于異構數據庫環境數據抽取的系統結構研究:Java和XML的解決方案[J].計算機與數字工程,2005,33(3):28?30.

[2] 王松旺,樊秀娥,姜韜,等.XML數據交換技術在公共衛生科學數據共享中的應用[J].中國衛生工程學,2007(1):49?50.

[3] ELISA B, ELENA F. XML and data integration [J]. IEEE Internet Computing, 200l, 11(12): 75?76.

[4] BERTINO E, CATANIA B. Integrating XML and databases [J]. IEEE Internet Computing, 200l, 7(8): 84?88.

[5] CHANG Y S, HO M H, YUAN S M. Aunified interface for integrating information retrieval [J]. Computer Standards&Interfaces, 2001, 6(23): 325?340.

[6] 盧正鼎,張素智.集成Web數據的系統框架與實現方法[J].小型微型計算機系統,2003,24(10):1759?1762.

猜你喜歡
數據集成中醫
中醫英譯的誤譯現象探析
關于中西醫結合治療乳腺增生病38例臨床觀察
成本與制造數據集成分析
基于Biztalk的異構醫療信息系統數據集成研究
信息系統集成與數據集成策略研究
基于數據集成的水上項目國家隊數據庫網絡管理平臺的設計與開發
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合