?

空間數據智能分發的用戶偏好模型研究

2016-08-16 05:58熊劍李新廣王力斌
城市勘測 2016年2期
關鍵詞:樹結構空間信息空間數據

熊劍,李新廣,王力斌

(1.武漢市勘察設計有限公司,湖北武漢 430022; 2.河南工業大學,河南鄭州 450001)

空間數據智能分發的用戶偏好模型研究

熊劍1?,李新廣2,王力斌1

(1.武漢市勘察設計有限公司,湖北武漢 430022; 2.河南工業大學,河南鄭州 450001)

空間數據量的急速膨脹與其獲取效率低下之間的矛盾日益突出??臻g數據的智能分發是解決該問題的有效途徑,用戶偏好模型是空間數據智能分發研究的關鍵瓶頸。本文結合當前主流的空間信息元數據標準,提出一組能夠反映空間數據特征和用戶興趣的核心元數據作為建模指標,并在此基礎上給出空間數據的用戶偏好模型的模型結構。

空間數據智能分發;用戶偏好模型;空間元數據;建模指標

1 引 言

近年來,隨著地球空間信息學[1]相關技術的快速發展,空間數據量急速膨脹,人們對空間信息的依賴程度不斷加深??臻g數據的海量特征與其獲取效率低下之間的矛盾日益突出??臻g數據的智能分發[2]是解決該問題的有效途徑,用戶偏好模型[3]的優劣是制約空間數據智能分發質量的關鍵因素。由于空間數據量大、結構復雜、分布式異構存儲等特征,如何準確和高效地構建用戶偏好模型是長期困擾空間數據智能分發研究的難題之一。本文結合當前主流的空間信息元數據標準,提出一組能夠反映空間數據特征和用戶興趣的核心元數據作為建模指標[4],并在此基礎上給出空間數據的用戶偏好模型的模型結構,從而為空間數據的智能分發奠定基礎。

2 空間數據智能分發的建模指標

空間元數據是關于空間數據或資源的標識、覆蓋范圍、質量、空間和時間模式、空間參考系等的信息[5],能夠比較客觀、全面地描述空間數據的各方面特征,是實現空間數據共享的基礎。元數據標準一直是空間信息領域的研究熱點,主流的空間元數據標準包括: CEN/TC 287的元數據標準[6]、FGDC的元數據標準[7]、ISO/TC211的元數據標準[5]等。

盡管各空間元數據標準定義了眾多的元數據元素,以全面描述空間信息或數據,但在空間數據的分發過程中,用戶能夠涉及的檢索點(檢索元素)通常十分有限,且一般比較固定,元數據標準所描述的元數據項大多數并沒有參與檢索。據此,孫鵬選取主題、題名、地理覆蓋范圍、時間覆蓋范圍、日期、類型、格式標識符等10個具有普適性的元數據項作為核心檢索元素,用以描述用戶的檢索興趣點[8],如表1所示。

空間數據核心檢索元素[8]表1

本文通過分析主流的空間元數據標準,結合現有的一些空間數據分發系統的研究成果,選取一組核心元數據,作為建模指標,以構建空間數據智能分發的用戶偏好模型(如表2所示)。表2中,空間范圍是一片沿經緯度方向均有一定連續范圍的空間區域,它描述空間數據的覆蓋范圍??臻g參考系與空間范圍相對應,它描述空間數據的參考系,是對空間范圍信息的補充。像元分辨率(比例尺)元素包括兩種情況:對于遙感、攝影測量等影像數據,指像元分辨率;對于一般的測繪成果、數字化地圖數據等,指地圖比例尺。成果類型指數據的載體類型、表達形式、用途等的分類。時間元素主要指空間數據的生成時間。

空間數據的核心元素集 表2

3 用戶偏好模型的形式化表達

空間數據的用戶偏好模型描述用戶的空間數據需求特征,是空間數據智能分發的依據?,F有的相關研究[2,3,9]主要集中于空間范圍、頻譜范圍等具有區域/區間特征的建模指標的表達,空間參考系、成果類型等指標并未得到充分研究,且模型的效果并不理想。本文采用表2的核心元素作為建模指標,并擴展以上文獻的模型,擴展后的模型形式化表達如下:

(1)

其中,X={x1,…,xi,…,xs},W={w1,…,wi,…,ws},R={R1,…,Ri,…,Rs},V={V1,…,Vi,…,Vs}。xi依次為空間范圍、比例尺(像元分辨率)范圍、時間范圍、空間參考系、成果類型等建模指標,s為建模指標的個數;wi為xi的權值,由用戶的空間數據檢索反饋次數確定;Ri為xi的分布范圍和步長,根據建模指標的不同,其形式也不相同;Vi為反映xi分布特征的數值矩陣或向量,其形式和內容由用戶對空間數據相應指標的檢索反饋值決定。

圖1 偏好模型樹結構的實例

4 用戶偏好模型的樹結構

開放目錄結構[10]是互聯網上最大的人工編制的分類檢索系統,它是由來自世界各地的眾多志愿者共同維護與建設的最大的全球目錄社區?;陂_放目錄結構的偏好語義模型[11]是用戶偏好建模的一個研究熱點,但該方法不適合空間數據的用戶偏好建模。本文采用偏好語義模型的描述方法,給出空間數據的用戶偏好模型樹結構的定義如下:

[定義1]偏好模型為一棵倒立的樹結構TP,每一棵樹描述了一位用戶的空間數據偏好特征。樹結構包含五個一級子結點,分別代表空間范圍、像元分辨率(比例尺)、時間、空間參考系、成果類型等指標的偏好模型分量。

[定義2]樹中的每個非葉子子結點定義為node= {keyword,mark,children}。keyword為代表偏好模型分量的結點關鍵詞,mark為關鍵詞權重,children為子結點結構。

注:空間參考系的葉子結點指倒數第二層結點,底層結點為葉子結點的屬性。nc.mark為相應葉子結點的權值,取值為1。

[定義4]用戶描述文件FP是用戶偏好模型TP 的XML表達。

圖1是用戶偏好模型樹結構的一個實例。圖中,用戶偏好模型是一個樹結構,由空間范圍、空間尺度、時間、空間參考系、成果類型等模型分量組成,分別描述相應指標的用戶需求。根據重要性的不同,各模型分量被賦予不同的權值。不同類型指標的取值單元也不相同,空間范圍采用區域數,像元分辨率、低時效時間等采用區間數、空間參考系、成果類型等采用點值。

5 結 語

地球空間信息學相關技術的快速發展使得空間數據量急速膨脹,面對海量的空間數據我們顯得無所適從。如何使用戶能夠準確、及時地獲取所需的空間數據已成為空間信息領域亟待解決的迫切課題??臻g數據的智能分發是解決該問題的有效途徑,用戶偏好模型的構建是制約空間數據智能分發質量的關鍵瓶頸。本文采用一組能夠反映空間數據特征和用戶興趣點的核心元數據作為建模指標,提出了空間數據的用戶偏好模型的建模方法。實驗表明,采用本文方法所構建的用戶偏好模型能夠較為準確地描述用戶的興趣點,根據該用戶模型分發的空間數據基本上滿足用戶的真實需求。

[1]李德仁.攝影測量與遙感學的發展展望[J].武漢大學學報·信息科學版,2008,33(12):1211~1215.

[2]夏宇,朱欣焰.利用區間分析的空間信息智能分發決策[J].武漢大學學報·信息科學版,2013,38(9):1103~1107.

[3]李新廣,范明虎,杜武.面向空間信息智能分發的動態化用戶偏好模型研究[J].測繪學報,2011,40(5):646~654.

[4]Hwang C,Yoon K.Multiple Attributes Decision Making:Methods and Applications[M].Berlin Heidelberg:Springer-Verlag,1981.

[5]ISO19115.Geographic Information-Metadata[S].2003.

[6]譚娜.基于XML的空間信息元數據管理系統[D].開封:河南大學,2004.

[7]蔣景瞳,劉若梅,賈云鵬.國際原數據標準的發展和研究現狀[M].北京:科學出版社,1999.

[8]孫鵬.基于元數據映射的分布式空間數據檢索方法及其應用[D].武漢:武漢大學,2009.

[9]Xinguang Li,Yang Liu,Yunhua Li,et al.Collaborative distribution of remote sensing data based on user profile similarity[C]. Proceedings of Ninth International Symposium on Multispectral Image Processing and Pattern Recognition,Enshi:SPIE,2015.

[10]臧鋮.個性化搜索中隱私保護的關鍵問題研究[D].杭州:浙江大學,2008.

Research on User Profile Model of Spatial Data Intelligent Distribution

Xiong Jian1,Li Xinguang2,Wang Libin1
(1.Wuhan Geotechnical Engineering and Surveying Co.,Ltd.,Wuhan 430022,China;2.Henan University of Technology,Henan Zhengzhou 450001,China)

Contradiction between rapid expansion of space data and its acquisition inefficiency is increasingly prominent.Intelligent distribution of spatial data is an effective approach to solve the problem,and user profile model is the key bottleneck of study on intelligent distribution of spatial data.In this paper,combined with spatial information metadata standards in current mainstream,a group of core spatial metadata that can reflect the features of spatial data and user interest are put forward as decision indexes.And on this basis the model structure of user profile model of spatial data is given.

spatial data intelligent distribution;user profile model;spatial metadata;modeling index

1672-8262(2016)02-25-03中圖分類號:P208.1

A

2016—01—19

熊劍(1978—),男,高級工程師,主要從事工程測量、GIS應用與研發、空間數據挖掘方面的工作。

河南省教育廳科技攻關項目(13A420174);河南工業大學博士基金項目(2012BS017)。

猜你喜歡
樹結構空間信息空間數據
結合多層特征及空間信息蒸餾的醫學影像分割
馬克思與列寧的“社會主義”各有什么不同?
GIS空間數據與地圖制圖融合技術
四維余代數的分類
基于作戰環的空間信息時效網關鍵節點分析模型
基于物聯網的智能空間信息共享利益模型研究
基于μσ-DWC特征和樹結構M-SVM的多維時間序列分類
基于天地圖的地理空間信息服務系統設計與實現
網格化存儲的幾項關鍵技術分析
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合