?

改進的RSS信息推送技術在農地流轉中的應用

2016-01-11 04:10關茜,岳建偉,劉方
遙感信息 2015年1期
關鍵詞:行政區農地用戶

改進的RSS信息推送技術在農地流轉中的應用

關茜1,岳建偉1,劉方1,陳云浩1,宮阿都2

(1.北京師范大學 資源學院,北京 100875;2.北京師范大學 環境演變與自然災害教育部重點實驗室,北京 100875)

摘要:我國農地流轉過程存在雙方溝通不暢、信息不對稱等問題,建立合理有效的信息溝通機制是解決當前農地生產要素合理流動和優化配置的有效途徑之一。本文在分析農地流轉信息推送特征的基礎上,提出將RSS信息技術應用到農地流轉信息推送領域,并探討在RSS信息推送模型中引入地名匹配步驟,進一步提高農地流轉信息推送的查全率、查準率和綜合分類率。

關鍵詞:農地流轉;信息推送;RSS;地名匹配

Improved RSS Information Push Technology in

Transfer of Agricultural Land

GUAN Xi1,YUE Jian-wei1,LIU Fang1,CHEN Yun-hao1,GONG A-du2

(1.CollegeofResourcesScience&Technology,BeijingNormalUniversity,Beijing100875;

2.KeyLaboratoryofEarthSurfaceProcessesandResourceEcology,BeijingNormalUniversity,Beijing100875)

Abstract:There is miscommunication and information asymmetry problem in agricultural land transfer process.Creating a reasonable and effective information communication method is one of the effective means to solve the reasonable flowing and optimized configuration of current agricultural production factors.Based on the analysis of the rural land information push feature,this article proposed applying RSS push technology to the agricultural land transfer area and discussed introducing the place name matching step into the RSS information push model,which can further improve the recall,precision and comprehensive classification rate of the information push process.

Key words:rural land transfer;information push;RSS;place name match

1引言

近年來,我國農地流轉活動愈發頻繁,漸具規模。農戶與農戶之間溝通不暢,缺乏切實有效的溝通機制,已成為影響農地流轉效率和規模的重要因素之一。政府作為農戶之間重要的溝通橋梁,主動式的信息服務能力不足,如何從農民被動尋找信息轉變為主動向農民推送信息,已成為農村信息化建設的一個重要發展方向[1]。簡易信息聚合(Really Simple Syndication,RSS)是一種簡單XML格式,用于為內容整合客戶端提供選擇性的、匯總過的Web內容[2]。RSS技術憑借實時、高效、安全、低成本的特點,成為眾多領域不可缺少的新技術[1]。目前,已有研究探討RSS技術在農業信息化領域中的應用[1,3-4],但是針對農地流轉領域的研究尚未多見。本文研究將RSS技術應用到農地流轉領域,解決農戶間溝通不暢問題,為相關政府部門提供主動式的信息服務機制提供參考。

2基于RSS的農地流轉信息推送技術分析

2.1RSS信息推送技術

RSS是一種用于共享新聞及其他Web信息的數據交換規范,起源于網景的“推技術”,是一種基于XML的Syndication技術,是在互聯網上被廣泛采用的內容包裝和投遞協議[5]。目前國內外許多網站都提供了RSS信息服務。RSS信息推送技術模型如圖1所示[6]。

RSS將網站看作一系列頻道(Channels)的集合,各個頻道又包含一系列資源(Items),因此通過對頻道及所含資源的描述可實現對作為資源整合網站的描述[7]。利用RSS元素描述的網站內容匯總文件稱之為一個RSS Feed。RSS Feed是遵從一定規范的標準XML文件,當前應用最廣泛的是RSS 2.0規范[8]。RSS Feed由網站生成,再由客戶端通過內容整合使用。

2.2農地流轉信息推送對象

農地流轉信息推送對象可以分為買方、賣方和組織管理者三類。買方著重關心農地轉出信息,賣方對農地需求信息更加關心,組織管理者則對流轉的最新動態、流轉政策法規等信息較為關心。通過對實驗區內信息接收對象進行走訪調研,發現信息接收對象在篩選接收到的流轉信息時具有明顯的“地緣性”傾向,比如位于重慶市長壽區的信息接收用戶,會對位于長壽區的流轉信息進行進一步的查閱,而對位于不相鄰行政區的流轉信息則不再查閱,產生這種現象的主要原因是信息接收用戶出于對交通、成本、家庭等因素的考慮,不愿選擇在地理位置上偏遠的流轉地塊。因此,信息接收用戶的“地緣性”傾向可以作為提供信息推送個性化服務的方向。

通過對目前國內較為成熟的農地流轉信息網站發布的信息(農地轉入轉出信息)進行統計,發現農地流轉信息包含具有共性的內容:流轉面積(畝)、流轉價格(畝-1·年-1)、流轉地塊的位置、土地類型、流轉形式(轉包、代耕、出租、轉讓、入股等)、聯系人以及聯系方式,說明這些內容應作為信息推送的主體信息。

2.3基于RSS的農地流轉信息推送機制分析

基于RSS的農地流轉信息推送機制的一般思路是政府將農地流轉網站中發布的信息根據頻道分類(農地轉入信息、農地轉出信息等頻道)后,打包成分門別類的RSS Feed。手機等客戶端根據需求,接收并解析感興趣類別的RSS Feed,從而實現分類別的農地流轉信息的瀏覽;系統根據用戶瀏覽行為的反饋,建立用戶興趣模型,將用戶可能感興趣的信息推送給用戶。推送機制如圖2所示。

圖2 基于RSS的農地流轉信息推送機制

在此,關注的農地流轉僅限于農用地的流轉,即農用地承包經營權的流轉。農地流轉信息即是指農用地承包經營權在流轉的過程產生的信息流實體,具有內容共同性、空間位置信息重要性、時效性等特點。轉入轉出信息普遍包含對農用地的共同屬性的描述;農地流轉的結果造成轉入方因行使農地的使用權而在空間位置上產生移動,轉入方出于成本考慮顯示出對轉入農地空間位置的關心;農地流轉信息隨供需變化不斷更新,因而具有時效性。農地流轉信息推送對象可以分為買方、賣方和組織管理者三類。不同的信息推送對象關注不同內容的農地流轉信息,買方關心農地轉出信息,賣方對農地需求信息更加關心,組織管理者則對流轉的最新動態等單方面或多方面的信息較為關心。通常信息推送對象對農地流轉信息的時效性要求較高,對流轉信息中地名信息關注度高。

基于RSS的信息推送機制由于只涉及到信息分類過程,每個類別中仍包含部分或大量用戶并不關心的信息,因而信息冗余程度仍較高,用戶個性化程度差;信息推薦時,興趣模型忽略了用戶對地名信息的關注度,沒有考慮到信息推薦的地域性差異。在此基礎上,本文提出添加地名匹配步驟的農地流轉信息推送機制:①改進RSS信息推送模型。在原有RSS信息推送模型的基礎上,添加地名匹配步驟,篩選出用戶感興趣的行政區范圍內的農地流轉信息。②改進個性化用戶興趣模型。在原有的RSS三層興趣模型的基礎上,添加地名匹配步驟,進一步提高推薦信息的準確度。

3考慮地名匹配的RSS農地流轉信息推送技術研究

3.1基于RSS和地名匹配的農地流轉信息推送流程設計

由于地名信息是土地流轉信息中非常重要的一部分,大多數用戶會通過地名來尋找土地。而且地名之間存在包含與被包含的空間關系,所以在進行土地流轉信息推送時要著重關注地名信息。地名匹配即將地名與基準行政區劃數據庫中的地名屬性做比較,找到其對應的行政區劃編碼,根據編碼規則判斷是否含有下級行政區劃。如果含有,則返回下級行政區劃名,并根據這些行政區劃名排除干擾信息的過程。若對一組地名進行匹配分析,則找到對應行政區劃編碼后選取較小行政區域的行政區劃編碼進行判斷。

圖3 基于RSS和地名匹配的農地流轉信息推送機制

3.2考慮地名匹配的RSS信息推送模型

農地流轉信息具有內容共同性,其中地名信息是必不可少的屬性之一。將地名匹配步驟納入到RSS信息推送模型研究的基本思想是在各個類別的農地流轉信息中添加必要的地名信息,并生成包含地名信息的RSS Feed文件。用戶訂閱某些類別的農地流轉信息時指明所關心的行政區范圍。系統在該類別的農地流轉信息RSS Feed中,通過地名匹配步驟篩選出包含用戶訂閱的行政區范圍下地名信息的信息條目,將這些信息條目推送給用戶。信息推送模型如圖4所示。

圖4 考慮地名匹配的RSS信息推送模型

3.3顧及空間位置鄰近的RSS用戶興趣模型改進

通過地名匹配步驟可以嚴格地篩選出某一行政區范圍內的信息條目,但存在其他情況比如某一用戶身處行政區交界處附近,該用戶除了關心自身所在行政區內的信息,也比較關心相鄰行政區的農地流轉信息??紤]到這種情況,研究考慮空間位置鄰近的RSS用戶興趣模型,將潛在的用戶可能感興趣的信息主動推送給用戶。該模型的基本思想是在原有的RSS 3層用戶興趣模型的基礎上,引入地名數據層,構成基于RSS數據源的4層用戶模型結構,在原關鍵詞權重TF-IDF算法中添加地理空間鄰近度因子,對地名關鍵詞根據空間位置關系計算權重,地名關鍵詞權重與空間鄰近度成正相關關系,從而實現考慮空間位置鄰近的用戶興趣信息推薦,模型如圖5所示。

圖5 顧及空間位置鄰近的RSS用戶興趣模型

關鍵詞原基于RSS數據源的用戶興趣模型權重TF-IDF算法[9]:

(1)

關鍵詞其中,ni,j是該在文件dj中的出現次數,關鍵詞就是將文件dj文本分詞后,剔除其中對于用戶興趣建模無意義的詞(感嘆詞、介詞、連詞、象聲詞和助詞等)之后剩下的詞[4],分母則是在文件dj中所有關鍵詞的出現次數之和??紤]到關鍵詞出現的位置,如式(2)所示。

TF=?×ptitle+β×pdes+γ×ptext

(2)

摘要式中,?、β、γ分別表示關鍵詞出現在標題、和信息體原文中的頻率;ptitle、pdes、ptext分別表示關鍵詞為標題、摘要和信息體原文的權重值,為大于0小于1的參數值[10]。

(3)

TFIDFi,j=TFi,j×IDFi

(4)

轉入和轉出地塊信息包含共同的關鍵信息地塊所在行政區域、地塊面積、地塊價格和土地利用類型。提取上述4個關鍵詞作為農地轉入用戶和農地轉出用戶的興趣信息模型關鍵詞。組織管理者依照個人需要可能對農地轉入、農地轉出、交易動態、法律法規等一個類別或多個類別感興趣,使用行政區區域關鍵詞構建用戶興趣信息模型。進行分詞時,構建行政區域、地塊面積、地塊價格和土地類型詞庫樣本,準確提取上述4類信息,并對4類關鍵詞賦予較高的權重值,對于行政區域關鍵詞,還需要在原權重值的基礎上考慮空間鄰近度因子??紤]空間位置鄰近的關鍵詞權重TF-IDF算法。

TFIDFi,j=TFi,j×IDFi×Q(z)

(5)

關鍵詞式(5)中,Q(z)為分段函數,Q(z)=1時表示行政區和用戶訂閱的行政區相同,否則根據行政區與毗鄰情況逐級遞減。表1為重慶市部分區縣間的空間臨近度因子。

表1 重慶市部分區縣間的空間臨近度因子

關鍵詞在初始階段,系統根據用戶的類別按照上述用戶興趣信息模型提取,計算關鍵詞的權重并將相關信息推送給用戶。通過用戶瀏覽反饋積累一定數量的用戶興趣樣本后,可以對某個用戶的興趣數據進行TF-IDF關鍵詞權重計算,得到該用戶感興趣的其他關鍵詞加入該用戶的興趣信息關鍵詞模型,從而更新該用戶興趣信息關鍵詞模型。

4模型驗證

本文以重慶市為例,建立農地流轉網站,在網站中設置農地轉入、農地轉出、最新動態、政策法規4個頻道,在每個頻道下面錄入包含地名信息的信息體,并給每一個頻道發布添加地名匹配步驟的RSS服務。開發基于Android的RSS客戶端軟件,在軟件登錄時,模擬買方、賣方和組織管理者3類用戶,分別訂閱農地轉出信息(A)、農地轉入信息(B)和最新動態信息(C)3類信息,并假定3類用戶關心的行政區范圍為重慶市長壽區。采用信息獲取中的監測評估標準查準率(Rprecision)、召回率(Rrecall)和F1綜合分類率進行模型驗證。查準率、召回率和F1測試值的計算公式如下:

(6)

(7)

(8)

式中,m為系統推送的相關信息體數目,l為系統總的推送的信息體數目,n為所有相關的信息體數目。

經實驗,改進前后的RSS信息推送及推薦模型的實驗結果比對見表2(表中以斜線分隔改進前后的結果)。

表2 改進的RSS信息推送及推薦模型測試結果前后對比

關鍵詞注:實驗中,式(2)的?、β、γ均設為1,即不考慮出現位置的影響。

doi:10.3969/j.issn.1000-3177.2015.01.022

中圖分類號:TP274文獻標識碼:A

收稿日期:2013-12-09修訂日期:2014-02-19

基金項目:福建省科技計劃重點項目(2014Y0032);福建省自然科學

作者簡介:賀曉暉(1989~),女,碩士研究生,研究方向為空間分析及空間決策支持系統。

通訊作者:陳楠(1975~),男,副研究員,博士,研究方向為地理信息建模與分析技術。

原RSS信息推送模型只是粗略地對信息類別提供定制和聚合,并沒有對信息內容提供進一步的篩選和過濾,信息推薦時也沒有根據信息推送對象建立用戶興趣信息模型。由實驗結果可以看出其應用于農地流轉信息推送領域存在了大量的信息冗余,信息的查全率、查準率和綜合分類率不高;在原RSS信息推送模型中添加地名匹配步驟,在類別定制的基礎上添加對信息內容體的地名匹配過濾,篩選出用戶真正感興趣的數據,并通過提取用戶興趣關鍵詞的用戶興趣推薦模型對推送信息進行補充,應用于農地流轉領域得到了較好的查全率、查準率和綜合分類率,說明添加地名匹配步驟的信息推送模型改進是可行的。

5結束語

本文利用RSS技術在信息推送方式上的動態性、時效性等特點,將其應用到農地流轉信息推送領域,并引入地名匹配技術彌補RSS技術個性化服務不足的缺點,具有一定的現實意義。實驗表明,改進后的信息推送模型相比原始模型提高了信息推送準確度,同時保證了一定的信息召回率。目前模型正處于理論驗證階段,還存在很多問題:①使用其他算法計算空間臨近度因子,比如坐標計算等進一步提高臨近度因子的合理性;②獲取更合理的TF-IDF值,根據關鍵詞出現在標題、摘要和正文中的位置設置不同權重、考慮用戶長短期興趣的影響以及提高分詞結果的準確度進一步提高TF-IDF的計算結果準確度;③用戶興趣信息關鍵詞的權值對結果影響較大,參數設定問題是今后研究的重點。

參考文獻:

[1]曾慧敏,陽衛文.RSS信息推送技術在農村信息化中的應用[J].新農村建設,2010,(7):21-24.

[2]周艷,陳永健.基于RSS技術的信息發布系統設計與實現[J].北京聯合大學學報(自然科學版),2008,22(4):40-43.

[3]王政嘉,李征,王健.基于RSS技術的移動化農業信息服務系統研究[J].河北農業科學,2011,16(1):99-102.

[4]郭立軍,朱群雄.基于RSS數據源的用戶興趣模型改進及應用[J].北京化工大學學報(自然科學版),2011,38(1):125-129.

[5]彭召波,武友新,馮豫華.RSS技術在信息發布系統中的應用研究[J].計算機與現代化,2006,(9):67-69,80.

[6]于金海,郭軍成.基于RSS的圖書館網絡信息推送服務[J].科技情報開發與經濟,2007,17 (29):38-39.

[7]袁勇智.基于RSS的Web信息發布和集成技術[J].現代圖書情報技術,2004,(2):60-62.

[8]Berkman Center for Internet & Society at Harvard Law School.WIncr D.RSS 2.0 Specification[EB/OL].http://blogs/law.harvard.edu/tech/rss,2006-10-09.

[9]方延風.科技項目查重中特征詞TF-IDF值計算方法的改進[J].情報探索,2012,(1):1-3.

[10]王平,朱明.基于RSS信息源建模與更新[J].計算機仿真,2005,22(12):45-48.

E-mail:395400558@qq.com

E-mail:fjcn99@qq.com

猜你喜歡
行政區農地用戶
京字頭
農地細碎化對農地流轉的影響
農村土地流轉問題及對策研究
上榜派出所統計表
上榜派出所統計表
小田變大田破解農地零碎化
關注用戶
關注用戶
關注用戶
當前農地產權與流轉制度改革研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合