?

基于網格技術的數字圖書館跨庫檢索優化方法研究

2021-11-22 18:27于文萍
電子技術與軟件工程 2021年12期
關鍵詞:沙漏資源共享檢索

于文萍

(江蘇聯合職業技術學院徐州財經分院 江蘇省徐州市 221000)

人類隨著互聯網的普及從而擁有了新的獲取知識的途徑。新工具改變了人們的生活方式,將大的研究環境進行了改革,更是在知識范圍上更上一層樓。這使得人類文明有了較大的進步,在諸多方面有了更多的便利。生活方式、文化內容、社會結構在新技術的推動下有了曠古絕今的改變。Internet的橫空出世不但讓人們思考問題的方式出現變化,更是對于生活有了新的理解。第一代Internet以E-mail為主要應用,靠著TCP/IP協議將世界各地的計算機緊緊相連;Web信息瀏覽和電子商務應用等作為第二代Internet的介質,將全球的網頁聯通;第三代的Ineternet有了前兩代的經驗,嘗試著將多項網絡資源進行大規模的連通整合。而網格將計算形成組織,讓用戶訪問所需資源打破原本的局限,從而得到了充分的資源利用,故網格對于操作系統而言也被稱作是“中間件”,其憑借著優異的成績成為了新興技術的核心。網格與電力網的運行有著相似之處,是一種面向應用和問題的新型技術。作為圖書館的核心問題,有序的信息組織和分布式的跨庫檢索尤為重要,大并發量的訪問和海量信息的檢索查詢,及科技文化信息的資源共享都是數字圖書館將要面臨的巨大挑戰,想要達到目的就要實現信息或者知識檢索的快準全,在這個以人為本的社會,用戶的體驗性也是一個重點,用戶對于個性化服務的需求日益增加,將網格從時間和空間中來將內容進行分化,充分的把其中的資源利用才是數字圖書館的主要目標。不僅如此,根據客戶需求,將網格之中的豐富的文化資源和科學知識通過多對多的形式,將學校企業等社會部門作為介質來傳送至每個有需求的角落之中,讓數字圖書館在建設的同時為新時代大門添上一把鑰匙,更讓其作為發展的催化劑,發揮出更大的作用。

1 網格技術及特點

1.1 網格技術

我們可以把網格看作一個超級的資源池,它將世界所有計算機整合到一起,通過互聯網使之變成一臺超級計算機,把全球的資源來通過一系列手段處理,從而實現全面化共享,其涵蓋范圍廣,內容極其豐富。消除資源共享,做到資源共享是網格的根本特點[1]。將范圍縮小到地區,網格同樣可以落戶至家庭,甚至于構造個人網格,想要更好的理解網格的概念,羅列以下三點:

(1)從目標入手,資源共享是網格主攻的大方向,分布協同工作為資源共享錦上添花,兩者一同組成網格的核心目標。

(2)本質,任何一個技術手段的本質都應該是技術。

(3)網格是計算機設備和服務及其數據的基本設施[2]。

現如今,伊安?福斯特等早期提出的五層沙漏結構和以IBM為主,考慮Web技術,在伊安?福斯特等結合Web Service提出的開放網格服務結構OGSA是較為重要的兩個網格體系結構。

1.2 網格特點

作為數據源、高性能計算機、因特網三種科技所進行有機組合和發展的產物,網格與因特網作比有著以下特點:

(1)高性能:因為網格對比現有的因特網有著更大的范圍,其擁有更多高性能的計算機,從而大幅度的提升了計算速度和數據處理速度;網格的體系對比于因特網能更好更高效的利用資源,例

如網格的有一獨門武器,它可以極大的縮減距離,挑選最近的服務器進行投放,他就是廣域緩存。這一能力為數字圖書館的大數據處理提供了強有力的技術支持[3]。

(2)集成性:網格可以將地理位置上分布的各種資源集成為一個整體,這個有機的整體從邏輯上看就像一臺計算機,對用戶而言可以如同使用自己計算機一樣方便的使用各種網絡上的資源,這樣合成功能出現在了多個聯合的資源之中,原本有限資源的局限性就這樣被打破,用戶的體驗感得到了進一步提升,資源得到了更充分的利用。網格繼承了各個領域的核心手段,從而高效率的解決了數字圖書館計算資源困乏和存儲空間不足這一巨大難題[4]。

(3)資源共享性:通過云端數據可以大幅度擴大資源庫,從而達到更大程度的資源共享,擴大了傳統因特網的數據庫,讓各領域資源在其中達到共享,實現數據利用的最大化。

1.3 網格的結構

1.3.1 五層沙漏結構

這種結構并不強調協議定義,而是將協議變為了核心,以強調API和SDK的重要性為主,偏向于對定位進行描述,從底層開始,構造、鏈接、資源、匯聚、應用五層共同組成了沙漏模型[5]。將各個構層拆開看,構造層包含著資源中的物理一類,如存儲等,其控制整個沙漏結構,管理著整個結構的運行,可以看作結構的基石,通過沙漏結構向上提供一個連接點,從而保證了各層的數據互通,

根據上一層的協議,網絡資源層應運而生,它提供各部門流動的大門。

將局部資源作為考慮的主體,而匯聚層則把握著大局,控制著全局的狀態。其上則是匯聚層,顧名思義,多種資源協同,在以所擁有資源為基礎的前提下進行高一級應用的運行,在通用情況下正常處理,在特定情況下采取特殊手段。

應用層將各層資源整合,利用可調配的資源滿足其所需,讓其更好的在虛擬的組織環境中高效且合理的存在。。以電力系統作比,前四層如同發電廠、電網、配電所及配電房,而應用層則為居民住宅中的各個電力設施,它憑借沙漏一般的特性,以鏈接和資源兩層為主,逐層形成瓶頸來為資源提供一個具有強大安全性的訪問能力。

1.3.2 OGSA模型

在2002年6月,GGF之中一個名為OGSI的小組制定出了一個全新的架構,其開放式的特點引來了各界關注,它不僅將網格建造中的必須的組件羅列,更定義了網格的編程模型,給出了一個全新的解決方案,通過網格解決一個企業類成為了一個全新的解決問題的手段。OGSA如同沙漏結構,層層息息相關,將資源利用和技術革新帶到了一個全新的高度,通過聚合物理層,提供了許多從前無法想象的額外功能。以邏輯亦或者是物理角度來看,所有的網絡資源歸根結底都是為了服務,其主要有著程序的執行,數據服務和核心服務等等。OGSA的一切都表示為遵循一套規范的網格服務。以網格服務為中海好處如下:

(1)由于組件虛擬化,一對一的核心的接口讓更有層次結構的服務應運而生, 更高級別的服務跨越了從前抽象的定義,以全新的方式統一看待。

(2)因為虛擬化的的存在,許多從前不可能映射到現實的物理資源進入了現實世界,這一具有重大意義的革新讓服務有了全新面貌,使得服務進行時不再有原本的束縛。

(3)開放OGSA的意義在于其廣泛性,將以科學和工程計算為核心的學術擴展為主要特征為系統服務的社會經濟活動領域。

2 數字圖書館跨庫檢索平臺現狀

跨庫搜索的本質實則時通過一個叫做“智能搜索器”的程序接收客戶的請求,通過客戶的請求進行一個內部的轉化,把其變為能讓數據庫接受的格式,再將請求進一步發到其對應數據庫之中,從而得到結果后轉化為統一格式,發回到請求用戶手中?,F今,國內的清華同方的USP檢索平臺以及國外多個知名平臺均已推出跨庫檢索服務。

上述產品的出現在為信息資源訪問提出便利的同時也暴露出一些問題和不足,主要如下:

(1)多數數據庫被諸多不利因素影響導致沒能將資源利用率發揮到極致。

(2)在電子資源庫高速發展數量大幅度上漲的大環境之下,使用者難以逐次提選擇提交,被目標所束縛。

(3)平臺本身的建設方面還存在不足,智能化程度有待提高,個性化建設仍需進一步發展。

(4)因數據庫激增,導致了數據庫多、雜、亂、難以將標準統一,對設計系統有著極大的挑戰性,從而導致了難度的提高。

3 優化基于網格技術的數字圖書館跨庫檢索系統

3.1 優化目標

(1)將檢索界面大幅度統一:用戶能隨時隨地訪問數字圖書館網格范圍內的信息,從而更方便快捷高效。

(2)將資源進行巧妙整合:憑借單個圖書館所擁有的存儲量顯然難以和大量的數據庫相提并論,網格技術的出現解決了這一難題,其通過強大的資源調度能力將眾多圖書館資源強力整合,清晰的資源視圖打破了傳統的存儲瓶頸。

3.2 優化方法

(1)現如今,在各個高校、科研機構亦或者是數據庫上處均可以看到數字圖書館資源信息資源的影子。各方面機構在遵循規范的前提下,大可輕松加入系統,在可實現的范圍內在可實現的范圍內,將資源共享,這一操作不但進一步提高了資源的利用,更是巧妙地融入了生活之中。

(2)網格技術有一個顯著的特點,其有著優秀的資源調度能力,這一能力甚至于可以跨組織進行,它能解決諸多共享及協作問題,甚至對參與方諸多的檢索平臺進行協調。

3.3 優化效果

將分散的數字圖書館利用網格的特點,憑借著中間件GT4來構建一個全新的模型,其開放式的架構,通用技術極其規范,恰好可以完美的契合,共同整合為網格服務,

(1)網格的相關服務與核心技術通過連接層決定

(2)通過網格節點層來梳理分布較為凌亂的數據資源,將網格服務作為基礎,將各種數據進行處理包裝,再按照已經建立的模型分裝發布于系統。

(3)以GT4為中間件的中間件層鏈接了各個節點,以此保證系統的穩定運行。

(4)功能層實則是在GT4上開發的,它支持跨庫檢索。網格有著兩大模塊,管理模塊來提供查詢和檢索,以其為基礎研發的任務管理模塊則負責了調度和協調計算,兩者互相協作共同完成著程序的運行。

(5)Agent技術的誕生可以說是人工智能領域的一大崛起之作,它的地位極高,其原因是自然是因為獨特的分解分配能力,它如同并發計算中的進程一般,作用之重要可見一斑。

引入Agent技術,以此為基底來建立網格任務管理模塊。利用Agent技術進行系統優化從而將對等的協同計算進行分散。

(1)任務分解Agent。用戶通過手動提交,將重擔交到其手中,在其強大的相關數據庫有力的支撐之下,對任務進行全面的分析,慢慢將其分解,并梳理成為在邏輯上息息相關的子任務,從而來形成任務流。

(2)任務分配Agent。因為任務流對于子任務功能有著大量的需求,所以任務分配Agent的必要之處體現了出來,資源Agent有著強大的搜索服務,他的搜索服務讓子任務具體網格服務達到了任務的分配,從而實現程序運行,將問題解決。

4 應用實現

在進行平臺運行的實踐后得出的結論表明了其存在的價值,其更高的查準和查全讓客戶能夠高效準確的找到所需資源,帶來了快捷和便利,而在優化之后,平臺的質量也有了大幅度的提升,單看系統,可擴展性就有了大幅的提高,而優良的兼容性也是其優勢所在,服務質量在原有基礎上有了大幅度的提高。

盡管平臺包含了大量的信息資源,但因為其中不止有著文本和圖像,音視頻文件的存在導致對計算機有了更高的要求,而現如今被閑置的計算機資源并非沒有,它分布在各大高校和科研網絡,網格憑借其自身特點恰好可以將這些閑置已久的資源巧妙地利用,將其構造成為數據機群,來滿足客戶所需的各類數據處理。

5 結論

網絡技術優化跨庫檢索平臺不僅避免了之前無法解決的問題,大規模的整合了有效資源,更是將一站式服務變為現實,故深得好評,但無論多么優秀的作品都會存在雙面性,其優秀的性能背后同樣也有著許多的問題,安全問題就是其中一大難點,大規模的數據存儲于“云端”之中,使用者根本不知道儲存的具體位置,而這樣一來,別用用心的黑客入侵或者數據的突然丟失都會造成難以估計的損失,盡管現如今許多學者專心于研究如何尋找一個合適的解決辦法,但長久以來此問題一直未被解決。在此之外,異構數據檢索雖然得以實現,但其在實現的同時因為網格技術的參入也將數據庫本具有的一些特性破壞掉,甚至于改變結果,想要真正的將統一檢索變為現實,只有通過科研人員通過一次又一次的反復實驗,在相對黑暗的領域不停摸索,才能將網絡技術研究的更為深入透徹。

猜你喜歡
沙漏資源共享檢索
交通運輸數據資源共享交換體系探究與實現
2019年第4-6期便捷檢索目錄
有趣的沙漏
DIY裝飾沙漏
衛康與九天綠資源共享
DIY裝飾沙漏
回憶的沙漏
教育部第一批“國家級精品資源共享課”公布
專利檢索中“語義”的表現
測量學精品資源共享課建設的探索
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合