?

云計算環境下綠色信息檢索系統的研究初探

2014-03-28 12:15洪霞
圖書館界 2014年1期
關鍵詞:信息檢索云計算

洪霞

[摘要]信息和通信技術的發展促進了信息檢索系統和服務的升級,也造成了很大的環境污染和生態破壞。為了環境的可持續發展,綠色IT和云計算已經成為減少能耗、建設低碳社會的關鍵要素之一。綠色檢索系統及其服務理念可以在減少政府、企業以及教育和科研機構的信息系統的能耗方面發揮重要作用。在分析綠色檢索系統面臨的主要挑戰的基礎上,提出了構建一個綠色檢索系統的4個關鍵因素:標準化、可共享、可重用以及綠色的用戶行為。

[關鍵詞] 信息檢索;綠色信息技術;云計算;綠色信息檢索

1引言

隨著通信技術和網絡的發展,各種搜索引擎已經成為人們最常使用的工具,信息檢索工具大大方便了用戶在網絡或數字圖書館中尋找知識和信息。但是,這些植根于信息和通信技術(Information and Communication Technologies,ICT)設備上的信息檢索系統也造成了很大的環境污染和生態破壞[1]。據國際信息技術調研機構估計,人類因使用信息技術設備增排的二氧化碳量占到人類二氧化碳總排放量的2%左右,為了維持全球電腦的正常運行,人類每年會向大氣層增加排放大約3 500萬噸廢氣[2]。在環境問題如此日益突出的今天,我們對信息檢索系統的依賴越大,對環境的不良影響也會越大。因此,探討如何在發展信息檢索系統的同時保持環境的可持續發展具有重要的現實意義。

為了可持續發展,在本文的研究中,首先提出綠色信息檢索應該是經濟的、環保的和可持續發展的,而綠色信息技術(或簡稱綠色IT)和云計算技術的應用有助于綠色檢索系統的構建;其次,本文認為綠色的用戶行為是構建綠色信息系統的條件之一;基于相關的研究,本文認為云計算和綠色IT在減少信息和通信技術對環境的影響方面發揮著關鍵作用。在此基礎上,本文提出了構建綠色信息檢索系統的4個要點:標準化、可共享、可重用以及綠色的用戶行為。

2文獻述評與理論背景

2.1 綠色IT與云計算

一般而言,綠色IT可以概括為符合社會進步與環境保護要求,滿足經濟可持續發展而采取的舉措和方案[3]。綠色IT的目標是通過采取多項措施,從信息設備的生產和使用環境進行優化,并同時加大虛擬化和數據中心的建設,以期降低信息技術對環境的不良影響。

現有的研究發現,云計算通過共享計算和網絡資源減少了經濟和環境成本,因此被認為是實現綠色IT最合適的選擇之一[4]。云計算作為一種以服務的方式提供計算資源的新型計算資源組織分配和使用模式,其服務類型可以分為基礎設施即服務(IaaS)、平臺即服務(PaaS)、軟件即服務(SaaS)[5]。不同的服務類型都涉及不同級別的資源共享,依據不同的服務水平,云計算可以選擇不同的方式共享軟硬件資源和信息,以期達到合理的經濟和環境效益。一般而言,云計算的環境效益可能來自以下幾個方面:1)減少服務器能源消耗。云計算通過優化計算資源的使用,根據需求動態劃分或釋放不同的物理和虛擬資源,僅在需要時使用完全的計算能力,在不需要時可以進行通過調度使其休眠,最終減少服務器的電力能源消耗[6]。2)減少網絡的能源消耗。云計算通過網絡向用戶提供服務,并根據不同的任務和服務類型自動控制和優化網絡占用,最大化地減少了網絡堵塞,從而減少了能源消耗[7]。3)減少終端設備能源消耗。對于最終用戶而言,云計算服務提供者負責維護基礎設施及軟件平臺,終端用戶一般是通過網頁瀏覽器來獲取資源,而無需關注通過何種設備介入資源,因而可以最大幅度降低終端設備的購置和維護,從而降低了能源消耗[8]。

2.2 云計算與信息檢索

利用檢索詞“云計算”與“信息檢索”分別在ISI Web of Knowledge數據庫和中國知網(CNKI)數據庫進行相關檢索,結果發現最早的相關研究論文發表于2008年,說明此領域的相關研究處于起步階段,國外的相關研究論文共檢索到81篇,國內相關研究論文16篇。此外,相關研究并不僅局限于云計算和信息檢索,也包含了云計算和信息管理、信息檢索和資源共享等多方面。如Basirat和Khan[9]探討了如何使用分布式的模式識別方法進行數據的云存儲和云檢索;Bales等人[10]討論了使用手機和其他計算設備,尤其是智能手機進行信息訪問和獲取。安俊秀[11]提出了分布式云檢索數據存儲方案;付永貴[12]針對云計算平臺下的信息檢索的特性,提出一個新的信息檢索模型。

這些研究表明,信息檢索的研究人員越來越多地開始把云計算作為擴展他們研究領域的一個新機會。但正如前文所討論的,目前的檢索系統和相關服務缺乏對環境影響的研究,具體來說,就是綠色信息檢索系統和服務如何能在不同的應用環境下訪問和使用不同形式的數字信息,并以此來促進環境的可持續發展。然而,綠色信息檢索系統研究面臨的主要挑戰是缺乏一個合適的方法來計算信息檢索系統和服務所排放的溫室氣體。

目前對環境影響評價使用較多的方法是生命周期評價分析(Life Cycle Analysis,LCA)方法。然而研究發現,現有的LCA方法還很不成熟,存在模型不成熟、可操作性差等不足[13]。因此,本文的研究將在已有研究的基礎上,結合Raghavan等人[14]的評價方法,對綠色檢索系統的環境影響進行分析。

3信息檢索系統對環境的影響分析

針對LCA方法的缺點,Raghavan等人提出了一個比LCA廉價、高效的方法,這個方法能較為方便地評價互聯網的能源消耗,以及信息檢索系統和服務的溫室氣體排放量。該方法認為,在對信息檢索的能源消耗進行評價之前,需要評價兩種能源消耗:1)用于建設信息檢索系統和服務所需要設備的能源消耗,如服務器、網絡、路由等;2)數據庫和搜索引擎創建的能源消耗,包括數據的存儲和維護,以及訪問和獲取、使用數字信息的各種設備的能源消耗?;谶@個判斷,如果要估算一個信息檢索系統或服務的能源消耗,需要從以下幾個方面進行評估:1)構建和管理信息檢索系統(服務)需要不同的通信設施和IT設備,這些設備的生產和最終回收所需要的能源;2)構建和管理信息檢索系統(服務)需要不同的通信設施和IT設備,這些IT設備進行網絡通信所需要的能源;3)構建和管理信息檢索系統(服務)需要商業活動、辦公設備等,這些與此相關的活動所需要的能源;4)用戶訪問信息系統時需要各種不同的終端設備,這些終端設備的制造、維護和回收處理所需要的能源;5)不同的用戶終端進行網絡通信時所需要的能源。

將上述的能源消耗累計就可以估算出一個信息檢索系統(服務)的能源和環境成本。很明顯,一方面,隨著系統訪問次數的增加,每次訪問的固化能(embodied energy)會減??;另一方面,用戶端的能源消耗會隨著用戶數量的增加而增加。因此,基于這種判斷,我們可以采取一系列措施用于平衡信息檢索服務的能源消耗,例如,通過使用云計算模式使服務器的計算和網絡資源的使用最優化,然后在客戶端使用較為簡單的終端減少能源消耗,等等。

Raghavan等人的研究發現,互聯網的能源消耗中有53%是固化能,同時,終端機器(如臺式電腦、筆記本電腦等)的能源消耗占整個互聯網能源消耗的一半左右。也就是說,信息檢索系統和個人終端是互聯網能源消耗的主要貢獻者。而云計算可以減少信息檢索系統的固化能,此外,用戶的行為(如在信息檢索時選擇的終端類型、檢索的時長、檢索的行為習慣等)也會對減少能源消耗有著重要的作用。因此,為了構建綠色的檢索系統,可以通過云計算的使用,以及改變用戶習慣,最終達到綠色目標。

4綠色檢索系統(服務)構建

為了減少溫室氣體的排放和能源消耗,在運用信息檢索系統時可以采用以下方法:1)改進信息檢索系統,使之更為高效,以便在處理檢索、處理和生成檢索結果的整體時間減少;2)通過瘦客戶機的使用,幫助用戶獲取信息的同時降低能源消耗;3)減少終端用戶設備的設計功耗,通過減少網絡通信時長,最終降低能源消耗。此外,基于已有的研究,還可以采用一些通用的方法來構建綠色信息檢索系統。在本研究中,我們認為推動綠色檢索系統構建有4個關鍵要素,即標準化、共享性、重用性以及綠色的用戶行為。

4.1 標準化

相關的研究發現,云計算技術的優勢主要體現在數字內容的創建、組織和處理過程中的標準化。此外,Hargreaves等人[15]在數字經濟的相關研究中為支持知識密集型活動的創新提出了一些建議,其中關于標準化的建議,對于信息檢索系統的發展同樣具有重要的參考作用。因此,以標準化為基礎,通過云架構的PaaS和SaaS層,利用云計算技術遠程訪問和獲取數據,將極大地方便信息檢索。同時,相對于本地化數據中心的數據托管而言,將數字內容移送到云端也將顯著減少溫室氣體的排放。

然而,云計算這種遠程接入的真正優勢主要體現在以下方面:首先,云端中的數據必須使用標準元數據格式對各種來源的數字化信息進行處理,以便創建可以檢索的數字內容;其次,標準化模式和工具的使用可以使開發人員忽略數字信息的格式,開發出標準化的信息檢索系統。因此,在開放標準的基礎上,數字信息創建的標準化將大大地有助于信息檢索的發展,包括數據內容的識別、索引以及使用特定的數據挖掘工具創建特定領域的使用等方面。

4.2 共享性

在過去的十年中,TREC(文本檢索會議)為共享資源提供了良好發展契機。此外,作為TREC的一種新的信息服務模式,眾包(crowd sourcing)信息檢索成為資源共享的成功案例[16]。同時,云計算的主要優勢體現為共享性。相對于在本地服務器上對數據信息進行相互獨立地檢索,這些不斷涌現的共享技術和共享檢索標準為降低溫室氣體的排放起到了重要的作用。

目前,對于共享數據和檢索標準而言,如何使用開放標準和技術,進行不同模式的合作與交流是需要重點研究的問題,也是綠色檢索系統能否成功的一個重要因素。

4.3 重用性

信息檢索工具和內容的重用性在很長的時間內將是信息檢索和數字圖書館研究領域的一個研究重點。例如,TREC研究會為了改進信息檢索,已經對檢索工具和內容的重用性進行了長時間的相關研究。而將云計算基礎架構引入到相關研究中將大大推動研究進展,這是因為,各種研究數據集、索引內容以及各項指標和工具都可以存儲在云端,方便在各種研究和應用開發活動中使用。

顯然,云計算基礎構架有利于數據的共享,也有利于綠色檢索的研究。這是因為研究人員不再需要對已經建成的數字資源和應用程序進行重新設計和獲取,同時也節約了能源。此外,這些已有的索引、日志數據、各種數據分析,可以重新利用以進行進一步的研究,最終有利于減少溫室氣體的排放,也有利于綠色檢索系統的構建。

4.4 綠色的用戶行為

在信息化社會中,人類的信息行為是其主要研究領域,同時也是信息檢索研究的一個重要方面。此外,任何信息系統(服務)的成敗取決于它如何滿足用戶的信息需求,因此,用戶的行為特征成為信息系統需要考慮的因素。在這個基礎上,綠色的用戶行為已經成為綠色IT的一個重要組成部分[3],目前已經有相關的研究關注用戶行為的能源消耗以及用戶行為對環境的影響[17]。

在氣候變化的背景下,綠色的用戶行為可能意味著一系列與能源使用有關的行為改變,如生活習慣、商業慣例等。此外,正如前文所述,綠色的用戶行為是環境可持續發展的重要推動者。已有調查發現,無節制的打印浪費了大量紙張的同時也增加了環境壓力。而云計算和綠色IT可以在幫助用戶更加方便地訪問和獲取信息的同時,引導用戶獲取信息行為方式的改變。例如iPad、電子書等各種移動終端的大量出現既方便了用戶隨時隨地獲取知識,又減少了紙張打印,最終減少能源消耗。

此外,相對于傳統的信息獲取方式而言,已有研究發現,用戶通過低能耗的終端連接到云端,并訪問和獲取數據可以顯著地減少溫室氣體的排放[18]。雖然已經取得了一些改變,但是為了綠色信息檢索系統的建設,從而實現社會的可持續發展,還需要對改變用戶信息獲取行為進行更多的研究。

5結語

隨著現代網絡技術、設備的不斷出現,促進了社會信息化水平的快速發展,人們對信息系統的依賴程度越來越高,信息檢索已經成為我們日常生活中密不可分的一個組成部分。然而,這也增加了溫室氣體的排放。因此,面向可持續發展的低成本、低能耗的綠色檢索已經成為未來信息技術領域面臨的重大挑戰。

為了構建和發展綠色信息檢索系統,首先需要知道一個信息檢索系統中哪個系統組件或服務產生多少溫室氣體,然后才可以尋找適當的方式減少這些排放?;谝延械南嚓P研究,本文認為,云計算和綠色IT在減少信息和通信技術對環境的影響方面發揮著關鍵作用。通過對標準化、共享性、重用性和綠色的用戶行為的探討,有助于構建綠色檢索系統和服務,并最終實現信息檢索系統的可持續發展。

[參考文獻]

[1] Gobinda Chowdhury. Building Environmentally Sustainable Information Services: A Green is Research Agenda[J].Journal of the American Society for Information Science and Technology, 2012, 63(4): 633—647.

[2] IT并非“無煙產業”環境保護呼喚綠色IT[EB/OL]. [2013-04-26].http://www.cioage.com/art/200807/72612.htm.

[3] Jenkin T A, Webster J, McShane L. An Agenda for Green Information Technology and Systems Research[J] .Information and Organization, 2011, 21(1):1—24.

[4] Hayes B. Cloud Computing[J] . Communications of the ACM, 2008, 51(7):9—11.

[5] 李喬,鄭 嘯.云計算研究現狀綜述[J] .計算機科學,2011,38(4):32—37.

[6] Liu J, Zhao F, Liu X, He W. Challenges towards Elastic Power Management in Internet Data Centers [C]//Proceedings of the IEEE International Conference on Distributed Computer Systems Workshops, 2009: 65—72.

[7] 張亞明,劉海鷗.云計算研究綜述——基于技術與商業價值雙重視角[J] .中國科技論壇,2010(8):126—133.

[8] Cervone H F. An Overview of Virtual and Cloud Computing [J] .OCLC Systems and Services, 2010, 26(3): 162—165.

[9] Basirat A H, Khan A I. Evolution of Information Retrieval in Cloud Computing by Redesigning Data Management Architecture from a Scalable Associative Computing Perspective [J]. Neural Information Processing. Models and Applications, 2010: 275—282.

[10] Bales E, Sohn T, Setlur V. Planning, Apps, and the High-End Smartphone: Exploring the Landscape of Modern Cross-Device Reaccess[J].Pervasive Computing Lecture Notes in Computer Science, 2011(6696):1—18.

[11] 安俊秀.基于服務器集群的云檢索系統的研究與示范[J] .計算機科學,2010,37(7):179—182.

[12] 付永貴.基于云計算的余弦向量度量法文本檢索模型[J] .情報科學,2012,30(5):736—739.

[13] 向東,汪勁松,段廣洪.綠色產品生命周期分析工具開發研究[J] .中國機械工程,2002,13(20):1760—1764.

[14] B Raghavan, J Ma. The Energy and Energy of the Internet[C]//Proceedings of the 10th ACM Workshop on Hot Topics in Networks. Cambridge, Massachusetts,2011: 1—6.

[15] Hargreaves I. Digital Opportunity: A Review of Intellectual Property and Growth[EB/OL] . [2013-04-26] . http://dera.ioe.ac.uk/16295/1/ipreview-finalreport.pdf.

[16] 郎宇浩.基于長尾理論面向“眾包”的信息服務模式研究[J].情報科學,2012,30(10):1545—1549.

[17] JISC. Green ICT: Managing Environmentally Sustainable ICT in Education and Research. Energy Dashboard and User Behavior[EB/OL]. [2013-05-31].http://greenict.jiscinvolve.org/wp/2011/06/30/energy-dashboards-and-user-behaviour/.

[18] Baliga J, Ayre R W A, Hinton K, Tucker R S. Green Cloud Computing: Balancing Energy in Processing, Storage, and Transport [C]//Proceedings of IEEE, 2011, 99(1): 149—167.

猜你喜歡
信息檢索云計算
淺析開源情報信息檢索與信息鑒別
對大學案理研討課學生信息檢索意識若干問題的思考
醫學信息檢索與利用的探討
志愿服務與“互聯網+”結合模式探究
云計算與虛擬化
基于云計算的移動學習平臺的設計
實驗云:理論教學與實驗教學深度融合的助推器
云計算中的存儲虛擬化技術應用
空難事故跨媒體信息采集與檢索方法的研究
中外檔案網站信息檢索功能比較研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合