?

基于數據生命周期的美國研究圖書館科學數據開放共享服務研究

2019-06-25 01:57武彤
圖書與情報 2019年1期
關鍵詞:美國

摘? ?要:開展科學數據開放共享服務是研究圖書館在數據密集型科研環境下滿足科研人員數據需求、實現科學數據復用的要求和趨勢。了解美國研究圖書館科學數據開放共享服務現狀,可為我國今后的研究提供參考與借鑒。文章基于數據生命周期理論,采用網絡調研和文獻分析法,從科學數據規劃服務、科學數據咨詢服務、科學數據獲取服務、科學數據組織和加工服務、科學數據存儲服務、科學數據共享服務、科學數據利用和培訓服務7個方面調查分析美國研究圖書館開展的科學數據開放共享服務實踐,通過分析提出了我國高校圖書館可借鑒的經驗,包括:構建良好的科學數據服務環境、完善現有的科學數據服務內容、成立專業的科學數據服務團隊。

關鍵詞:科學數據;開放共享服務;研究圖書館;數據生命周期;美國

中圖分類號:G259.712;G252? ?文獻標識碼:A? ?DOI:10.11968/tsyqb.1003-6938.2019018

Abstract Developing research data sharing services are the requirements and trends for the academic library to meet the data needs of researchers and achieve research data reuse in a data-intensive scientific research environment.Understanding the current situation of research data sharing services? in the US academic library can provide reference for future research in China.Based on the data life cycle theory, using network surveys and literature analysis methods,investigating and analyzing the practice of research data sharing services in the US academic library,which includes research data planning services, research data consulting services, research data acquisition services, research data organizing and processing services, research data storage services, research data sharing services, and research data utilizing and training services.This paper points out the experience that our university library can learn from, which includes building a good research data service environment, perfecting the existing research data service content, and establishing a professional research data service team.

Key words research data; opening and sharing services; academic library; data lifecycle; America

開放獲取運動促進了全球知識的傳播,同時也越來越重視共享數據和方法,使它們得到再利用和引用[1]。大量在線工具被用來分享資料和交流知識??茖W家可在全球范圍內通過社會網絡相互接觸,或利用在線平臺交流知識,合作撰寫科學出版物,分享研究數據或資料[2]??茖W數據開放共享已成為目前科學界、學術界、圖情界關注的最新研究主題之一。在此背景下,為了能夠提升科學數據價值,促進科研交流和創新,無論是研究個體還是科學共同體都在渴求能夠獲得更深入、更便捷、更全面的數據服務。作為面向科研用戶的美國研究圖書館已經在探索促進知識生產和關聯的新型服務模式[3],其已經意識到將服務邊界拓展到傳統學術交流的上游即數據階段,并取得了較多成果,但是如何將服務貫穿于整個數據生命周期,是目前美國研究圖書館開展科學數據開放共享服務需要解決的首要問題。

在當前科學數據服務研究熱潮中,大部分是介紹和跟蹤國外科學數據服務的理論研究進展或對科學數據管理與服務現狀進行調查分析,多數學者僅分散地列出研究圖書館的科學數據服務內容,缺乏理論支持和系統性,且很少有學者按照科學研究工作流程對科學數據開放共享服務展開討論。因此,研究人員必須加強這方面的研究,以深化圖書館服務。本文將從數據生命周期入手,重點對美國研究圖書館的科學數據開放共享服務與實踐進行調查分析,并總結其特征,為我國圖書館提供參考借鑒。

1? ?科學數據生命周期理論

20世紀90年代到21世紀初,數據生命周期被視為是支持數據保存和數據管理實踐的一個重要因素,隨著數據共享文化成為我們日常研究語言的一部分,數據生命周期的概念日益流行[4]。數據生命周期是指從數據產生,經數據加工和發布,最終實現數據再利用的一個循環過程??茖W數據生命周期與科學研究工作流聯系緊密,科學數據的生命周期除其作為信息資源的信息生命周期外,更重要的是如何在高??茖W數據管理中映射科研活動過程,保證用戶檢索和利用這些科學數據時能了解其在科研過程中所處的位置,實現科研活動整個過程及其產生科學數據的連續統一體管理方式[5]。

目前國外科學數據生命周期理論研究和實踐進展迅速,已有不同類型的科學數據生命周期模型 46 個[6],不同的數據生命周期模型分有不同的階段,如美國政治與社會科學研究校際聯盟(ICPSR)科學數據生命周期模型包括制定發展及數據管理計劃、數據收集、數據分析、數據共享、數據存儲5個階段[6];弗吉尼亞大學圖書館數據生命周期包括數據計劃、數據收集、數據分析、數據共享、數據存儲、數據發現6個階段[7];加利福尼亞大學數字圖書館數據生命周期模型分為計劃、收集、管理、存儲、共享、出版6個階段[8];邁阿密大學科學數據生命周期包括收集、管理與存儲、加工、處理分析與數據挖掘、整合、決策支持和知識產生與保存、存檔7個階段[6];新墨西哥大學Data one環境科學數據生命周期模型基本內容包括數據計劃、數據收集、數據確認、數據描述、數據存儲、數據發現、數據整合、數據分析8個階段[9]。

盡管各個科學數據生命周期模型被劃分為不同的階段,但是經過總結歸納,本文可以將科學數據生命周期從整體上分為:數據產生、數據收集、數據處理與分析、數據存儲、數據出版和共享、數據利用6個階段。根據科學數據生命周期不同階段的不同任務(見表1)拓展圖書館的服務范圍,可以有效地指導圖書館根據科研人員的數據需求開展科學數據開放共享服務。

2? ?美國研究圖書館科學數據開放共享服務調查與分析

筆者在上述科學數據生命周期的理論基礎上將科學數據開放共享服務劃分為規劃服務、咨詢服務、獲取服務、組織和加工服務、存儲服務、共享服務、利用和培訓服務,對美國研究型圖書館開展的科學數據開放共享服務現狀進行調查分析,為我國高校圖書館開展相關服務提供借鑒。

2.1? ? 科學數據開放共享服務調查

近年美國研究圖書館的科學數據服務快速發展,服務內容涉及科學數據管理的各個方面,并緊緊圍繞科研工作的全流程開展服務。本文選取US NEWS發布的2018年美國排名前50名高校的圖書館作為調研對象,分別進入各圖書館網站查看是否有關于科研數據服務的介紹,同時通過搜索引擎和數據庫查找這些圖書館開展服務的報道和介紹,并通過圖書館網站提供的在線咨詢等方式了解其開展服務的情況(見表2)。

筆者對調研結果進行總結歸納發現,在調研的50所研究圖書館中,除維克森林大學和倫斯勒理工學院外,共有48所研究圖書館開展科學數據開放共享服務。各研究圖書館提供的科學數據開放共享服務從服務內容、服務方式和服務深度上都有不同的特點。

2.2? ? 科學數據開放共享服務分析

在對美國48所研究圖書館科學數據開放共享服務調研的基礎上,總結出各項服務的具體服務內容、服務方式,并從開展的各項服務中優選出服務特色比較鮮明的康奈爾大學圖書館、弗吉尼亞大學圖書館、哥倫比亞大學圖書館、斯坦福大學圖書館和普林斯頓大學圖書館、麻省理工學院圖書館、埃默里大學圖書館、伊利諾伊大學香檳分校圖書館8所研究圖書館作為案例進行詳細分析,為我國高校圖書館開展相關服務提供參考借鑒。

2.2.1? 科學數據規劃服務

科學數據管理計劃是共享科學數據的基礎,一份詳實的整體規劃對科研人員來說能使科學數據的創建、保存、歸檔和共享利用有章可循,有據可依,同時也能保證共享、重用和長期保存數據的一致性、準確性與可追溯性[11]。包括美國國家科學基金會(NSF)和美國國家航空航天管理局(NASA)等在內的科研資助機構非常重視共享總體規劃,普遍要求資助項目的申請者提供詳實的科學數據共享計劃??茖W數據規劃服務指的就是研究圖書館在科研資助機構相關政策的指導下從宏觀層面幫助科研人員制定其在科研工作不同階段的科學數據管理計劃。圖書館員在項目、課題開始就參與、引導和支持用戶制定科學數據管理計劃,這項服務貫穿整個科研生命周期[12]。美國研究圖書館輔助科研人員制定數據管理計劃采取的方式主要有:①提供各基金機構的數據管理政策咨詢;②創建模板,提供其他機構的數據管理計劃示例;③提供制定數據管理計劃的工具(DMP Tool);④提供數據管理計劃撰寫培訓等[13]。

調查結果顯示,共有46所研究圖書館提供了科學數據規劃服務。如康奈爾大學圖書館在科學數據產生和發現階段提供規劃服務,建議科研人員制定數據管理計劃時使用科學數據管理規劃工具(DMP Tool)[14],它可以幫助用戶制定符合特定資助機構要求的數據管理計劃,并在計劃制定過程中幫助用戶查找相關資源及服務。DMP Tool工具創建的科研數據管理計劃主要有四個部分:概述計劃總體情況、詳述計劃細節、設置計劃權限、導出計劃??蒲腥藛T登錄科研數據管理規劃工具主頁后,在欄目框中選擇機構康奈爾大學,使用用戶名和密碼登錄,就能夠從康奈爾大學圖書館獲得填寫科研數據管理計劃的具體指導和幫助,包括:①免費下載美國基金項目管理機構的數據管理政策,為科研用戶提供如何滿足基金要求的指南;②數據收集和分析方式的選用;③維護數據完整性的方法;④數據訪問和安全政策的選取;⑤數據管理評估計劃;⑥項目結束后數據的最終過渡計劃等[15]。

2.2.2? 科學數據咨詢服務

研究型圖書館參考咨詢服務即是圖書館組建科學數據參考咨詢團隊通過非正式科學交流方式嵌入到科研項目數據的規劃、獲取、分析、存儲、共享、利用等一系列流程中,幫助用戶解決各種科學數據相關的問題[16]??茖W數據咨詢服務內容主要包括數據管理計劃撰寫所涉及的問題咨詢、提供數據發現與檢索咨詢、存儲和元數據標準選擇相關問題咨詢、數據安全及版權咨詢、數據分析軟件開發、數據出版、數據管理政策咨詢等。目前,多數學科館員選擇 Email、面談或者社交軟件等方式提供咨詢服務,但這些方式總體來看仍屬于傳統的封閉性問答模式,比較理想的解決方案是利用互聯網搭建科學社區,對用戶提出的問題分類整理后,邀請相關專家和其他用戶解答問題,這種咨詢方式能夠使問題在更開放的時空范圍內得到快速解決,使提問者獲得更精準權威的回答[3]??茖W數據咨詢服務的內容和方式影響科學數據開放共享的效果,多樣化的咨詢服務內容和方式有助于高效地解決科研人員的數據管理問題,從而有步驟有計劃地指導科研人員開放共享科學數據。

在調查的48所研究圖書館中,共有47所研究圖書館提供科學數據咨詢服務。如弗吉尼亞大學圖書館成立了專門的科學數據咨詢組(SciDaC Group),通過Lib Guides 系統提供科學數據咨詢服務,從科研過程中的數據生命周期考慮幫助用戶做出正確的決策,以便研究數據在未來可以持續地提供和利用[17]。圖書館將咨詢組成員的信息嵌入科學數據管理網頁,通過提供咨詢組成員的專業背景及聯系方式來開展在線咨詢等服務??茖W數據咨詢組提供的咨詢服務主要包括[18-21]:①提供關于NSF等科研資助機構數據管理計劃制定相關問題的咨詢服務,幫助起草和審查數據管理計劃,幫助研究人員使用DMP Tool工具去創建數據管理計劃;②提供重要資助機構如美國國家科學基金會(NSF)、美國國立衛生院(NIH)、美國國家航空航天局(NASA)的基金指南、數據政策和要求,并提供相關內容的鏈接,供科研人員查閱參考;③重點提供數據版權和知識產權咨詢服務,包括數據版權的歸屬、如何控制數據使用許可,數據共享需要依靠怎樣的發布協議等;④對用戶如何存儲及共享數據提出建議,如存儲到弗吉尼亞大學機構知識庫或數據倉儲中,通過項目或機構Web站點聯機發布、向期刊出版社提交數據等;⑤提供關于如何引用數據、引用涉及的元數據、引用格式等咨詢和幫助服務;⑥提供常見問題與解答(FAQ)服務。

2.2.3? 科學數據獲取服務

科學數據開放共享的目的在于使科研用戶充分利用科研活動過程中產生的數據,而其前提則是有效獲取數據[22]。為解決科研人員難以找到所需數據、檢索到的數據不符合要求、數據獲取成本太高、所需數據涉及隱私或國家機密等[23]在獲取科學數據的過程中遇到的問題,美國研究圖書館在e-Science 環境下提供數據檢索、數據導航等服務??茖W數據檢索服務是指圖書館在利用自身優勢并充分熟悉數據資源的分布狀況與檢索策略的基礎上明確科研用戶的數據需求,使用戶了解館內機構知識庫和館外數據倉儲中有哪些科學數據可供檢索利用,并運用相關檢索技術(如元數據技術、關聯技術等)幫助用戶在海量數據中識別查找科學數據、發現關聯數據,并在條件允許的情況下幫助用戶訂閱下載數據資源。數據的發現和獲取除了可以通過數據檢索實現外,還可以利用數據導航。美國研究圖書館通過其構建的門戶網站提供科學數據的導航服務,能夠在學科或某類主題下實現科學數據的聚類,用戶可以利用數據導航實現館藏檢索、跨庫檢索和互聯網檢索,獲取數據的來源、實際存儲地址等相關信息。幫助科研用戶獲取科學數據的服務是圖書館開展科學數據服務的第一步,在此基礎上,圖書館可進一步提供對科學數據深層次處理和分析服務[24]。

本次所調查的48所研究圖書館均提供了科學數據獲取服務。如哥倫比亞大學圖書館就建立了導航與檢索服務門戶平臺。首先,哥倫比亞大學圖書館在門戶網站的Finding data欄目中幫助用戶確定所需檢索數據,具體包括:①幫助用戶識別數字和空間數據;②以紐約地區為例說明數據的地理位置是用戶數據檢索的關鍵;③提醒用戶根據不同的時間參數檢索數據并列舉常見問題及解決方案;④確定所需數據單元(個人數據、群組數據);⑤用戶可以在NYC Open Data[25]和Data.gov[26]中找到按主題組織的數據源;⑥地理數據門戶(Geodata@columbia)[27]幫助用戶查找地理空間數據,支持基于地理位置的數據瀏覽與檢索,用戶可以獲取數據機構、作者、學科、地區、時間、類型等內容;其次,該門戶通過對科學數據的分類整理、元數據描述,提供對多個數據庫的訪問,用戶可以按學科和資源類型進行檢索[28]。還可以根據網站上包括康奈爾大學地理空間信息庫(CUGIR)、國家氣象局GIS數據門戶、聯合國地理科學數據門戶、中國數據中心在線數據庫等數據門戶的鏈接,檢索到紐約地區、美國乃至世界范圍內的地理空間數據[29];最后,哥倫比亞大學數據集包括館藏數據目錄和主要來源為美國校際政治及社會研究聯盟(ICPSR)的外部數據,用戶在實現館藏數據檢索和跨庫數據檢索的同時可以閱讀并以PDF格式下載與數據關聯的文件、項目信息[30]。

2.2.4? 科學數據組織和加工服務

與傳統研究范式相比,數據密集型研究對科學數據的交流和共享提出了新要求,科學發現越來越依賴于對科學數據的組織和加工[31]。通過對科學數據的組織和加工來達到對科學數據的增值與深度揭示將是未來圖書館科學數據服務的主要內容之一??茖W數據組織和加工服務主要涉及科學數據的描述、分析和關聯??茖W數據描述服務是指研究圖書館按照特定的標準規范,分析科學數據的類型、主題以及形態等,進而滿足科學數據的組織需求。首先,需要明確e-Science 環境下具體的描述對象數據集;其次,使用統一的元數據描述標準,準確、完整地描述科學數據,建立數據存儲質量的標準規范,對實驗產生的科學數據進行再次檢查和測試,確??茖W數據的質量。為實現數據的深入挖掘和知識抽取,圖書館借助館內外軟硬件資源向科研用戶提供科學數據抽取、聚類分析、可視化分析、統計分析等服務[16],一般由校內的信息技術部門提供服務支持?;谡Z義挖掘的數據關聯服務則是通過構建本體,實現數據語義、語法上的關聯集成,通過對科學數據和科學文獻添加數字對象唯一標識符DOI將科學數據同外部資源連接起來,并以關聯數據的形式發布,有效地擴展了資源發現,實現了資源的重復利用與共享以及永久保存[32]。

調查結果顯示,48所研究圖書館中只有26所研究圖書館提供了科學數據組織和加工服務,且各個圖書館在科學數據組織加工服務的不同方面各有優勢。在科學數據描述方面,為了將用戶的研究成果順利提交到數據倉儲,斯坦福大學圖書館根據用戶所使用的數據庫要求幫助用戶選擇元數據標準來格式化元數據,如都柏林核心元數據(DC)、元數據對象描述模式(MODS)、美國聯邦地理數據委員會元數據標準(FGDC)、編碼檔案著錄(EAD)以及社會科學領域元數據標準,以實現對盡可能多學科領域科學數據的描述與組織,同時融合RDF 和OWL 等語義網技術[33],形成適合跨學科科學數據描述和過渡性存儲的元數據方案;在科學數據分析方面,普林斯頓大學圖書館開發的數據與統計服務(Data and Statistical Service,DSS)[34],側重事實調查數據的收集分析,具備數據存儲和數據分析兩大功能,在為研究人員提供研究案例、用戶測評和實驗數值等事實數據的基礎上,進一步通過數據挖掘得出預測性或總結性信息。它的在線分析工具 Stata、SPSS、Excel以及 R語言,能夠匯總計算及繪制圖表,強大的數組和矩陣運算能力使得復雜運算環境中數據的轉換和聚類更為簡便;在科學數據關聯方面,斯坦福大學圖書館為實現數據語義、語法上的集成,通過構建本體來描述特定學科的組成要素和這些組成要素之間的關系[35]。首先將數據進行抽象處理,然后再將抽象的概念變為詞表,并應用合適的編碼語言進行表述,以方便計算機識別與處理。數據館員還利用專業管理軟件將科研數據與其他館藏資源(特別是科學文獻)關聯化,從而使得潛在用戶檢索數據或數據集時,能夠輕松檢索到與數據或數據集相關的科學文獻和其他資源。

2.2.5? 科學數據存儲服務

數據存儲尤其是長期存儲是科學數據管理與服務的重要方面,科學數據能否以可識別的方式實現共享和復用,存儲是關鍵的一環。因此,數據存儲受到了廣泛的重視。美國研究圖書館發揮其資源保存與組織優勢,參與科學數據存儲規范(存儲對象、存儲格式、存儲期限、存儲地點等)的制定,為科研人員提供元數據的創建服務,根據研究項目需求、結合數據存儲平臺元數據標準與相關科研機構共同幫助用戶制定合適的數據存儲方案,通過自建或與其他機構合作建設科學數據存儲的硬件環境。美國研究圖書館主要依托機構庫和數據倉儲為科研人員提供科研數據存儲服務。機構知識庫是依附高校圖書館而建設,存儲本校研究項目產生的科學數據的系統基礎設施,其主要服務對象為本校的科研人員或參與本校研究項目的研究人員,通過門戶網站對機構庫進行整合,在權限范圍內將數據公開共享。數據倉儲是由圖書館與校外的各種聯盟及項目機構合作建立,圖書館這時的任務是向科研用戶提供相關信息,使其了解這些倉儲,并幫助用戶利用這些數據資源,美國研究圖書館提供諸如ICPSR和re3data等外部數據倉儲的相關鏈接以幫助研究人員查找和存儲相關數據[36]。另外圖書館還提供對數據庫的備份、維護等服務,以便保證科學數據能夠被用戶長期、有效地使用。

調查結果顯示,48所研究圖書館都提供了科學數據存儲服務。如麻省理工學院圖書館的研究數據管理團隊(data-management@mit.edu)通過數據存儲庫比較模板幫助用戶選擇適合其需求的數據存儲庫[37],其中包括與惠普開發公司合作建立的在線機構數據庫DSpace@MIT[38]、哈佛-麻省理工學院數據中心聯合開發的 Dataverse,和密歇根大學間政治和社會研究聯盟(ICPSR),均為麻省理工學院研究人員提供長期穩定的科學數據存儲服務。麻省理工學院圖書館在科研人員計劃將科學數據存儲至機構倉儲中時,在元數據指導文檔中列舉了科研人員在創建數據時需要執行的重要操作,幫助科研人員創建元數據,以增加數據的組織效率和被發現幾率,并用于數據的遷移和轉換[39],具體包括[40]:①記錄與項目相關的所有文件名和格式、數據組織方式、生成數據的硬件設備和軟件工具,以及數據更改或處理的信息;②數據命名結構中使用的代碼、縮寫或變量的說明;③記錄數據獲取的位置,以使其更容易被檢索。并在“Things to document your data”目錄下推薦了數據標題、創作者、標識符、日期、主題、資助者、權利、語言、位置和方法等元數據元素。 麻省理工學院圖書館還提醒研究人員應該考慮將數據遷移到具有下述特征的最佳格式中,以確保長期的可讀性和訪問,這些特征包括[41]:①非專有;②開放文件標準;③研究共同體的普遍使用;④標準表示(ASCII,Unicode);⑤ 未加密;⑥未壓縮。在數據的備份和維護方面,麻省理工學院圖書館為個人電腦和企業服務器提供免費的數據備份解決方案:CrashPlan PROe和Tivoli Storage Manager(TSM)[42],幫助用戶在發生錯誤時保護和恢復數據。

2.2.6? 科學數據共享服務

鑒于科學數據對于研究成果的驗證與重現作用,以及對于同類研究的參考借鑒價值,當前眾多科研管理機構和基金組織紛紛對科研人員提出了研究數據共享的要求, 旨在提升科研數據的可用價值,同時將其作為提升社會公眾對科研工作支撐力度的有效方法。在此背景下,美國研究圖書館在相關政策要求和指導下提供面向科研用戶的科學數據共享服務。一方面,通過一定的標識技術和機制,建立數據與數據來源之間的關系,并制定相應的數據引用規范。用戶可以通過唯一標識符(DOI)或者URL鏈接獲取原始數據,促進未來研究中數據的驗證和再利用;另一方面,通過機構知識庫、數據倉儲等方式公開發布科學數據,為用戶提供標準的數據引用格式和永久訪問地址,使得科學數據集達到可發現、可獲取、可理解和可追溯的狀態[43],這對于保持數據完整性、防止學術造假與抄襲行為、減少重復研究、驗證學術成果的正確性、提升研究者的學術聲譽和影響力等方面都具有較大的意義。此外,研究圖書館會在數據共享前幫助作者解決隱私、知識產權、版權及許可問題[44]。

據調查,共有41所研究圖書館提供科學數據共享服務。如埃默里大學圖書館為在科學數據資助政策、科學數據引用、科學數據出版三個方面即提供科學數據共享服務。①為了幫助用戶遵守資金授權,使用戶的研究成果能夠開放獲取,埃默里大學圖書館提供相關政策資源訪問,如學術出版和學術資源聯盟(SPARC)文章和數據共享政策網站,用戶可以通過瀏覽和查看相關政策,跟蹤、比較和理解當前和未來的美國聯邦機構科學數據共享要求[45];②通過FAQ方式,為用戶提供數據引用條件、引用格式(如作者、標題、版本和持久的標識符或永久URL 鏈接)、引用工具(DOI引文格式化程序工具)、引用代碼等信息,并建議用戶將已經收集或生成的科學數據,存儲在數據庫如Dataverse、Dryad或openICPSR中,方便引用與共享[46];③提供關于數據出版的服務,服務內容主要包括用戶如何選擇要出版的數據,應該出版哪些文件格式的數據,應該用什么樣的文檔來出版數據,以使它們在將來對其他人有意義;應該在哪里出版數據;數據的版權和許可等[47]。

2.2.7? 科學數據利用和培訓服務

科學數據培訓服務以加強科研人員的數據管理技能、提高數據素養為目的,介紹科學數據資源的分布、組織方法、管理與分析工具等,是協助科研人員進行科學數據管理的有效途徑之一[22]。美國研究圖書館的科學數據培訓主要有三種形式:專題研討會/班、培訓課、在線教育[48]?!皩n}研討會/班”的形式較為自由,參與者可相互交流心得;“培訓課”則能較為系統地學習科研數據管理的相關知識;“在線教育”則通過專題視頻資料、在線軟件和在線一對一培訓等形式隨時隨地學習科研數據管理方面的知識。但不論以哪種形式進行培訓,其內容都涵蓋科研數據管理的基礎知識、科研數據管理的具體環境介紹、如何撰寫科研數據管理計劃、科研數據的保存與共享介紹等,培訓有專人負責,能為每位科研工作者提供個性化培訓服務且對校內的機構人員免費[48]。

調查顯示,共有36所研究圖書館提供科學數據利用和培訓服務。如伊利諾伊大學香檳分校圖書館的科研數據服務既提供有關科研數據管理計劃、科研數據組織、科研數據保存與共享等相關培訓,也提供個性化數據管理研討會或研討班、重新編排核心數據等培訓,提供的培訓形式涵蓋了專題研討會/班、培訓課、在線教育三種形式。如其于2016年2月16 日舉辦的“數據管理介紹專題研討班”,主要介紹數據管理的要素(計劃、組織、存儲、構建),與會者共同探討、相互幫助,找出彼此數據管理中存在的問題并學習如何解決;再如2016年3月1日舉辦的專題研討會,介紹科研數據出版或分享的基礎知識,用一個框架模型來幫助研究者決定何時、如何公開科研數據[49]。伊利諾伊大學香檳分校也提供專業的數據管理教育培訓課程,即數據管理教育培訓項目,并授予數據管理專業碩士學位。該培訓通過系統的課程學習(包括2 門必修課和至少2 門選修課)、大量的實習(該校與全國范圍內的自然科學、人文科學及其他人文數據研究中心合作,提供大量實習機會),培養科研工作者的科研數據管理能力[50]。同時,在科研數據服務的官網上,科研數據服務組也提供在線學習和一對一專門性科研數據服務[51]。

3? ?啟示

科學數據開放共享是數字圖書館時代研究圖書館發展面臨的新機遇,是圖書館轉型發展的一大方向[52]。美國研究圖書館的科學數據開放共享服務先行一步,已經形成了一套較完備的服務模式,尚處于起步階段的我國高校圖書館要在吸納其成功經驗的基礎上,充分發揮自身在數據服務方面的優勢,尋求與其他機構、部門的合作,逐步深化服務內容,提升服務層次。通過構建良好的科學數據服務環境、完善現有的科學數據服務內容、成立專業的科學數據服務團隊,促進我國高校圖書館科學數據的全面開放共享,更好地服務于科研人員及科研活動。

3.1? ? 構建良好的科學數據服務環境

我國高校圖書館學科分布廣泛,數據來源復雜,管理和服務機構眾多,因此,要致力于建設便于用戶管理與利用科學數據的良好服務環境。一方面,要協調好各方利益,明確規劃科學數據開放共享服務過程中各利益相關者的權利和責任,從微觀層面制定、頒布貫穿于整個數據生命周期的科學數據開放共享政策,一般包括數據管理計劃、數據標準、數據管理服務、數據保存、數據訪問、數據共享及數據所有權等方面的內容[53]。其中要解決的一個重要問題是數據資源的版權問題。針對公開網絡環境下科學數據資源的版權問題,圖書館可以形成合作聯盟與出版商進行談判,通過平衡出版商、科研人員和圖書館之間的利益關系,擴大數據資源的許可范圍[52];另一方面,要在發揮自身優勢的同時與科研人員、科研管理部門和科研服務部門等各方力量的協同合作,尋求財政和政策支持,合作建設科學數據管理的軟硬件環境,并把其嵌入到用戶的科研環境、科研過程中,滿足科研人員數據管理、共享和利用的需要[24]。美國研究圖書館科學數據服務不是由單一的部門或組織實現的,多采取合作模式,在資金、機構、平臺、技術等方面尋求最佳組合。如新墨西哥大學圖書館和翰霍普金斯大學謝里登圖書館積極承擔政府資助的研究項目,為科學數據服務的發展提供財政支持[54];康奈爾大學圖書館[55]的數據分析服務提供者包括康奈爾大學的高級計算中心、信息技術部、社會和經濟研究機構等;麻省理工學院圖書館與惠普開發公司合作建立機構知識庫DSpace @ MIT,為麻省理工學院研究人員提供穩定、長期的科學數據存儲;明尼蘇達大學圖書館與明尼蘇達信息技術辦公室、明尼蘇達機構庫、明尼蘇達大學塞博基礎設施聯盟合作[56]建設科學數據管理的硬件環境等。

3.2? ? 完善現有的科學數據服務內容

我國高校圖書館要嵌入用戶的科研環境、科研過程和整個科學數據生命周期提供科學數據開放共享服務,服務的內容和方式都要圍繞用戶的需求產生,既要涵蓋科學數據管理的過程,又要包括支撐科研數據共享和利用的過程。高校圖書館主要參與的階段及管理任務主要包括:(1)在數據產生階段,幫助用戶制定數據管理計劃,提供數據管理咨詢服務;(2)在數據收集階段,通過圖書館門戶網站提供數據導航、檢索服務;(3)在數據處理和分析階段,與IT部門合作,采用元數據技術和關聯技術,幫助用戶檢查、驗證、清理和匿名化數據、描述數據、分析數據、關聯數據等;(4)在數據存儲階段,建立機構知識庫和數據倉儲,幫助用戶將數據遷移到最佳格式,將數據遷移到合適的介質,備份和存儲數據,生成元數據和文檔,幫助用戶解決如何使數據存取不受時間、技術變化的限制,并進行后續的數據更新、技術更新、安全維護等工作;(5)在數據共享階段,幫助用戶引用數據源,明確數據版權,出版、共享數據;(6)在數據利用階段,使用數據進行教學和學習,開展培訓等。隨著技術的成熟,在以用戶為中心的理念下,我國高校圖書館既要保留傳統的被動式索取服務,但更多的是要提供主動的個性化數據定制服務和推送服務,通過融入科研人員的課題或項目中,參與學術交流,來幫助用戶評估和了解自己的數據管理需求,并通過和他們的密切合作來解決用戶的問題,進而提高服務質量。

3.3? ? 成立專業的科學數據服務團隊

(1)在人員招聘方面,為了滿足研究人員和學術界對數據管理和調查服務的需求,要招聘具有數據管理技能和經驗的圖書館員和工作人員。如美國芝加哥大學圖書館尋求合格申請人擔任科學數據館長職位,并且優先考慮具有數據管理服務經驗的申請人;(2)在人員培訓方面,制定系統的科學數據管理培訓體系,舉辦關于科學數據管理的課程、研討班、講座等。一方面,我國高校圖書館要加強對館員全方位、多層次的崗位培訓,不斷提高圖書館員的數據保存、數據共享等科學數據服務核心技能;另一方面,圖書館員也要對科研用戶進行科學數據管理意識、理論和技能等數據素養方面的培訓,使他們具備對數據進行管理利用的相關能力;(3)在人員設置方面,成立獨立的科學數據部門或小組,進行統一規劃、協調與實施,專門工作組可以根據數據管理服務的特點和問題,制定系統和詳細的服務計劃,根據研究過程中的數據生命周期不同階段的需求設計和提供不同的服務項目和內容,滿足研究人員從項目申請到研究整個過程不同階段對于數據管理的需求。如麻省理工學院、弗吉尼亞大學、康奈爾大學等高校圖書館等都成立了專門的工作組來負責數據管理服務工作。

參考文獻:

[1]? The Royal Society.Science as an open enterprise[M].London:The Royal Society,2012.

[2]? Scheliga K,Friesike S.Putting open science into practice:a social dilemma?[J/OL].[2018-05-20].http://firstmonday.org/ojs/index.php/fm/article/view/5381/4110.

[3]? 張穎.美國研究型圖書館研究數據服務的實踐進展及趨勢[J].圖書情報工作,2017,61(9):33-41.

[4]? Eynden V V D,Corti L,Bishop L,et al.Managing and sharing research data:a guide to good practice[M].Sage,2014.

[5]? 錢鵬.高??茖W數據管理研究[D].南京:南京大學,2012.

[6]? CEOS.Data life cycle models and concepts[EB/OL].[2018-05-22].http://ceos.org/ourwork/workinggroups/wgiss/documents/.

[7]? CEOS.Data life cycle models and concepts[EB/OL].[2018-05-22].http://www2.lib.virginia.edu/brown/data/.

[8]? Joan Starr,Perry Willett,Lisa Federer,et al.A collaborative framework for data management services:the experience of the university of California[J/OL].[2018-05-17].https://escholarship.umassmed.edu/cgi/viewcontent.cgi?article=1014&context=jeslib.

[9]? Pouchard L.Revisiting the data lifecycle with big data curation[J].International Journal of Digital Curation,2016,10(2):176-192.

[10]? Eckard M,Rodriguez C.Thinking long-term: the research data life cycle beyond data collection,analysis and publishing[EB/OL].[2018-05-30].https://scholarworks.gvsu.edu/cgi/viewcontent.cgi?article=1001&context=bigdata_conference2013.

[11]? 楊淑娟,陳家翠.研究成果傳播與共享——英美國家基金項目數據管理計劃概述[J].情報雜志,2012(12):176-179.

[12]? 肖瀟,呂俊生.圖書館嵌入式學科化科學數據服務研究[J].圖書館學研究,2012(21):85-89.

[13]? 陳大慶.國外高校數據管理服務實施框架體系研究[J].大學圖書館學報,2013,31(6):10-17.

[14]? University of california.Data management planning tool[EB/OL].[2018-05-17].https://dmptool.org/user_sessions/institution.

[15]? Cornell university.Data management planning[EB/OL].[2018-05-17].http://data.research.cornell.edu/content/data-management-planning.

[16]? 黃鑫,鄧仲華.“互聯網+”視角下的圖書館科學數據服務研究[J].圖書與情報,2016(4):53-59.

[17]? Bigger on the inside:building research data services at the university of virginia[EB/OL].[2018-06-02].https://r.search.yahoo.

com/_ylt=Awr9IMwqjRZbibQAOCFXNyoA;_ylu=X3oDMTByYnR1Zmd1BGNvbG8DZ3ExBHBvcwMyBHZ0aWQDBHNlYwNzcg--/RV=2/RE=1528233386/RO=10/RU=https%3a%2f%2finsights.uksg.org%2farticles%2f10.1629%2fuksg.239%2fprint%2f/RK=2/RS=pVnPKuX74OiqaPT0XwddaimFY94-.

[18]? DMP tool[EB/OL].[2018-06-05].https://guides.lib.virginia.edu/researchmgmt.

[19]? Data sharing[EB/OL].[2018-06-05].https://guides.lib.virginia.edu/c.php?g=515290&p=3520795.

[20]? Citations[EB/OL].[2018-06-05].https://guides.lib.virginia.edu/c.php?g=515290&p=3522232.

[21]? Frequently asked questions[EB/OL].[2018-06-05].http://data.library.virginia.edu/faq/.

[22]? 王翠萍,李佳潞.國外高校圖書館科學數據服務現狀與啟示——以五所高校圖書館為例[J].圖書館工作與研究,2017(10):31-36.

[23]? 司莉,邢文明.科學數據管理與共享的理論與實踐[M].武漢:武漢大學出版社,2017.

[24]? 李曉輝.圖書館科研數據管理與服務模式探討[J].中國圖書館學報,2011,37(5):46-52.

[25]? NYC open data[EB/OL].[2018-06-12].https://opendata.cityofnewyork.us/.

[26]? The home of the U.S.governments open data[EB/OL].[2018-06-12].https://www.data.gov/.

[27]? GeoData@Columbia[EB/OL].[2018-06-12].https://geodata.library.columbia.edu/.

[28]? Databases[EB/OL].[2018-06-12].https://clio.columbia.edu/databases.

[29]? Spatial data on the Internet[EB/OL].[2018-06-12].https://library.columbia.edu/locations/dssc/data/spatialdata.html.

[30]? CU numeric data collection[EB/OL].[2018-06-12].https://library.columbia.edu/locations/dssc/data/numdata.html.

[31]? Hey T,Tansley S,Tolle K.The fourth paradigm:data-intensive scientific discovery[M].Washington:Microsoft Research,2009:3-26.

[32]? 房小可.基于關聯數據的高校圖書館科學數據組織研究[J].圖書館建設,2013(10):31-34.

[33]? Lowe B.Datastar:bridging XML and OWL in science metadata management[M].Metadata and Semantic Research.Springer Berlin Heidelberg,2009: 141-150.

[34]? About data and statistical services[EB/OL].[2018-06-13].https://dss.princeton.edu/about.html.

[35]? Advanced metadata[EB/OL].[2018-06-13].https://library.stanford.edu/research/data-management-services/data-best-practices/creating-metadata/advanced-metadata.

[36]? Research data management services in academic libraries in the US:a content analysis of libraries websites[EB/OL].[2018-05-26].https://crl.acrl.org/index.php/crl/article/view/16788/18346.

[37]? Find a data repository[EB/OL].[2018-06-10].https://libraries.mit.edu/data-management/share/find-repository/.

[38]? About DSpace@MIT[EB/OL].[2018-06-10].http://dspace.mit.edu/.

[39]? 黃鑫,鄧仲華.國外高校圖書館科學數據的元數據服務研究[J].圖書與情報,2017(2):84-90.

[40]? Documentation&metadata[EB/OL].[2018-06-15].http://libraries.mit.edu/data-management/store/documentation/.

[41]? File formats for long-term access[EB/OL].[2018-06-10].https://libraries.mit.edu/data-management/store/formats/.

[42]? Data storage,backups,& security[EB/OL].[2018-06-10].https://libraries.mit.edu/data-management/store/backups/.

[43]? 黃國彬,王舒,屈亞杰.科學數據出版模式比較研究[J].大學圖書館學報,2018,36(1):34-40,33.

[44]? 趙蕾霞,鐘永恒.美國高校圖書館科研數據管理服務調查分析[J].圖書館理論與實踐,2015(6):54-58.

[45]? Funding mandates[EB/OL].[2018-06-20].http://researchdata.emory.edu/share/mandates.html.

[46]? Citing data[EB/OL].[2018-06-20].http://researchdata.emory.edu/share/cite.html.

[47]? Publishing your data[EB/OL].[2018-06-20].http://sco.library.emory.edu/research-data-management/publishing/index.html.

[48]? 鄂麗君.國外大學圖書館的科研數據管理教育[J].情報資料工作,2014(1):101-105.

[49]? Workshops [EB/OL].[2018-06-03].http://researchdataservice.illinois.edu/workshops/.

[50]? 黃如花,吉翠芳.伊利諾伊香檳大學數據管理教育現狀及啟示[J].圖書與情報,2015(1):61-65.

[51]? Contact us[EB/OL].[2018-06-03].http://researchdataservice.illinois.edu/contact-us.

[52]? 熊文龍,李瑞婻.基于科學數據管理的圖書館數據服務研究[J].圖書情報工作,2014,58(22):48-53.

[53]? 陳媛媛,柯平.高校圖書館科研數據服務研究綜述[J].圖書館工作與研究,2017(10):17-23,30.

[54]? Si L,Xing W,Zhuang X,et al.Investigation and analysis of research data services in university libraries[J].Electronic Library,2015,33(3):417-449.

[55]? Research data management service group[EB/OL].[2018-06-21].https://confluence.cornell.edu/dis-play/ rdmsgweb/Home.

[56]? Delserone L M.At the watershed:preparing for research data management and stewardship at the university of Minnesota libraries[J].Library Trends,2008,57(2):202-210.

作者簡介:武彤,女,華南師范大學經濟與管理學院碩士研究生,研究方向:科學數據開放共享、圖書館服務創新。

猜你喜歡
美國
論美國思想政治教育方法及對我國的啟示
社會參與美國社區學院治理及對中國應用型本科高校治理的啟示
教育均衡發展:現代教育發展的新境界
美國高校數字傳媒專業研究生教育調查分析
美國兒童繪本出版中的性別理念研究
當代美國恐怖影片中的哥特元素
美國商業銀行衍生品業務的特點分析
美國黑人影片中的文化認同焦慮
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合