?

開放科學環境下高校圖書館數據資源建設調查與分析*

2023-08-08 09:32葉繼元
圖書館論壇 2023年7期
關鍵詞:科學圖書館資源

陶 蕊,葉繼元

0 引言

進入數字時代,數據成為關鍵的生產要素、戰略資源,政府數據、公共數據、企業數據、科學數據等各領域的數據資源建設受到廣泛關注??茖W研究領域內,隨著數據密集型科學的快速發展,科研人員對可發現、可訪問、可互操作、可重用的數據需求越來越強。以開放性、共享性、社會化、可重復為主要特征的開放科學隨之興起,強調通過數字化工具和網絡實施、傳播并轉變科學研究的方式,提供無限制、無障礙、開放獲取的研究成果,推動科學研究的高效和透明[1]。開放科學運動使得科研環境發生巨大變化,科學數據開放需求不斷提高,科學數據的管理與服務任務加重,數據資源的建設面臨著新要求。目前我國數據資源建設仍處于起步階段,存在資源建設不平衡不充分問題,不同主體、不同領域、不同地區的建設情況參差不齊,尚未形成良好的數據資源保障系統。因此,加快數據資源的建設步伐已成為圖書館等信息服務部門的重點任務。高校圖書館(以下簡稱“高校館”)作為數據資源的收藏方、主要供需方和開放科學的重要參與者,加強數據資源建設將成為開放科學運動和文獻信息資源保障體系的關鍵一環。

數據一詞有廣泛的內涵和外延,其含義可概括為數字、字母與符號的集合,系客觀事物與主觀思維的具體表達,現常用來指可以由計算機處理的信息單元[2]2,此為廣義數據。從外延看,數據包括數值、字母、圖表、圖像等多種形式;從類型看,有科學數據、政府數據、空間數據等豐富內容。而具體到與開放科學運動和高校館建設密切相關的數據,則專指狹義的數據,即與知識生產相關的數據,主要是科學數據以及部分應用于科學研究和教學工作的公共數據、政府數據等。本文的研究對象主要是狹義上的數據。

中外學者已開展相關研究,內容主要為高校館在開放科學環境下的科學數據管理與服務以及開放數據的建設。Tzanova指出,高校館提供的信息服務與高校的教育和科研需求密切相關;開放科學環境下,高校館應積極了解開放科學內容,掌握新的研究和教育需求,通過開發科學數據管理模型、制定數據管理計劃、提高館員的數據素養等方式應對挑戰[3]。張俊等指出,開放科學環境下,科學數據管理是高校館實現自身價值的重要途徑,高校館需從科學數據管理過程、共享政策、共享途徑、管理規范等方面加強建設[4]。部分學者則結合具體實踐開展論述:周力虹等調查我國高校館的科學數據管理服務現狀,發現科學數據管理存在計劃服務缺乏、服務方式單一以及館員提供的幫助有限等問題,建議關注用戶需求特點,針對性地開展科學數據管理與服務[5];Agnieszka 等調查波蘭醫學類高校研究人員對科學數據的需求和態度,發現多數人員對科學數據的需求較大,但缺乏科學數據的管理、開放數據等知識[6];Ahmed等指出,馬來西亞高校館在開放科學的推進和開放科學數據的建設中存在思想意識不足、專門機構和人員缺乏以及政策不完備等問題[7]。此外,數據平臺的開發作為科學數據管理服務的重要組成部分,也成為學者們的討論對象。李洋等調查我國代表性高校館的科學數據平臺建設現狀,提出高校館在科學數據的開發過程中應加強政策規劃,充分收集本校的科學數據,開展合作建設等方法策略[8]??傮w看,已有成果集中在高校館的科學數據管理與服務這一環節,研究范圍比較固定且局限,對數據資源前期建設這一基礎性環節關注較少,對各種類型的數據資源建設情況研究不足。研究基礎性的數據資源建設,有利于后期數據管理、服務與利用等環節的順利開展;而對數據資源建設的探討,也有助于完善整個高校館文獻信息資源建設與保障體系?;诖?,本文在新的開放科學環境下,重點研究高校館這一信息機構的數據資源建設情況:調查中外部分高校館數據資源建設現狀,總結經驗與不足;分析開放科學環境下高校館開展數據資源建設面臨的新形勢;探討開放科學環境下我國高校館開展數據資源建設的策略。

1 國內高校館數據資源建設調查

1.1 建設現狀

國內的調查初步選取42所“雙一流”高校的圖書館。樣本的選取主要考慮兩方面因素,一是“雙一流”高校的教學科研發展對數據資源的需求較高,同時,“雙一流”高校館的人力物力對于數據資源建設的支持更強,數據資源建設的環境更好;二是通過前期的文獻和網站調研發現,國內高校館開展數據資源建設的總體水平不高,但“雙一流”高校的圖書館資源建設相對較好。由于北京航空航天大學圖書館、電子科技大學圖書館等5所高校館的網站無法打開,為此本文最終以其余37所圖書館作為調查對象,調研時間為2022年3月10-30日。通過網站調查并輔以文獻調研,了解其數據資源建設的總體情況,并從資源的范圍、類型、內容等方面做具體分析。

總體上,37所國內高校館的數據資源建設普遍存在資源覆蓋范圍小、數量少、類型單一、內容不豐富、開放程度低等問題。如表1所示,在資源類型方面,依據資源來源渠道,已建設的數據資源主要有3種類型:購買的數據型數據庫、網絡開放數據資源和自建數據資源。其中,購買的數據型數據庫是大多數高校館的主體資源,但這類數據庫并非只提供科學數據、公共數據等,還包含了研究報告、政策法規、案例等資源,其實質是以數據為主,涵蓋多種資源的全文數據庫,如中經網、國研網等。網絡開放數據資源占比較小,主要是政府和部分公共機構、研究機構提供的開放數據,多以數據庫或數據平臺的形式呈現,如國家統計局數據、聯合國統計數據、國家科技圖書文獻中心(NSTL)的開放科學數據等。自建的數據資源則聚焦于科學數據,僅有少數高校館開展建設,如北京大學開放研究數據平臺、復旦大學社會科學數據平臺等;部分高校的院系也自建了數據平臺,通過圖書館的資源列表提供獲取服務,如湖南大學的校經濟數據研究中心數據庫。在語種方面,大多數高校館的數據資源以中文為主,外文主要為英文。在學科方面,社會科學數據是大部分高校館的主體資源,其中,金融、財經類的數據又占多數。自然科學和綜合學科的數據資源較少,僅有北京大學圖書館、上海交通大學圖書館、華中科技大學圖書館、西北農林科技大學圖書館4所高校館的自然科學數據數量高于社會科學。

表1 國內部分高校館數據資源建設統計(單位:種)

近年“開放”和“數據”已成為科學發展的兩大方向,數據的開放有利于加強學術交流,提高科學生產力,這一發展趨勢進一步刺激了數據資源的開放需求。具體來說,調研中的高校館建設開放共享數據資源主要有兩種方式,一是提供網絡開放數據的獲取途徑,二是自建開放科學數據平臺。其中,網絡開放數據在各高校館之間的建設程度不一。統計網絡開放數據占各圖書館全部數據資源的比重(見圖1)可知,網絡開放數據并非多數高校館的主體資源。網絡開放數據占比小于10%的高校館有17 家,11%~30%的有14家;而高于30%的只有6家,如中國農業大學圖書館、四川大學圖書館等,當中北京大學圖書館提供的網絡開放數據最為豐富,占比大于90%。同時,多數高校館提供的網絡開放數據以公共數據、政府數據為主,如國家統計局數據,對研究機構、數據中心開放的科學數據建設力度偏小。在自建開放科學數據平臺方面,37所高校館中僅有北京大學圖書館、復旦大學圖書館、武漢大學圖書館搭建了開放科學數據平臺,而武漢大學的科研數據管理平臺因管理運行原因暫無法使用。北京大學開放研究數據平臺和復旦大學社會科學數據平臺的基本情況如表2 所示。通過調查可知,經過幾年的建設,北京大學和復旦大學在自建開放科學數據平臺的實踐上已取得一定的成效。具體來說,一是數據內容類型豐富,兩平臺均定位于科學數據,數據量達到一定規模,保存管理多個學科的資源內容,數據類型涵蓋了文檔、數據文件、問卷、圖片、軟件或代碼等多種形式;二是資源組織有序,平臺的資源按照“數據空間-數據集-文件”三級結構組織,通過豐富的元數據進行資源描述,同時按照學科、機構、關鍵詞等進行分類;三是數據開放初具成效,兩平臺都鼓勵數據提交者共享數據,同時北京大學開放研究數據平臺還向中外學者或研究單位征集數據,整理加工后開放共享。但兩平臺的建設也存在一些不足,一是技術自主性較低,均在國外平臺的框架基礎上二次開發完成,基礎設施和核心技術受制于人;二是數據更新不及時,以復旦大學社會科學數據平臺為例,其數據發布時間集中在2020年及以前,近兩年新上傳的數據量很少。

圖1 國內部分高校館網絡開放數據建設統計

表2 北京大學開放研究數據平臺和復旦大學社會科學數據平臺資源建設情況

1.2 不足

(1)數據資源建設方向不明晰。高校館的數據資源建設應有明確的方向,以本校的教學科研需求為中心,同時考慮國家的重大科技戰略、創新發展等實際需要。而本調研中,大多數高校館的數據資源建設以社會科學為主,其中又以財經、金融類居多,自然科學數據少。這一建設現狀與部分高校的優勢學科發展不完全匹配,同時也不能很好地滿足科技創新的需求。

(2)資源類型單一、內容不豐富。國內高校館的數據資源以購買的數據型數據庫為主,網絡開放數據的建設程度參差不齊,自建數據資源發展不足。此外,資源內容單薄,已建設的資源多為統計數據,對于其他類型的數據,尤其是科學數據建設不足,對基礎學科、新興戰略等領域的數據資源保障不夠。

(3)開放數據的建設力度不大。首先,37所高校館在整合其他機構的開放數據方面程度不一。例如,北京大學圖書館提供了300余種網絡開放數據的獲取途徑,但有10家圖書館卻未將網絡開放數據納入資源列表中。這一建設現狀與網絡開放數據的發展實情有較大差距。部分政府部門、研究機構、數據中心等已不同程度地推進開放數據項目,高校館作為中介性的信息機構,應當在高質量網絡開放數據的擴散、傳播中發揮中介作用,在用戶和數據資源之間搭建橋梁,通過提供滿足本校教學科研需求的網絡開放數據來擴展圖書館的數據資源。其次,在自建開放科學數據方面,北京大學開放研究數據平臺和復旦大學社會科學數據平臺均取得較好的成效,但在數據開放的全周期性上仍有不足,其他圖書館在自建開放科學數據方面則鮮有可供利用的成果。

2 國外高校館數據資源建設經驗

本文重點選取斯坦福大學、芝加哥大學、牛津大學等7所國外高校館開展調研,樣本主要通過初期的文獻和網絡調研來獲取,調研時間為2022年3月20日-4月15日。這些國外高校館的數據資源建設情況良好且各有特色,有一定的借鑒意義。梳理調查內容可知,各館數據資源數量眾多,內容形式多樣,組織管理有序,開放保護并行。

(1)數據資源的內容形式多樣。7所國外高校館的數據資源均已形成較大規模,數據資源有3種主要類型。一是數據型數據庫。此類資源多列舉在數據庫資源這一門類下,通過數據庫資源的分類以方便獲取。例如,斯坦福大學圖書館將數據資源分為統計數據(Statistics)、數據集(Data sets)、人口普查數據(Census data)等,在這些門類下又包含了各種內容的數據庫,如商業數據庫、公共數據平臺等[9]。二是機構知識庫。機構知識庫是一個以本機構成員在工作過程中創建的各種數字化產品為內容的數據庫和服務系統[2]94,機構成員所生產的科學數據也是其重要的資源。國外部分高校館通過加強機構數據庫的資源建設來保存、利用本校的科學數據。例如,芝加哥大學圖書館的機構知識庫(Knowledge@UChicago)支持本校成員上傳數字格式、完整、可使用的數據集,數據內容可以是學術性的、創新性的和教學科研相關的等等,并且允許在尊重版權和數據安全的前提下開放共享[10]。三是數據存儲庫。部分圖書館搭建專門的數據存儲庫來保存數據資源。例如,芝加哥大學圖書館為查找和共享數據而建立了專門的學科數據存儲庫(Data Repositories),對多渠道多學科的數據資源分類匯總,既有國際組織的開放數據和調查報告,也有所在國家、州的人口普查、選舉、財政、刑事司法、環境、交通等政府數據和公共數據,學科多樣、知識面廣,很好地擴展了該校的數據資源[11]。哈佛大學的數據存儲庫(Harvard Dataverse)則不局限于收藏本機構的科學數據,校內外的研究人員、期刊、機構都可以在此平臺上保存、管理、分享科學數據,不僅便利了其他人員、機構的數據管理,也極大豐富了其數據資源[12]。國外高校館的數據資源內容豐富,既有諸如實驗數據、觀測記錄等科學數據,也有地方司法、財政、人口等政府數據、公共數據,部分圖書館還提供空間數據(Spatial Data),覆蓋從地球空間數據到圖書館空間數據等資源;學科全面,既有社會科學、人文學科類數據,又有大量的自然科學數據;空間范圍廣,既有本校擁有的科學數據,又囊括所在州、國家以及全球的可獲取數據;資源語種以英語為主,同時兼有中文、德文、法文等其他語種數據。

(2)數據資源組織管理有序。數據資源的長期保存和有效利用,離不開有序的組織管理。元數據建設、數據分類、數據備份、文件格式控制等內容,是國外高校館數據組織與管理的重點。在元數據方面,國外高校館通過制定相應的元數據方案來描述及組織數據資源。例如,哈佛大學圖書館采用PREMIS保存元數據,并結合元數據封裝標準METS,制定元數據實施方案,同時在PREMIS實體類型的基礎上開發自有數據模型,作為整個服務技術體系的運行基礎[13]。麻省理工學院的科學數據管理平臺也從描述元數據、管理元數據和結構元數據三方面設計元數據方案[14]。另外,部分高校的機構知識庫或數據存儲庫支持用戶自行上傳數據,與此相適應,圖書館也為用戶創建與管理元數據提供指導??的螤柎髮W圖書館提出,當既有的元數據標準不能很好地描述數據時,用戶可以根據相關指南,編寫符合要求的“自述”型元數據文檔[15]。在數據分類方面,國外高校館主要有形式分類和內容分類兩種方式。對于形式分類,多數圖書館按字順排列數據資源,而國別地區分類也是常用的方式,部分機構知識庫還按本校的學院部門分類數據。內容分類上,學科、主題分類是國外圖書館常用的分類方法。芝加哥大學圖書館針對政府數據還按行政部門類別進行劃分[10],牛津大學博德利圖書館將全部數據劃分為定量數據(Quantitative data)、定性數據(Qualitative data)、 地理空間數據(Geospatial data)和元數據(Metadata)4 種類型[16],普渡大學的機構知識庫則允許用戶通過添加標簽來自行分類數據??傊?,多數圖書館并非采用單一分類法,而是將多種分類方式結合使用。在數據備份方面,為保證數據的完整度和安全性,康奈爾大學圖書館提出了數據備份的“三原則”,即建議至少保留3份數據副本:保存在數據創建本地的原始副本,保存在不同載體介質上的其他副本,以及保存在不同地理位置的遠程副本??紤]到數據備份的成本問題,康奈爾大學圖書館允許備份部分數據,如備份全部數據中最有價值的、易受安全威脅的部分,或者只備份更新的數據內容[15]。此外,為更好地保存和利用數據,部分圖書館提供文件格式的選擇建議。例如,斯坦福大學圖書館提出,在選擇存檔的文件格式時,理想的格式應該是非專有的、非加密的、非壓縮的、研究人員普遍使用的、可兼容和互操作的,等等[9]。

(3)數據資源的開放與保護并行。近年來,歐美發達國家大力推進開放科學,高校館在開放數據的建設上重點發力,并將開放數據作為館藏數據資源的重要組成部分。國外高校館建設的開放數據主要由兩部分組成,一是其他單位的開放數據,如政府開放數據、研究機構的開放數據等;二是自建的開放數據,主要以機構知識庫或數據存儲庫的形式建設,內容是本校本機構的科學數據。各高校館針對自有科學數據的開放范圍、開放程度做了不同的規定。芝加哥大學圖書館的機構知識庫定位為開放的知識庫,建議知識庫中的數據盡可能開放,但允許設置訪問權限,如僅在校內公開;同時,芝加哥大學圖書館還鼓勵研究人員通過多種途徑共享數據,如發布在數據期刊、研究網站、博客等其他渠道上[10]。斯坦福大學的機構知識庫支持全球開放(World-access)和校內開放(Stanford-only),并針對不同的開放情況,提供了不同層次的協議來規范開放數據建設[9]。由于數據資源自身的特殊性以及數據開放的風險性,數據安全問題更加突出,國外高校館通過多種途徑來維護數據安全。例如,斯坦福大學圖書館通過數據分級政策來劃分開放和保護的界限,將所有數據劃分為3 類風險級別:低風險、中風險和高風險。低風險級別是指數據的損壞不會對機構的安全、聲譽、財務等產生不利影響,這一級別的數據可用于開放獲??;而中高風險級別的數據則出于法律規定、安全保護等原因不對公眾開放[9]。此外,部分圖書館還通過制定數據安全政策、版權規定,提供數據安全存儲設施,加強數據使用許可等方式保障數據安全。

綜上可知,國外部分高校館的數據資源建設情況良好。調研中的圖書館依據科學發展方向和本校學科建設等目標,系統制定數據資源建設規劃,針對性地布局數據資源,初步形成了類型多樣、內容豐富、覆蓋廣泛的數據資源保障體系。在提高資源數量的同時,注重數據質量的提升,從數據的采集、組織管理、檢索利用到更新維護,實行全流程的質量監管。發展水平較高的圖書館還重點推進科學數據的管理與服務,鼓勵科學數據開放,積極融入開放科學的建設。

3 開放科學下的高校館數據資源建設形勢

開放科學環境下,數據資源的內容與形式、供給與需求、管理與服務等都發生了深刻變化。高校館的數據資源建設面臨著新形勢,機遇與挑戰并存。

(1)數據質量的高要求。在數據建設過程中,數據質量是影響建設效果的關鍵因素。良好的數據質量可以提升數據價值,有助于整個數據資源系統長期安全地運行,質量差的數據則有可能讓整個系統面臨風險。數據質量是指數據的正確性、適時性、精確性、完備性、相關性及可訪問性,用以評估數據的適用性[17]。數據質量屬性眾多,不同領域的數據屬性也有所差別。高校館的數據資源以科學數據為主,高校的科學數據具有多元性、跨部門性、價值密度低的特點,存在數據冗余、不完整、不準確、不一致等質量問題[18],而開放科學的發展對數據資源的兼容性、互操作性等提出更多更高的要求。當前,國內高校館已建的數據資源和開放科學數據管理平臺在數據完整性、可用性、開放性、及時性以及平臺功能等方面都有待提高,而高質量的數據建設也需要大量的人力、物力支持。因此,高校館的數據資源質量建設面臨多方面的挑戰,應選擇合適的質量維度,采用多種方法提高數據質量。

(2)競爭對手對數據資源建設陣地的沖擊。當前,數據的獲取渠道日益多元化,出現了一些新興的數據提供者。諸如阿里、騰訊、百度等互聯網企業依托自身渠道積累了大量數據資源;第三方數據服務機構也提供大量行業、市場或綜合性的數據;傳統的數據擁有者,如政府、公共服務機構、研究中心、數據庫商等近年來也逐漸在數據資源建設與服務方面持續發力。部分領域的數據商業化、集中化趨勢日漸明顯。在此環境下,圖書館作為傳統的信息提供者,在數據資源供給與服務方面受到了競爭對手的強烈沖擊。圖書館自身數據資源建設不足,數據服務匱乏,不能很好地滿足用戶的數據需求,在數據服務領域中面臨邊緣化的風險。高校內各部門為科學數據的生產大戶,高校館卻未能充分利用其資源優勢、有效地提供科學數據服務,造成科學數據資源的浪費。由此,如何在科學數據的建設方面確立自己的獨特優勢、提升競爭力,維護其信息中心的地位是高校館面臨的重要問題。

(3)缺乏友好的科學數據開放氛圍。開放科學環境下,高校館的數據資源建設重點之一就是開放科學數據,而高校館在開放科學數據的建設過程中面臨諸多障礙,其中一個主要障礙就是開放科學數據建設的氛圍不夠友好??傮w上,國內雖已有部分學者和機構開始研究并建設開放科學數據,但并未形成完整的研究體系與實踐系統,缺乏對開放科學數據的系統性頂層規劃,全社會未能有效聯動,開放的理念并未貫穿資源建設的全周期,開放科學數據的建設仍處于起步階段。具體到高校館的開放科學數據建設,高校的科研人員作為科學數據的主要供給者和需求者,處在高漲的數據需求和保守的數據開放這一矛盾態度之中,即一方面對其他主體提供的科學數據有著強烈的需求,另一方面對開放共享自己擁有的科學數據有所顧慮。其不愿開放自有數據的原因,主要有以下幾點:出于保護隱私、保護未完成的研究內容、避免搶先發表等目的,不愿主動開放科學數據;對已上傳和開放的科學數據的知識產權保護不完備,科學數據的知識產權易受侵犯;學術評價制度不太認同科學數據的貢獻,當前圖書、期刊論文、專利、研究報告等科研產出的價值均已被社會所公認,但對研究過程中產出的科學數據的貢獻作用并沒有明確,阻礙了研究人員開放其科學數據。此外,高校館在建設開放科學數據時,也面臨著數據開放與安全的問題,這些都影響了科學數據的開放環境。

4 開放科學下的高校館數據資源建設策略

4.1 建設方向:支持國家發展戰略與學校教學科研發展

當前,我國正處于創新驅動發展、建設科技強國的關鍵時期,數據資源的建設水平與服務能力對于我國科技高質量發展、提高國際競爭力至關重要。高校館在科學數據方面擁有得天獨厚的優勢,在數據建設過程中,要面向國家戰略需求,找準自身定位,積極融入國家數據資源保障體系中,在科學數據的建設與保障中發揮作用?!笆奈濉币巹潖娬{,要“發展壯大戰略性新興產業”,“加強信息科學與生命科學、材料等基礎學科的交叉創新”[19]等。為此,高校館的科學數據建設既要保障新興領域、跨學科領域、基礎學科領域的數據供應,參與重點科研領域數據資源管理與服務平臺的建設,又要注重科學研究、實踐應用和經濟發展需求的有機融合,向企業開放科學數據,提高數據資源在產學研結合中的支撐作用。同時,應增強人文學科、社會科學領域的科學數據建設力度,為數字人文的開展、哲學社會科學領域的研究創新提供豐富的數據內容與充足的數據工具,以數據資源的高效建設推動中國特色哲學社會科學學科體系的構建。

高校館數據資源的建設還應著眼于學校自身的需求,有的放矢地布局數據資源。首先,把握學校的學科建設與發展目標,有重點地規劃數據資源的建設內容,形成具有本館特色的數據資源。其次,充分了解用戶的需求和資源利用方式,提供能滿足用戶教學科研需求、使用便利的數據,避免盲目增加資源數量導致資源利用率低等問題。再次,高校館在館藏資源建設中面臨著經費、人才、資源結構等各方面的壓力,對數據資源的建設提出了挑戰。在開放科學環境下,高校館可以通過資源的共建共享、整合推送其他主體建設的開放數據等方式來補充自己的數據資源,提高數據資源的保障能力。

4.2 建設內容:構建合理的數據資源保障體系

構建多元融合、組織有序、安全開放的數據資源保障體系,是開放科學環境下高校館數據資源建設的必然要求。高校館要充分發揮中介性的基礎作用,融合各方數據資源,如整合中外研究機構的科學數據、收藏與教學科研任務相關的政府數據和公共數據、篩選數據庫商和第三方數據平臺的數據,充實本館的數據資源館藏,節約用戶的數據獲取成本。在已建成的數據資源的基礎上,重點開發本校擁有的科學數據,打造本館特色化的科學數據館藏。

對數據進行有效的組織與管理,這是高質量數據與數據資源保障體系建設的基礎。高校館要重點建設數據資源的元數據,在吸收圖書館已有元數據的基礎上,借鑒社會中的元數據應用,分析數據的保存管理環境、資源特性等,有針對性地構建適合高校館數據資源的元數據體系。面對數據動態變化、格式多樣等帶來的數據管理和利用的不便,高校館應采取必要的控制手段。例如,明確數據保存所允許的文件格式,為圖表、數據集、統計報告等不同的數據類型分配不同的文件格式,但不論何種格式都應符合普遍性、規范性、兼容性、互操作性等要求。對上傳的數據進行版本控制,明確已上傳的數據版本在內容、格式等方面的完整性,同時允許數據的動態更新,并通過編寫元數據等方法進行版本更新說明。此外,還應積極建立數據的長期保存機制、數據管理與利用的反饋機制等,以提高資源建設的有效性。

努力建造既開放又安全的數據資源保障體系。開放數據的建設,一方面要廣泛集合各方開放數據,完善資源結構;另一方面應有序開放自有的科學數據,如向企業開放科學數據,助推企業提高生產力與創新發展,或向其他高校、科研機構開放科學數據,實現數據資源的開放共享,推動科技創新。在開放的同時,高校館還需實施安全保護措施,保障數據安全,提高數據資源系統抵御風險的能力。例如,加強圖書館館員和用戶的數據安全教育,提高管理人員和用戶的數據安全意識;建立數據分類分級制度,依據風險類別對數據進行等級劃分,并對不同風險等級的數據實行不同的開放策略,借此實現數據安全的分級管理;加強數據安全相關的技術開發和基礎設施建設,為數據的采集、組織管理、存儲與傳播利用提供安全的工作流程和工具等。

4.3 建設重點:營造友好的數據資源建設環境

高校館的數據資源建設是一個基礎性、持續性的過程,是推動科技進步的重要環節。因此,需要營造良好的環境來推動高校館數據資源的建設與發展。具體可以從以下幾方面展開。一是構建全方位的數據發展規劃。數據資源的建設離不開政策規劃的指導,良好的政策環境可以促進數據資源的發展。為此,應積極搭建橫向上覆蓋各領域、各環節,縱向上貫通各層級、各主體的數據發展戰略。高校館也需制定符合自身特點的數據資源發展策略,并針對重要的環節制定更為具體的行動指南,如數據安全保護指南、元數據使用指南等,指導具體工作的開展。二是保護數據的知識產權。高校館在建設數據資源的過程中,要遵守知識產權相關的法律法規,不僅要尊重其他主體建設的數據的知識產權,也要合理界定并保護本機構成員生產的數據資源的知識產權,明確相關主體的權限范圍,加強對開放數據知識產權的保護力度,創建安全有序的數據環境。三是制定標準規范。目前我國在數據方面的標準規范尚未形成完整統一的體系,數據建設在一定程度上混亂無序。高校館作為數據資源的建設者,應積極推動并參與相關標準規范的制定,在標準規范的推行中貢獻圖書館的力量,推動規范化的數據資源建設。四是認可科學數據的價值,建立開放科學數據制度。高校館在科學數據,尤其是開放科學數據的建設中,要努力推動學術評價制度對科學數據地位的認可;同時,考慮將科學數據的開放以制度的形式固定下來,通過制度要求來提高數據開放的執行力。例如,高校的科學數據管理平臺或機構知識庫可以要求研究人員在項目結項后,上傳相關的科學數據并酌情開放,以此來加快開放科學數據的建設。

總的來說,加強數據資源建設是開放科學及社會發展的一大趨勢,高校館應認識到數據,尤其是科學數據,在科學生產和社會發展中的作用,加快推進數據資源的建設。同時,也應時刻保持清醒頭腦,理清各類文獻信息資源的地位與關系,不能一味盲目地追求數據資源而忽視了原有的資源,要結合自身的實際需求,構建結構合理的文獻信息資源保障體系。

猜你喜歡
科學圖書館資源
基礎教育資源展示
一樣的資源,不一樣的收獲
點擊科學
科學大爆炸
資源回收
圖書館
資源再生 歡迎訂閱
科學拔牙
去圖書館
衰落的科學
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合