?

面向科研第四范式的科研人員數據素養培養研究

2016-09-28 11:11張軍
圖書與情報 2016年2期
關鍵詞:數據素養科研人員

張軍

摘要:第四科研范式環境即數據密集型科研環境的形成和大數據時代的到來,使得科研人員因數據素養能力不足而面臨著不少挑戰。構建基于科研項目生命周期和科研數據生命周期理論的科研人員數據素養能力培養框架,不但可以理清在第四科研范式環境下開展科研項目基礎條件、驅動因素與成果交流共享方式,還為科研人員的數據素養提升提供了一種基于課堂教育感知教育相結合的培養途徑與方式。

關鍵詞:數據素養;項目生命周期;數據生命周期;科研人員;數據密集型科研環境;第四科研范式

中圖分類號:G252 文獻標識碼:A DOI:10.11968/tsyqb.1003-6938.2016043

隨著以移動終端和社會網絡產生的海量、異構數據為新興代表,數據類型與數量、存在范圍與形態、蘊含價值與挖掘均呈突破傳統認識界定態勢的大數據時代的到來,數據成為了驅動社會創新發展、綜合競爭的新興指標,也成為了科研人員研究和利用的最主要的對象,一個以數據為核心的新型的科研范式正逐步形成。然而,這一新型科研范式的形成,其一方面需要海量、豐富的數據為支撐基礎,但另一方面需要以對數據的價值實現為保障,即科研人員必須具備一定的數據運用與操作能力,如對數據的獲取、挖掘、引用、共享、發布等能力。為了與信息時代的信息素養概念相對應并有內涵上的延續,學界目前將這一素養能力統稱為數據素養。分析數據密集型科研環境下科研人員因數據素養水平不足而面臨的挑戰,進而針對科研人員的日??蒲行袨榧斑@一科研環境下最為主要的研究對象來構建科研人員的數據素養教育框架,則可為科研人員的數據素養教育途徑、內容等提供一種基于全新的視角與認識。

1.數據密集型科研環境下科研人員面臨著全新挑戰

《第四范式:數據密集型科學發現》(The Fourth Paradigm:Data-intensive Scientific Discovery)一書于2009年的出版,既標志著數據密集型科研范式的確立和數據密集型科研環境的形成,也標示著未來的科研流程將建立在數據基礎之上,進而也決定了科研人員對數據的操作能力就成為了其必備的素養,也無疑為現有科研范式下的科研人員提出了挑戰。如基于數據計算和應用的社會計算fComputationalSociology)、數字人文(Digital Humanities)、數字歷史(Digital History)等新興研究領域的悄然興起及快速發展,也都對從事這些領域或相關領域的科研人員提出了極高的數據素養要求,從數據中“發現問題、提出問題、解決問題,進而實現價值”成為了科研人員必備的素養及技能之一。

美國國家自然科學基金(NSF)在2007年提出項目申請者必須提交科研項目數據后,自2011年起則要求NSF所有申請資助的項目必須附有規范的數據管理計劃,以實現對完成所申請項目后產生的科學數據的類型、格式、記錄文檔、元數據等進行科學的存儲、保存與管理規劃。由于缺乏對必要的數據政策、數據操作技能等知識或素養的了解與掌握,普通科研工作者完成這些資助機構的要求并不容易,于是出現了如圖書館數據服務中心、數據館員等工作機構與崗位,以幫助科研人員完成諸如數據管理計劃的制定、起草及修訂等工作。然而由于這些機構或工作人員由于以服務者、輔助者的角度或身份參與,缺乏對科研項目深層次的了解與感知,易出現對所服務或輔助工作的錯誤判斷,如無法對科研成果科學數據元數據的字段大小做出準確計劃。因此,科研人員掌握基本的數據素養無疑成為了一種趨勢。

從基于數據應用及需求的角度,宮學慶等認為數據密集型科研環境下科研人員面臨的挑戰可劃分為科研項目生命周期管理過程中的挑戰和科研數據生命周期管理過程中的挑戰兩大類。前者主要是指科研人員在科研管理過程中如數據存儲、數據發布、數據引用、數據共享等過程中面臨新的挑戰,后者則主要是指科研人員在項目實施完成和挖掘數據價值過程中面臨的諸如數據獲取、數據出版、數據發現等挑戰。但由于兩者都是對數據的操作與價值實現為目標,一個科研項目的申請、實施、完成、增值開發過程其實也就是數據生命周期的主要過程,因此兩者既相統一,又相互交叉。如在數據密集型科研環境下,將科研項目產生的科學數據(也有學者稱其為科研數據)在數據期刊進行出版已是數據環境下最為主要的科研項目成果交流方式之一,越來越多的機構也日益重視數據期刊平臺的創建與所發表的數據質量,如《自然》出版集團于2014年5月創辦了主要發表科學數據的開放存取期刊《科學數據》(Scientific Data),還有如愛思唯爾出版創建了的《基因數據》(Genomics Data)、中國科學院創刊了《中國科學數據》等。然而在數據期刊上進行成果發布對學者的數據素養有著很高的要求,如何實現科研數據的元數據準確描述、引用規范、易于發現并被共享和應用,都需要科研工作者既具備對所從事研究學科和承擔項目的成果知識的嫻熟駕馭能力,也需要數據的出版能力,即一些學者所演繹和統稱的學術出版素養能力。

2.數據密集型科研環境下科研人員數據素養能力與內容

由于普通科研工作者、數據管理從業者如數據館員、業界管理決策者對數據的審視視角、潛在需求存在差別,因此對數據素養的定義維度、素養知識結構組成等理解均不同。如Carlson認為數據素養能力主要由數據發現與獲取、數據管理、數據轉換與互操作、元數據、數據監護與再利用、數據長期保存、數據分析、數據可視化以及包括數據合理引用在內的數據倫理等組成;Calzada Prado認為數據素養能力主要由確認數據產生與再利用的情境識別來源數據的價值、類型及格式,確定何時需要數據,合適地獲取數據,評價數據及其來源,通過程序計劃、組織及自我評價,確定和利用合適的研究方法,操作與分析數據,展現定量信息,應用結果去學習、決策及解決問題等內容組成:秦健認為“科學素養教育(數據素養)的內容主要應涉及科學數據的收集技能、組織與管理的規則和技術、分析的工具和技能、保存與安全問題、科學數據共享規則、科學數據管理和應用中的法規和倫理道德等方面的問題。相較于信息素養的文化素養屬性,科學素養教育更加強調培養科研人員對科學數據的收集、存儲、管理、分析、評價和使用的能力”:沈婷婷認為“數據素養就是對數據的‘聽、說、讀、寫能力,也是對數據的理解、交流、獲取和運用的能力”:張艷梅認為“數據素養就是數據行為主體在符合社會道德和倫理基礎上所具有的對數據辯證、科學、正確的認識、管理和操作能力”。

盡管上述對數據素養能力范圍的表述視角有差別、有側重,但如果從科研項目生命周期管理和科學數據生命周期即雙周期理論的視角來看,筆者更加認同秦健的觀點,因為該表述盡管是一個主要基于數據生命周期管理角度的數據素養能力與范圍概括,但也從數據應用的維度和科研項目生命周期管理的角度給出了科研人員所應具備的數據素養的能力與技能范圍,對科研人員的數據素養教育和自我培養可以借鑒該概念表述進行相關課程的設置、意識的轉變強化與技能的實踐訓練。

3.數據密集型科研環境下的科研人員數據素養培養

3.1基于雙生命周期理論的科研人員數據素養培養框架

正如宮學慶等研究認為數據密集型科研環境下科研人員面臨的挑戰主要有科研項目生命周期管理過程中的挑戰和科學數據生命周期管理過程中的挑戰一樣,數據密集型科研環境下的科研人員數據素養培養與教育也可以分為基于科研項目生命周期和數據生命周期兩大類,但兩者互有交叉但又相互補充,相輔相成,也因此易于構建一個基于雙生命周期理論的科研人員數據素養培養框架模型(見圖1)。

從基于雙生命周期理論的科研人員數據素養培養框架可以看出,科研人員的數據素養教育實質上是基于虛擬現實空間(如增強現實空間、智能計算空間、泛在網絡空間等)及現代信息技術(如大數據技術、增加現實技術、物聯網技術、云計算技術等)的課堂教育與感知教育,進而使得科研人員在科研保障條件(如學科知識庫、機構知識庫、數據知識庫等)基礎上投入科研,并通過上述教育方式來提升自身及團隊的數據認知素養、應用素養和監護素養,以保證項目生命周期與數據生命周期的持續與順利開展(如數據生命周期的數據發現(生產)、數據備份(存儲)、數據管理(維護)、數據服務(使用),項目生命周期的項目設計、項目申請、項目實施、項目結項),最終實現科研成果的高效產出與共享交流(如數據出版、數據共享、數據引用等)。其中,感知教育(如空間感知教育、學科感知教育、)與課堂教育(如虛擬課堂、在線課堂、社區課堂)是科研人員數據素養教育的兩大主要形式與途徑。

3.2基于雙生命周期理論的科研人員數據素養培養途徑

3.2.1感知培養

科研人員的數據素養感知培養主要是指數據意識培養。本框架設計中的感知培養主要是指空問感知、學科感知與智慧感知。其中,空間感知是指科研人員通過感知生存的物理空問、群體空間、學術空問及虛擬網絡空間去感知從事科研活動所需要的數據能力與素養,并通過與其它群體、個體的模擬比較、現實實踐來評判自己在該空間中的生存與競爭能力,以找到差距并提高自身的數據素養,如在一個團隊空間內,通過感知每一個體具有的數據操作與獲取等能力,就能評判其所具備的數據素養水平高低:學科感知是指科研人員通過感知本學科領域的其它學者、團隊所從事相關科研活動的數據素養體現,來實現對自身數據素養水平的比較和提高,如參加本領域的數據素養大賽、前沿學術會議等就能清晰的感知本學科科研人員的數據素養水平:智慧感知是感知教育培養的最高境界,其不僅要感知社會環境、時代發展態勢等宏觀環境因素,也要感知科研人員所在學科、機構、團隊的發展態勢等中微觀因素,進而通過感知自己從事學術研究的前瞻性、學科深度等去評判自己的數據素養水平,其最大的難度可能在于缺少比較、學習與參考目標,主要依賴于自身對于主客觀環境及發展因素的判斷和自我要求能力,就如現在全社會倡導的“大眾創業、萬眾創新”,其不僅需要具備完成解決科研等遇到的問題的能力,也需要具備解決未來未知問題的能力,因而對相關人員的數據素養教育主要通過自身的智慧感知來實現。

3.2.2課堂教育

課堂培訓是目前信息素養、數據素養、媒介素養的主要培養方式,圖書館等教育機構相關的課程可謂層出不窮,且由于依賴于數據管理、數據監管的科學數據共享、存儲、引用與利用等工作崗位要求具備較高的專業化技能,美國的伊利諾伊香檳校區(UIUC)等圖書情報學院還設置了包括信息組織、信息倫理等多領域的數據管理教育(DCEP)課程體系,以實現對專業化人才的培養與教育。但需要注意的是,這類教育主要面向的是在校學生,圖書館的數據館員也主要局限于對服務對象的數據存儲等輔導服務層面,所承擔的對科研人員特別是科研教師的數據素養教育職能還不夠明確。本設計框架所提出的課堂教育就是對目前這一單薄領域的夯實之舉,即科研人員通過在線課堂、虛擬課堂及社區課堂來實現對自身及團隊數據素養的提高。其中,在線課堂主要指現實教育課堂與網絡教育課堂等面對面的課堂,虛擬課堂主要是指借助于網絡虛擬技術的MOOC教育課堂、視頻教育課堂等,社區課堂則主要是指基于網絡的Web問答社群課堂、基于人際網絡關系的社區課堂、基于團隊協作的社區課堂等。同時,由于數據素養既強調理論知識,又強調技能技巧,所以,這些課堂教育也絕不僅是理論知識的灌輸與相關知識的點對點、點對面傳播,也是具體科研或數據項目、數據平臺的操作實踐教育,美國等高校的數據管理本科生、研究生課程設置也都很好的體現了這一點。這也就啟示科研人員并不僅僅只是需要通過感知培養去提升自己的數據素養意識,也需要通過日常的理論知識學習及項目實踐來逐步提升自身數據素養。

4.結語

目前,科研工作流與數據生命周期已得到業界的廣泛重視,英國聯合信息系統委員會(JISC)、美國地質調查局(USGS)等國家組織委員會,英國數據管理中心(DCC)、英國數據檔案(UKDA)、地球數據觀察網絡(DataONE)等數據管理專業機構以及弗吉尼亞大學、阿爾伯塔大學、昆士蘭大學等學術研究機構紛紛就科研數據生命周期展開探索研究,建立科研工作流與數據生命周期模型,以規范和指導數據管理工作的順利開展。本文也在借鑒上述研究思路的基礎上,提出了基于數據生命周期與科研項目生命周期為理論基礎的科研人員數據素養培養框架,以為數據密集型科研環境下的科研數據素養提升與教育提供了一種思路與兩種教育方式,但本研究也存在著諸多不足之處,如對數據生命周期的劃分、教育途徑的延伸與豐富等還都存在著很大的研究提升空間。

猜你喜歡
數據素養科研人員
實現三代功能化輪烷樹狀分子合成
人社部印發意見 鼓勵科研人員創新創業
為科研人員減負要綜合施策
科學數據需共享科研圍墻也要拆除
企業科研人員激勵問題及對策研究
快來看,科學家都支持睡懶覺啦
大數據環境下高校圖書館的數據素養教育
大數據環境下高校圖書館的數據素養教育
基于文獻計量的數據素養及其教育領域研究態勢分析
大數據時代高校圖書館數據素養教育研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合