?

美國國家實驗室開放共享的實踐經驗及啟示

2020-02-19 09:09黃廷政蒙紹新黃雨婷
實驗室研究與探索 2020年12期
關鍵詞:實驗室信息

黃廷政, 蒙紹新, 劉 靜, 劉 洋, 張 娜, 黃雨婷

(1.中國電力科學研究院有限公司,武漢430074;2.武漢大學信息管理學院,武漢430072)

0 引 言

2018 年3 月,國務院印發《積極牽頭組織國際大科學計劃和大科學工程方案》[1],要求綜合性國家科學中心實現在國際范圍內的資源開放共享。2019 年5月,中央全面深化改革委員會第八次會議強調要“以開放促進發展”[2]。美國聯邦政府開發的開放數據交換平臺Data.gov 囊括了國家、州、地方等各級各類政府數據資源,其中能源部(Department of Energy,DOE)貢獻了近3 000 份能源相關的多主題、多格式數據集。2019 年2 月,我國科學院印發《中國科學院科學數據管理與開放共享辦法(試行)》,涉及科學研究和試驗數據開放的職責分工、數據管理、開放途徑、保障機制和安全保密等方面[3]。

近年學者從現狀[4-5]、管理模式[6]、策略[7]、動力分析[8]和影響[9]等角度入手,對科研儀器和科研信息資源的開放共享實踐進行了研究,而對歐美科研機構實驗研究體系開放共享中的優秀案例研究較少。美國能源部國家實驗室歷史悠久,實力雄厚,科研成果頗豐[10]?,F以DOE及其下屬17 所國家實驗室為研究對象,調研其開放政策、開放手段、開放內容方面的建設進展,總結國外實驗研究體系開放共享經驗,為國家電網有限公司開放共享實踐提供借鑒。

1 完善的開放共享政策法規

1.1 承上啟下的開放共享政策

DOE的開放共享政策上承國家宏觀政策,緊密服務于國家發展戰略規劃,17 個下屬實驗室貫徹落實上級政策,結合工作實際制定了機構內部的開放共享規章制度。2013 年2 月,美國白宮科技政策辦公室(Office of Science and Technology Policy,OSTP)發布《科學技術政策辦公室備忘錄》[11](Office of Science and Technology Policy Memorandum, OSTP Memorandum)(下稱“《OSTP備忘錄》”)提出要“改善聯邦資助科學研究成果獲取”。2014 年7 月,根據《OSTP備忘錄》要求,DOE 出臺《公共獲取計劃》[12](Public Access Plan),落實了公共獲取對象、利益相關者責任、實施步驟、效果評估等問題,希望“通過該計劃中討論的政策和機制…為增加創新、商機和加速科學突破奠定基礎”,為包括17 個國家實驗室在內的能源部各級部門開放共享實踐提供了政策保障。

一些實驗室響應國家及DOE的政策號召,編制了適用于機構內部的開放共享政策,如洛斯阿拉莫斯國家實驗室(Los Alamos National Laboratory,LANL)認為開放獲取可以滿足國家和資助者的需求、提高機構影響力,據此出臺了《LANL關于公眾獲取科學和技術信息的政策》[13](LANL Policy on Public Access to Scientific and Technical Information),規定“由實驗室研究產生的、不受限制的學術出版物應向公眾開放”。國家實驗室在國家政策及DOE 政策的總框架下編制更詳細、具體的開放方案,形成層層遞進的政策體系,既有利于聯邦政府指示精神精準傳達到執行部門,又有助于不同部門的個性化發展。然而還有部分實驗室尚未建成或公開機構開放共享政策,實驗室之間的開放共享法律法規建設進程不統一。DOE 需考慮加快建設和完善實驗室一級的開放政策體系,深化開放共享格局。

1.2 多對象的開放共享規定

1.3 審慎的開放共享審核程序

《公開發布數據的程序》[16](Procedures for Public Release of Data)規定了數據開放的審核加工流程。首先數據的不同利益相關人員共同參與數據質量、安全性、敏感性和必要性等方面的初步審查。在諸多聯邦和DOE的信息分類、信息隱私、信息質量、記錄程序相關的法律規定及行政命令指導下,行政或計劃辦公室采用統一元數據描述數據,并將規范后的數據提交首席信息官辦公室(Chief Information Officer,OCIO)的開放數據主管人員,對數據集的安全性和數據質量進行終審,確保公開數據的安全性、規范性。

DOE在數據開放流程中特別重視數據質量和數據安全兩方面的問題。數據質量主要是指來源信息的正確性及元數據的準確性。初審工作人員負責初步評估信息質量,確保標識信息來源準確。終審人員圍繞元數據和來源信息的準確性和完整性進行質量審查。DOE在初審環節依據多份政策法規要求,辨別和剔除人員信息、部門信息及國家機密數據,確保DOE 信息不會與其他部門的開放信息結合產生鑲嵌效應,保障了數據安全。

規范開放數據流程,有利于保障數據準確程度和質量。國家實驗室涉及數據敏感性問題,嚴格的審核程序有利于保障數據安全。目前DOE 并未對數據審核人員的選拔做出詳細規定,但審核人員能力高低一定程度影響了開放數據的質量高低,今后可加強審核人員資質管理,為數據開放實踐提供人才保障。

2 復合式的開放共享手段

2.1 依托各級平臺開放數據

DOE響應國家政策,在全國統一的政府數據開放平臺共享數據。下屬實驗室還自建了多個特色化的數據共享平臺,大大增加了數據的可發現性。

2009 年美國推出政府數據開放平臺Data.gov。2013 年美國政府發布了《開放數據憲章》[17](Open Data Charter),規定要及時以盡可能多的格式發布高質量數據。2018 年出臺的《基于證據的政策制定法案》[18](H.R.4174 - Foundations for Evidence-Based Policymaking Act of 2018)要求聯邦機構使用標準化的開放形式在線發布政府信息及其元數據。DOE 積極響應政府戰略規劃,在Data.gov 數據開放平臺上共享了近3 000 份能源相關數據集[19],主要涵蓋了能源基礎設施、能源供應、能量轉換等主題,包括HTML、PDF、DOC、JPEG 和CSV 等諸多格式的網頁、文本、圖片、視頻和網頁。

數個DOE 下屬機構自建了機構信息開放平臺。能源信息管理局(Energy Information Administration,EIA)是DOE 內部的統計和分析機構,主要負責收集數據并進行分析、趨勢預測工作,并將工作成果發布于EIA的獨立門戶網站[20]。能源效率和可再生能源辦公室(Office of Energy Efficiency and Renewable Energy,EERE)建有能源信息開放共享平臺:OpenEI[21],為用戶提供可再生能源和能源效率方面的原始數據、模型、工具、政策法規和數據分析的訪問途徑。網站用戶可以免費查看數據、進行數據編輯和下載等操作。截至2014 年,OpenEI擁有近63 萬名用戶,超過4 萬個Wiki頁面以及數十個項目的眾包數據。一些下屬實驗室也建有開放存取平臺,如LANL的“洛斯阿拉莫斯在線研究”(Los Alamos Research Online)開放資料庫向公眾提供開放獲取的學術出版物;勞倫斯伯克利國家實驗室(Lawrence Berkeley National Laboratory,LBNL)的電力數據門戶(Power Data Portal)提供瀏覽、下載電力數據集的服務[22]。

科研數據與國家統一政府數據開放平臺連接,有利于集中獲取科研信息,擴大DOE科研影響力。不同平臺的開放方式各具特色,DOE 下屬部門建立的專題數據開放平臺LANL與LBNL側重于直接開放原始研究數據,EIA 門戶網站則偏重數據分析和趨勢預測,OpenEI以共建共享為原則,將公眾力量融入網站建設。這些平臺在數據、專業化程度方面都各有側重,有助于目標明確的用戶根據信息需求以及知識水平迅速定位合適的資源。但構建多個平臺分散了信息資源,且在平臺構建過程中容易出現重復建設等問題,維護多個不同平臺也需要更大的工作量和運營成本。

2.2 豐富公眾科研參與方式

考慮到不同社會群體科學素養水平差異,實驗室在活動中細分用戶類型,分別就公眾和學者設計公共活動,在活動開展過程中強調及時了解用戶反饋的重要性,利用電子郵件、社交媒體、GitHub 等交互式的多元通信渠道與用戶互動。

近年來,我市各級黨委政府在落實國務院《農業保險條例》、貫徹國發〔2014〕29號文件精神、積極探索農業保險工作中,采取先行試點、總結經驗、逐步拓展的工作方法,使全市農業保險工作實現了較快發展,取得了明顯成效。據統計,2018年全市農業政策性保險已完成381.4萬畝,比上年同期增長7.9%。

面向普通公眾的活動專注于基礎能源科學知識,趣味性強。阿貢國家實驗室(Argonne National Laboratory,ANL)成立了“演講局”(Speakers Bureau)機構,邀請實驗人員在“大聲演講系列”[23](Out Loud Lecture Series)演講會活動向對前沿科學感興趣的公眾提供“城市轉型”“土壤科學”“能源創新”等主題的公共講座。費米國家加速器實驗室(Fermi National Accelerator Laboratory,FNAL)面向公眾的開展“橙色”座談會[24],介紹與公眾生活息息相關的科學研究。國家加速器實驗室(SLAC National Accelerator Laboratory,SLAC)還會開展專門面向公眾的“藝術遇見科學”系列講座和“社區日”活動[25],通過有趣的實驗或活動,鼓勵公眾學習科學知識并從中發現樂趣。

面向有能源科學研究背景的用戶,DOE 的活動內容更加專業。與開放數據中心企業(Center for Open Data Enterprise)共同發起“能源開放數據圓桌會議”[26](Open Data Roundtable),召集了約60 名能源數據負責人,探討開放能源數據的用途、優勢及不足。發起“美國能源數據挑戰賽”[27](American Energy Data Challenge),展示部門的開放數據資源,向廣泛人群征求改進意見。FNAL定期舉辦專門面向科技工作者的“綠色”座談會,介紹實驗室的研究前沿。

基于淺顯易懂科研知識的活動對缺乏科研背景的公眾而言更具吸引力,有利于激發大眾學習科學知識的熱情。與此同時,能源專家也能通過DOE的活動獲取前沿和專業的學科信息。因人而異的活動方式擴大了DOE開放共享活動的影響力。

3 多種類型的資源開放共享

3.1 共享科研數據

根據LANL的數據管理政策,研究產生的不受限制的觀測和模擬數據、軟件和算法、文本以及相關的元數據等以數字形式存儲的各種信息都應開放,據此,LANL在研究圖書館內設立了專門的數據工作組,支持對研究數據在數據生命周期內的管理。LBNL 建立了電力數據門戶(Power Data Portal)向公眾提供了可下載和可視化的電力相關數據集[28],還提供數據可視化分析等服務。實驗室工作人員對開放數據持積極擁護的態度,主動推動科研數據的開放進程。2019 年1月,來自LBNL的研究人員在《科學》雜志上呼吁就出版前數據共享制定明確的政策[29]。

3.2 支持開放存取

實驗室響應DOE 開放存取政策《公共訪問計劃》,積極開展個性化實踐,采取了將科研出版物納入DOE統一開放系統、在官網開設科研文件檢索入口、自建開放存取平臺等特色開放手段。2015 年10 月,LBNL要求與實驗室相關的所有出版物都必須納入DOE的開放訪問系統[30],SLAC 則在專門的機構網站為用戶提供最新研究成果的PDF 文件[31]。部分實驗室建立了獨立的開放存取資料庫,如LANL 的圖書館開發和維護了旨在提供學術出版物的洛斯阿拉莫斯研究在線(Los Alamos Research Online,LARO)資料庫。多樣化開放獲取手段有效促進了實驗室科研成果的快速傳播,但各開放存取平臺缺乏統一管理規范,開放措施尚不統一。

3.3 開源研究工具

開源軟件是DOE 開放共享的重點之一。根據實驗室研究重點和優勢的不同,實驗室公開的開源軟件類型也有區別。艾姆斯實驗室(Ames Laboratory)在美國政府授權下共享了數個應用于分析網絡攻擊、量子力學、化學與材料科學等領域的開源軟件包[32],公眾可免費獲取、修改和使用。PNNL 的運動分析(Analysis in Motion,AIM)項目開發了可視化、機器學習、數據挖掘相關的系列開源軟件包,在GitHub 上與大眾分享[33]。一些實驗室還開發了開源軟件平臺,如PNNL的“VOLTTRON”開源軟件平臺可應用于建筑物、可再生能源系統和電網系統等眾多領域[34],幫助用戶快速開發和部署能源控制解決方案。

開源軟件的開發和使用應該與社會實際需求緊密結合。例如,針對極端天氣破壞電力網絡問題,LANL研發了免費開放源代碼軟件,用以預測颶風等極端事件對公用電網電力輸送的影響[35]。在調研社會需求的基礎上,可進一步追蹤開放資源后續使用,這不僅有利于明確資源的經濟、社會價值,還能夠幫助實驗室反思資源應用,根據實際情況調整后續研發工作。

3.4 共享基礎設施

開放共享世界領先的科研設施,既有利于充分發揮設備價值,也給予了機構外科研人員參與前沿研究的機會,由此創造更豐富的科研成果。DOE 國家實驗室維護和運營有超級計算機、粒子加速器、大型X 射線光源等26 個實驗設施,被全球近3 萬名研究人員使用。對執行非專有研究并同意發表研究結果的用戶,DOE通常只收取運營和消耗品費用;對不打算出版的專有研究,DOE可以全額收回成本的方式開放。2018年7 月,美國能源部啟動了“國家實驗室合作伙伴服務”(Lab Partnering Service,LPS)計劃[36],為投資者、創新者和機構開放能源部17 個國家實驗室統一在線訪問網站平臺[37],網站平臺提供“用戶設施協議”(User Facility Agreements)服務,中心目標就是利用能源部國家實驗室的技術專長,向大眾提供先進實驗設施。

3.5 嘗試開放科學

鑒于國家實驗室的研究活動涉及到機密程度較高的科研內容,實施科研生命周期的全開放存在一定困難,但對于非涉密問題,可以嘗試提高研究透明度、提升科研效率。開放科學是指“研究人員可以自由獲取研究數據、實驗室筆記和其他研究過程,重復使用、重新分配和復制研究、基礎數據和方法,進行協作研究的科學實踐”[38]。聯合國教科文組織(United Nations Educationnel, Scientific and Cultural Organization,UNESCO)認為向研究者及廣大市民提供開放可用的在線學術信息有利于促進全球的知識流動[39]。目前在全球范圍內,許多機構組織開展了開放科學的實踐探索。例如,歐盟著力推動促進公共財政資助科學數據開放共享的“S 計劃”[40],以期實現科學出版物免費即時開放;美國開放科學中心(Center for Open Science,COS)6 年間公開了近200 萬份科研文檔、近6萬份科研項目資料及27 000 余份預印本資源[41]。在此形勢下,DOE下屬的太平洋西北國家實驗室(Pacific Northwest National Laboratory,PNNL)率先開展了開放科學實踐活動,在2015 年初利用土壤化學和生物學特性方面的研究成果進行“開放實驗”,實時在線記錄研究工作各個階段的數據,使用版本控制、問題跟蹤和開源統計軟件等的軟件工具提高數據完整性和研究步驟的透明度。

4 對我國國家電網的啟示

4.1 構建完善的政策法規

開放共享實踐的順利推進離不開體系完整的政策指導。目前,國家電網公司在實驗室儀器設備共享服務方面進行了一些探索性工作,并將導向性規定納入公司管理辦法,但尚無操作性強的細則出臺。公司亟須構建一套由上至下的開放共享政策體系。

科研機構內部開放共享政策要緊跟國家總體發展戰略規劃。近年來我國相繼出臺了《教育部、科技部關于加強高等學??萍汲晒D移轉化工作的若干意見》[42]《國家重大科研基礎設施和大型科研儀器開放共享管理辦法》[43]《國務院辦公廳關于印發科學數據管理辦法的通知》[44]《國家科技資源共享服務平臺管理辦法》[45]等政策,從平臺建設、成果轉化、科研設施、數據、資源共享等角度對科研機構共享實踐提出要求。國家電網公司應積極響應國家戰略規劃,結合公司實際制定專門的開放共享政策和發展路線。構建了國家、公司和基層3 級實驗體系,囊括了數以百計的實驗室。這些實驗室應根據研發活動特點建立規定細則。

國家電網公司開放共享政策主要側重點是實驗儀器設備開放,要求完善實驗室基礎設施共享機制,提升實驗室資源使用率,節省建設成本,為其他有實驗設備共享需求的科研單位提供平臺,促進科研創新。但開放共享實踐僅涉及設備共享還遠不夠。DOE 分別制定了開放存取、開放數據和設備等領域的政策。2018年國務院辦公廳印發的《科學數據管理辦法》中明確表示企業等法人單位應建立科學數據管理系統,公布科學數據開放目錄并及時更新,積極開展科學數據共享服務[46],國家實驗室還需要增加科學數據開放、開放存取等政策建設,全面支撐國家科技創新、經濟社會發展。對實驗室活動中的保密信息和資源的審查、辨別和處理是政策制定中需要重點考慮的問題,借鑒DOE的多重審查制度,我國電網公司在開放信息過程中,還要特別注重信息安全性和信息質量的審查。

4.2 應用復合式共享手段

建立統一數據開放平臺有利于廣泛傳播開放共享資源。雖然國家電網公司實驗室共享平臺已上線試運行,但平臺穩定性、易用性不足,未形成數據填報信息維護標準,后期平臺使用培訓推廣以及和國家級平臺數據對接工作尚未開展。公司可參考DOE 將科研數據上傳至data.gov的實踐,將科研數據上傳至國家級別的政府數據開放平臺之中,為全國的利益相關者提供電力相關的科研信息。這對于增加公司及其科研成果的全國影響力、促進科研成果轉化有一定幫助。

DOE及其下屬實驗室都開展了平臺建設工作,雖然這些平臺各有特色,但也造成了資源分散、不便獲取等弊端。在國家電網公司實驗室體系的建設過程中,要避免實驗室開放平臺各自為政,建議國家電網公司進一步完善實驗室共享平臺,集成各實驗室優勢資源,整合原始數據和數據分析等功能。各研究部門通過統一的平臺發布特色化主題數據集,并提供相應的數據瀏覽、數據分析、可視化、數據下載服務。

多樣化的主題活動有利于喚醒公眾科研意識。目前國家電網在官網的電力科普板塊為大眾講解用電常識,擴充普通民眾電力知識儲備,但前沿科研信息資源分享尚不充分、活動形式尚不豐富??赏ㄟ^圓桌會議、主題講座等多種活動形式傳播科技知識,并注意細分用戶群體。面向大眾的科普座談活動的目的主要是分享淺層知識,氛圍應輕松愉悅。面向專業研究人員,可以共享前沿科研信息、激發科研靈感。同時也應重視與用戶建立良好的雙向交流機制,通過電子郵件、社交媒體等暢通交流渠道。

4.3 全面開放科研資源

公司可將數字、代碼、圖像等多種形式的科研數據開放到國家電網開放共享平臺,并進一步連接至國家平臺??紤]以開放存取形式出版不涉密的科研出版物。DOE在一些共享平臺設置了用戶入口,鼓勵用戶上傳自定義的能源信息。國家電網公司可在科研數據和科研出版物的開放平臺內開辟專門的用戶參與模塊,但需嚴格把關用戶共享的數據和元數據質量,建立完善的數據質量審查機制,保證開放共享平臺數據的可靠性。在科研活動中開發的軟件可以作為開源軟件開放到GitHub平臺,追蹤開源軟件的使用情況,并根據反饋改善軟件性能??梢酝茝V產生了良好社會影響的開源軟件,并將其作為電網公司宣傳案例,以期擴大公司影響力。

國家電網公司下屬實驗室的儀器設備開放共享積極性不高,部分實驗室存在儀器設備閑置現象。也有部分實驗室進行了有益的嘗試和探索,但由于機制約束和人員限制,并沒有開展大規模的共享工作。為貫徹《國務院關于國家重大科研基礎設施和大型科研儀器向社會開放的意見》,公司可參考DOE 實驗設備開放實踐,建立統一的實驗室科研設備申請平臺。在受理開放共享設施的申請時,公司既要考慮申請的科研價值,又要將其社會和經濟價值納入綜合考量。

目前開放科學運動在全球范圍內展開,PNNL 實驗室率先開展了開放科學實踐。電網公司可采取試點先行的形式開放部分非涉密實驗的代碼數據、文件資料,提高開放數據完整性和科研活動透明度,從而提高科研效率,促進創新發展。

5 結 語

探索、建立以公司各級實驗室為主體的開放式創新體系,不僅是國家電網創新發展的需要,也是公司各級實驗室發展的內生需求。目前,國家電網下屬實驗室在開放共享的制度、平臺、人員建設方面還存在不少問題,急需建立一套較為完整的開放共享機制。美國能源部實驗室的開放共享經驗對國家電網實驗研究體系的優化與調整具有重要意義,將推動公司科技創新與國家開放共享政策的雙向良性互動。

猜你喜歡
實驗室信息
電競實驗室
電競實驗室
電競實驗室
電競實驗室
電競實驗室
電競實驗室
訂閱信息
展會信息
信息
健康信息
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合