?

政府科學數據歸檔研究:以美國國家海洋和大氣管理局為例

2024-04-08 19:19孫曉燕國家海洋信息中心中國海洋檔案館王蘇李淵瑋國家海洋信息中心中國海洋檔案館
浙江檔案 2024年1期
關鍵詞:聯邦政府數據管理數據中心

孫曉燕/國家海洋信息中心、中國海洋檔案館 王蘇 李淵瑋/國家海洋信息中心、中國海洋檔案館

1 引言

科學數據是國家科技創新發展和經濟社會發展的重要基礎性戰略資源,是支撐國家科技創新的重要科技資源[1]??茖W數據歸檔是對原始數據及其衍生數據進行存儲、歸檔、管理和提供利用,實現科學數據永久保存。2016年數據歸檔首次作為1項任務列入《“十三五”全國檔案事業發展規劃》,2018年國務院頒布《科學數據管理辦法》提出要建立科學數據保存制度、配備數據存儲和管理設備設施,2021年《“十四五”全國檔案事業發展規劃》中數據歸檔任務增加至7項,明確要求“大力推進科學數據與科研檔案協同管理”,多項數據歸檔任務列入國家檔案事業發展規劃,標志著數據已成為檔案的重要來源。

美國在科學數據歸檔方面走在世界前列,是最早開展科學數據歸檔研究和實踐的國家[2]。20世紀中葉,聯邦政府就已著手建立科學數據歸檔的法律框架和政策體系,奠定了科學數據歸檔的制度基礎。20世紀80年代,里根政府提出收集國家科學基金會支持的科研項目產生的數據并集中提供使用。20世紀末,確立了在國家層面建設國有科學數據中心和信息全社會共享環境的戰略部署[3]。梳理美國聯邦政府機構科學數據歸檔相關研究成果和實踐過程,發現檔案管理員和科研人員之間缺乏有效合作,科研人員不認同科學數據和過程記錄的歸檔保存,檔案管理員在科學數據管理中未充分發揮作用是科學數據歸檔三個方面主要障礙[4-6]。美國國家海洋和大氣管理局是聯邦政府科研機構的縮影,通過深入分析政府相關管理政策和機構內部的數據歸檔制度,有助于深入了解美國聯邦機構科學數據管理的整體面貌。

2 研究案例——美國國家海洋和大氣管理局(NOAA)的科學數據歸檔

2.1 NOAA及其科學數據中心

NOAA成立于1970年,是一個隸屬于美國商業部以科學研究為核心任務的科技部門,轄國家氣象局、國家海洋局、國家海洋漁業局、國家環境衛星數據及信息服務中心等6個內設機構,主要關注地球的大氣和海洋變化,提供對災害天氣的預警,提供海圖和空圖,管理對海洋和沿海資源的利用和保護,研究環境保護,支持政府決策、學術研究和其他私營部門的經濟活動。

國家環境衛星數據和信息服務中心(NESDIS)是NOAA的數據集中保管基地,承擔數據歸檔和提供利用服務。NESDIS運營三個國家數據中心:國家環境信息中心(NCEI)、國家地球物理數據中心(NGDC)和國家海洋學數據中心(NODC),及一些小規模的“數據中心”。國家數據中心是大型存儲庫,負責歸檔、傳播和提供職權范圍內的數據管理。小規?!皵祿行摹碧峁┗陧椖炕蛱厥鈽I務的專門數據或專業知識,涉及范圍廣,包括為特定環境參數建立的數據服務節點(例如,國家冰雪數據中心、二氧化碳信息分析中心),為專門研究或專門業務服務的專門數據系統(例如:美國大湖區水文數據)等。

NOAA的科學數據管理和檔案政策受聯邦立法管轄,包括聯邦政府頒布的檔案和信息法,聯邦檔案行政管理機構和總統行政管理機構發布的政策等。NOAA在制定自己的命令和規定時,必須遵守聯邦政府及NARA的法令政策。

2.2 聯邦政府出臺的科學數據歸檔管理相關的法律政策

2.2.1法律。美國聯邦政府的檔案管理可追溯到1950年首次通過的《聯邦檔案法》,后與1978年頒布的《總統檔案法》合為2014年《總統和聯邦檔案法修正案》。該法律闡明了美國聯邦政府背景下檔案和信息的定義,并授權NARA使用一般文件清單和特別文件清單等工具管理政府信息。雖然它沒有具體提到科學數據,但該框架是管理聯邦政府形成的所有信息記錄的基礎。

21世紀通過的立法明顯影響了聯邦機構科學數據的管理和保存。2001年頒布的《信息質量法》直接影響政府機構生成的電子科學數據的管理。該法案要求機構發布的任何科學數據都必須遵守某些標準,以“確保并最大限度地提高機構發布信息的質量、客觀性、實用性和完整性”。盡管該法案沒有明確涉及數據保存,但使機構重新考慮他們形成數據及管理數據的方式。2002年頒布的《電子政務法》,確保公民能夠通過互聯網獲取政府信息。這項立法將電子文件和數據納入《聯邦檔案法》和其他與政府信息管理有關法律的管轄范圍。

2.2.2政策。聯邦政府數據管理政策指由政府行政辦公室或NARA發布的影響其他聯邦機構數據管理的備忘錄和指令。聯邦政府對數據管理相關問題的關注可追溯至2012年總統行政管理和預算辦公室(OMB)發布的《數字政府戰略》,通過美國開放數據站點(Data.gov)發布政府應用程序編程接口(API)索引,以便公眾便捷獲取政府數據,同時要求NARA確保數據隱私和安全,但并未特別關注科學數據。這份文件反映了聯邦數據政策領域的一個重要趨勢,即科學數據和行政數據之間的區別沒有明確界定。訪問科學數據的元數據要求與訪問行政數據的元數據要求不同,但在這份戰略文件中并未體現。

2013年發布的兩份備忘錄更直接關注科學數據和產生數據的機構。美國科技政策辦公室(OSTP)備忘錄重點關注年度研究預算超過1億美元的科研機構,增加對聯邦資助的科學研究成果的訪問要求,試圖通過指導機構制定計劃來管理科學數據,以確?!奥摪钯Y助研究成果的長期管理”。然而基于該備忘錄所產生的計劃并沒有明確機構如何加強數據訪問的具體操作,甚至沒有提到數據保存[7]。OMB備忘錄M-13-13要求各機構在收集和創建數據的時候要充分考慮下游數據處理和傳播[8]。這些傳播活動主要涉及科學數據目錄,也未直接提到數據保存。

2016年OMB發布《聯邦政府信息資源管理》(A-130)通告要求“將信息作為戰略資源進行管理”,更直接關注數據保存問題,通告指導聯邦政府機構如何管理不同類型的信息資源,從創建、處置、到移交至NARA,明確界定各方責任,A-130也是科學機構尋求數據管理指導的主要政策依據。A-130明確NARA的職責是執行《聯邦檔案法》要求,并為聯邦機構提供有關科學數據管理的指導,還明確要求要促進科學數據的有效利用和提升服務科學研究的能力[9]。

2019年之后,OMB連續發布聯邦政府機構數據管理指南,支持制定新聯邦數據戰略,呼吁機構改進科學數據管理。新數據戰略確認機構有責任“根據適用的法律、法規、政策、批準的文件清單和時間表等保存聯邦數據”[10]。備忘錄M-19-01征求各相關機構對該戰略的意見,備忘錄M-19-18正式采用該戰略并指出,數據保存是聯邦數據戰略的關鍵組成,呼吁機構“將數據管理經費納入年度經費預算,將數據作為戰略性長期資產”。政府不僅承認保存科學數據是一項重要目標,且認為有必要進行經費投入確保目標達成。2013年OSTP備忘錄沒有做出類似規定,只要求機構在現有預算范圍內支持更多數據管理工作。

2022年8月OSTP發布關于確?!懊赓M、即時和公平地獲取聯邦政府機構資助的研究”的備忘錄,對2013年OSTP發布的關于公眾獲取公共資助研究成果的備忘錄進行了深化擴展。新OSTP備忘錄要求政府資助的研究數據立即提供給公眾自由獲取和免費使用。新政策取消了獲取研究成果12個月等待期,要求科學研究出版物出版后應在指定的數據庫中免費提供給公眾,任何人都可以立即訪問和使用。

2.3 NOAA內部的政策

2.3.1行政命令。NOAA第205-1行政命令“文件管理計劃”,建立NOAA檔案和科學數據管理基本框架,明確科學記錄管理的目標是永久保存有價值的科學資產,并最終移交NARA長期保存。第212-15號行政命令“環境數據和信息管理”,明確管理環境數據的機構內部政策,并通過一系列程序指令實施。這些指令明確了環境數據在其整個生命周期內的管理要求,并確保將其移交至NARA。

2.3.2一般文件清單。一般文件清單和機構特別文件清單構成聯邦機構檔案記錄的主要內容,且明確每項記錄的保管時間表,兩部分清單列出的記錄內容密不可分,對于理解聯邦政府科學數據管理方式至關重要。一般文件清單包含聯邦政府機構的共有文件材料,不涉及科學數據,而是“特定機構的文件清單中涉及的與任務相關的研究、監測和執行活動的工作記錄”,例如日常人事管理文件和一般任務管理文件。

2.3.3特別文件清單。NOAA特別文件清單由多個部分組成,每部分清單標題都包含對相關記錄的描述,以及關于保留期限和處置權限的說明。這些條目是聯邦記錄管理和處置的指示圖,機構員工和NARA都會使用這些條目。例如在機構特別記錄清單1406-6.1中,概述了大氣觀測數據的管理要求,不同記錄格式的數據處置要求不同,例如“表格式的地面氣象觀測、雷達觀測、衛星觀測、氣象觀測和浮標觀測”記錄的處置說明是“數據記錄每年截止一次,記錄保管滿75年后的5年內移交NARA”。這表示NOAA在75年時間內可繼續使用這些數據,同時也承擔科學數據安全保管責任,確保數據最終以安全和可訪問方式移交NARA[11]。

2.4 NOAA科學數據歸檔問題

研究表明,影響NOAA科學數據歸檔、管理和保存的政策數量多且內容豐富,但在確定數據管理最終權力方面也存在問題。例如,NOAA科學數據歸檔管理政策制定受NARA“評估政策”影響,NARA是科學數據歸檔和處置的決策者,科學數據中心在制定數據收集和共享等政策時,應征詢NARA評估專家意見,但NARA評估專家普遍缺乏科學知識,影響有關數據保管期限和處置的決策。

面對現今的數字環境,檔案保存也存有復雜性。如NOAA特別記錄清單1406-05.3描述了海洋表面氣象觀測記錄的處置要求,這些觀測數據來源于調查船只和觀測浮標,許多是聯邦政府最早的氣象數據,在記錄清單中被定為永久保存。按規定觀測記錄滿75年應在5年內移交NARA,該要求僅適用于紙質文件。此外還規定在文件掃描和驗證后,當不再需要審計或作為電子記錄的備份,在NARA確認后,掃描記錄成為副本,紙質文件可銷毀。其中存在一定問題,NARA如何確定紙質材料不再需要作為電子版本的備份?電子檔案保存是否足夠成熟,確保能永久訪問。

此外,NARA已開始管理科學數據,但與聯邦政府對科學數據的關注程度的要求還有差距,越來越多的責任落在科研機構上。從NOAA案例可看出,其在科學數據管理方面歷史悠久,有專門負責科學數據中心NESDIS,而聯邦政府內的其他機構可能沒有。經費投入和基礎設施建設是實現科學數據管理的基本條件,NARA和聯邦政府各機構同樣面臨挑戰,如何在政府層面建立完善的科學數據歸檔、管理和長久保存框架,平衡科研人員、用戶和檔案管理員的需求,并確??茖W記錄長久可用,更多問題還亟待探索研究。

3 聯邦政府科學數據歸檔的特點

3.1 法律政策體系完備

前文分析可以看出,聯邦政府出臺了系統化的科學數據歸檔法律框架和政策體系,大致分為三個層面:分別是政府層面出臺的相關法律明確科學數據歸檔的基本框架,行政部門和檔案部門制定行政命令明確數據歸檔的總體導向和要求,科研機構在檔案部門的指導和評估下制定具體的操作文件,由此自上而下形成了非常完備的政策體系。政策體系的建設過程是根據實踐需求逐步建立和完善的,前期從數據共享利用角度出發,更關注科學數據的可用性和開放,逐步認識到科學數據的長期保存價值,出臺關于歸檔保存的相關政策。非常值得學習的是科研機構內部制定的特別文件清單,針對不同來源不同科學要素的科學數據制定的保管期限、處置周期和管理職責劃分等非常詳盡、更具有操作性,直接決定數據的處置過程和長久可用。

3.2 強調開放共享

“開放共享”是聯邦政府科學數據管理的核心理念,充分和開放地獲取數據是所有聯邦機構科學數據管理應遵循的基本原則。聯邦政府自1990年啟動科學數據共享計劃,已成為聯邦政府的一項基本國策,經過近30年的制度建設,通過各項法律、政策和法令已將科學數據完全、開放、無償的理念落到實處。2013年出臺的政府備忘錄中有關科研項目產出成果還設有12個月的等待期,2022年的政府備忘錄已經要求科研項目數據無條件即時共享。前文NOAA明文規定除機密數據外所有科學數據都應遵守完全開放和容易利用的基本原則。聯邦政府認為科研成果和科學數據的共享,可以節約社會資源,加速科技創新,減少重復投入,擴大聯邦政府投資的社會影響力。聯邦政府資助項目還將制定數據共享計劃,確保項目成果數據長久保存和提供公眾利用作為獲得項目資助的前提條件,如美國國家自然科學基金委員會(NSF)制定了“數據管理計劃”(DMP),要求項目申請時提交項目計劃,采取措施促進成果數據共享和傳播。

3.3 科學數據中心作用凸顯

20世紀90年代聯邦政府啟動的數據共享計劃包括國家級數據中心群與數據信息共享網絡建設,并著手建設國家級數據中心,例如NOAA設有國家環境衛星數據服務中心負責數據的管理、歸檔和服務,美國國家航空和航天局(NASA)設有美國空間科學數據中心(NSSDC)和空間物理學數據運行中心(SPDF)負責天體物理學、空間物理學數據歸檔保存。聯邦政府已經建立多級專業數據中心來實現數據管理,除國家級數據中心外,還有NSF批準和授權成立各類數據管理中心。2007年NSF實施DataNet計劃,將高校圖書館建設成為高??蒲许椖繑祿行?。密集的科學數據中心網絡構成數據歸檔的堅實基礎,并按照法令確定的流向在檔案部門匯集。

科學數據具有極強的專業性,要充分發揮科學數據的作用,必須依托各科學數據中心,尤其是國家數據中心。在科學數據最終移交NARA之前很長一段時間內,比如NARA的海洋氣象觀測記錄產生后的75年內都屬于科學數據中心的職權范圍,要充分發揮科學數據的價值且確保其能最終安全無損移交NARA,科學數據中心作用至關重要,除提供科學數據開放共享服務之外,還要按規定處置和管理,保障科學數據安全保管和長久可用。

4 對我國科研機構科學數據歸檔管理的啟示

4.1 完善科學數據歸檔法律框架和政策體系

目前國家層面出臺對科學數據歸檔管理具有指導性的法律包括《檔案法》《數據安全法》《科學技術進步法》,其中均未直接提到科學數據?!稊祿踩ā穫戎卣諗祿谋C芎桶踩芾?,《科學技術進步法》僅對財政經費支持的科研機構提出要建立資源共享機制。2018年的《科學數據管理辦法》是首次在國家層面出臺的科學數據管理文件,但目的是促進數據共享,沒有直接提到數據歸檔要求和最終流向等。相關部委制定的科學數據管理文件很多,如《地質資料管理條例》《海洋觀測資料管理辦法》《氣象資料共享管理辦法》等,主要關注科學數據的采集、處理、共享和利用,同樣未涉及科學數據歸檔問題。

基于現狀,應加強國家層面法規政策的頂層設計,提出科學數據歸檔相關法律框架和政策體系建議,明確科學數據歸檔管理的總體要求和數據流向,厘清相關國家檔案部門、科學數據管理中心、科研機構等在科學數據歸檔流程中的職責。各專業領域主管部門制定數據管理制度時要充分考慮數據歸檔,尤其要在國家檔案部門的指導下,組織科研機構制定各學科各要素科學數據的處置程序、歸檔流程和保管時間表,確保歸檔工作有據可依。

4.2 強化科學數據開放共享理念

長期以來,我國科學數據共享方面“飽受詬病”,共享狀況不盡人意,很多專業領域的數據保密的界限始終不清晰,經常以“保密”需要為由,推遲本應共享的數據。雖然科研人員有共享意愿,但涉及具體共享行動時,往往受制于缺乏政策依據,沒有明確可參照的制度執行,缺乏數據共享平臺或數據質量等因素,影響數據共享的效果?!犊茖W數據管理辦法》首次在國家層面提出“共享是常態、不共享是例外”的科學數據管理指導思想,然而開放共享理念的提升需要一個長期過程,需要從政策、管理到技術等全方面進行完善和改進,需要通過政策驅動營造數據必然共享的氛圍,通過制度約束和激勵機制調動科研人員的能動性和主觀意愿,確保數據開放共享成為共識。

4.3 推進國家科學數據中心群建設

科學數據中心是匯集、管理、開放、共享和提供服務的重要基礎設施,建設以國家科學中心為主,各級各類科學數據中心為補充的數據中心群網是實現科學數據有效管理的重要手段。2004年起財政部和科技部聯合啟動了國家科技資源共享平臺建設,截至2022年底已形成20個國家科學數據中心,協調和推進各學科領域的科學數據管理。除國家科學數據中心建設外,還應促進各國家重大研究計劃如“國家重點基礎研究發展計劃(973計劃)”“國家高技術研究發展計劃(863計劃)”等建設綜合性數據中心,圍繞重點領域、特殊業務等建立特色科學數據中心,還可以借鑒美國經驗,以高校圖書館為平臺打造高??茖W數據管理中心集群,以專業檔案館為平臺建設專業領域數據中心集群等。通過數據中心群網建設,促進海量科學數據資源的匯集,夯實數據歸檔資源基礎。

猜你喜歡
聯邦政府數據管理數據中心
酒泉云計算大數據中心
企業級BOM數據管理概要
定制化汽車制造的數據管理分析
海洋環境數據管理優化與實踐
CTCS-2級報文數據管理需求分析和實現
民航綠色云數據中心PUE控制
美國聯邦政府高等教育的治理機構及其組織設計
美國民兵領袖被判68年
美國最高法院支持奧巴馬醫改法案
基于云計算的交通運輸數據中心實現與應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合