?

大數據時代檔案數據開放共享監管:價值、機制與推進理路

2023-11-12 19:31周林興黃星
檔案與建設 2023年8期
關鍵詞:開放共享監管機制大數據

周林興 黃星

摘 要:大數據時代,加強檔案數據開放共享監管是推動檔案數據治理體系和治理能力現代化的必然要求,有利于助推檔案事業高質量發展。文章在闡釋檔案數據開放共享監管價值的基礎上,基于前端控制與全程管理理念,圍繞檔案數據開放共享的準備、進行與維護階段,構建事前防控、事中監控與事后管控三者協調運行的監管機制,并從監管環境、監管主體、監管技術等層面提出檔案數據開放共享監管的實現路徑,以期助益檔案數據開放共享長期可持續發展。

關鍵詞:大數據;檔案數據;開放共享;監管機制;多元協同

分類號:G273.5

Regulation of Open Sharing of Archival Data in the Era of Big Data: Value, Mechanism and Promotion Rationale

Zhou Linxing, Huang Xing

( School of Cultural Heritage and Information Management, Shanghai University, Shanghai 200444 )

Abstract: In the era of big data, strengthening the supervision and regulation of open sharing of archival data is an inevitable requirement to promote the modernization of archival data governance system and governance capacity, which is conducive to the highquality development of archival undertakings. Based on the concept of front-end control and full-process management, this article explains the value of regulating the open sharing of archival data, builds a regulatory mechanism based on the preparation, implementation and maintenance stages of open sharing of archival data, and proposes the realization path of regulating the open sharing of archival data from the levels of regulatory environment, regulatory body and regulatory technology, with the hope of benefiting the long-term sustainable development of archival data sharing.

Keywords: Big Data; Archival Data; Open Sharing; Supervision & Regulation Mechanism; Multivariate Collaboration

檔案數據是指“數據化的檔案信息及具備檔案性質的數據記錄”[1],不僅包括檔案部門已掌握的各類數字化檔案資源、電子檔案等,還包括具有長久保存價值但尚未納入檔案部門保管范圍的數據,以及檔案部門在檔案管理業務活動中產生的各類數據。[2]大數據時代,數據技術與檔案工作深度融合,檔案數據開放共享日益受到重視。然而,反觀現實,我國檔案數據開放共享整體上仍處于起步階段,存在檔案數據開放共享總量偏低、程度有限、質量不佳、倫理問題凸顯、民眾參與缺乏等問題,無法滿足檔案數據開放共享縱深推進的發展要求。[3]究其原因,主要是檔案數據開放共享缺乏有效監管,阻礙了其健康發展進程。2021年,中共中央辦公廳、國務院辦公廳印發《“十四五”全國檔案事業發展規劃》(以下簡稱“《規劃》”),明確提出要“健全‘互聯網+監管’手段……推動檔案全面納入國家大數據戰略”[4],并且11次提及要加強對檔案和檔案工作的監管,這為檔案數據開放共享監管提供了政策支持,具有深刻的指引意義。

當前,學界主要圍繞政府數據開放共享監管[5]展開探討,未能關照檔案數據開放共享監管這一研究題域。檔案數據作為政府數據不可或缺的組成部分,對其開放共享監管展開研究也理應引起學界關注和思考。因此,本文立足大數據時代背景,全面闡釋檔案數據開放共享監管的價值,系統構建檔案數據開放共享監管的機制,并針對性提出檔案數據開放共享監管的實踐路徑,以期優化檔案數據開放共享格局,推動其平穩健康發展。

1 大數據時代檔案數據開放共享監管的價值闡釋

1.1 保障數據安全,規范檔案數據開放共享秩序

大數據時代,檔案數據雖類型豐富、價值巨大,但由于檔案數據治理體系尚未成型,檔案數據安全問題日益凸顯。在對檔案數據開放共享的過程中,必然也會產生數據泄露、數據篡改、數據丟失等安全問題。加強對檔案數據開放共享的監管,恰好能夠有效應對此類問題。借助傳統脫敏、文本分類、內容識別及數據可視化等技術對開放檔案數據進行敏感脫密[6],實現對檔案數據開放共享的全過程監督,保證核心數據不被泄露、隱私數據不受侵犯、機密數據不被非法獲取利用,進而保障檔案數據安全可靠,全流程規范檔案數據開放共享秩序,確保檔案數據開放共享合規安全。

1.2 優化數據質量,提升檔案數據開發利用水平

大數據時代,檔案數據開放共享逐步迭代升級,正以一種更高級、更新穎的形態呈現,即檔案數據開發利用。[7]其中,檔案數據質量是貫穿檔案數據開放共享及開發利用全過程的生命線。這無疑表明檔案數據質量是檔案數據開發利用的關鍵所在。據此,對檔案數據開放共享進行管理和監控,可提升開放檔案數據的元數據、數據標準、數據格式、數據值域的質量層級,保證檔案數據開放共享的完整性、準確性和有效性,為檔案數據開放共享保駕護航,實現個性化、知識化、智慧化的檔案數據資源開發利用。[8]

1.3 促進公眾參與,提高檔案數據開放共享效率

公眾作為檔案數據開放共享的主要用戶,其參與的廣泛程度是檔案數據開放共享能否從“低效”向“高效”轉變的重要因素。通過對檔案數據開放共享進行監管,一方面,可以引導公眾加強對檔案數據開放相關政策的認識,保障其合法利用開放檔案數據的權利,激發其參與檔案數據開放共享的積極性,間接促進檔案數據開放共享效果與水平的提升;另一方面,可及時預知、規避或解決檔案數據開放共享過程中出現的問題,方便檔案部門精準洞察公眾對檔案數據開放共享的參與度和需求度,倒逼檔案部門改進檔案數據開放共享方式,提升檔案數據開放共享效能。[9]

2 大數據時代檔案數據開放共享監管的機制構建

為通過全過程、全環節的監管,促進檔案數據有序開放、高效共享,形成檔案數據開放共享新格局。文章以檔案數據開放共享的現實價值為導向,基于前端控制與全程管理理念,按照“事前—事中—事后”的脈絡,構建了事前防控、事中監控與事后管控三者互動運行的監管機制(見圖1)。

2.1 事前防控機制

事前防控機制即對檔案數據開放共享前的準備階段進行監管,旨在從源頭把控檔案數據開放共享,保障檔案數據開放共享工作有序規范。

其一,制定標準準入機制。一是確立檔案數據分級分類標準。在精準劃分檔案數據機密級別基礎上,按照主題、行業、服務等維度,秉承科學合法、需求導向原則,對開放檔案數據進行精細分類,便于對開放檔案數據開展針對性監測,保證檔案數據開放共享的合理性、科學性。二是建立檔案元數據標準。參考《政務信息資源目錄體系》和《政務信息資源目錄編制指南(試行)》,制定檔案元數據標準,規范檔案元數據的語義、語法、著錄格式以及API描述規范,增強檔案元數據的機器可讀性,確保其能夠在不同系統平臺進行交換和轉換,實現有序化整合共享。三是明確檔案數據開放共享格式標準。對標國家和地方有關數據開放共享格式標準規范,研制檔案數據開放共享格式標準規范,著重突出對檔案數據開放共享格式通用性、可靠性、兼容性和可機讀性等方面的要求,盡可能提供多樣化的檔案數據格式,以實現檔案數據關聯融合,助推檔案數據開放共享走向標準化、規范化。

其二,搭建整合優化機制。一是實施檔案數據清洗制度。在摸清可供開放檔案數據總體情況的基礎上,綜合實際情況制定檔案數據清洗規則與流程,借助數據清洗相關技術手段進行全方位清洗修正,使其符合開放共享要求和標準。如冗余重復的檔案數據可直接刪除,殘缺的檔案數據可采用剔除樣本或截取均值等方式填補,錯誤或異常(偏離期望值)的檔案數據可依靠人機同步或手動輔助等方式修正。二是規范檔案數據脫敏處理。在遵循保留數據價值、引用完整性、關聯匿名等通用原則的前提下,制定統一的檔案數據脫敏處理規范,使用脫敏集算器,利用隱藏、替換、截斷、加密、掩碼等處理辦法[10],強化檔案數據安全體態,提升檔案數據開放共享的安全等級,有效預防檔案數據開放共享中各類風險的發生。如南昌大學檔案館運用數據庫管控技術對檔案數據中的敏感詞進行標記,在共享利用中做到提前預警提示,確保敏感檔案數據不泄露。[11]

2.2 事中監控機制

事中監控機制即對檔案數據開放共享中的進行階段進行監管,及時發現其中的異常情況,并實時整治,最大程度改善檔案數據開放共享質量。

其一,建樹流程規范機制。一是制定檔案數據發布計劃。根據國家相關規定和本地區經濟社會發展情況,編制檔案數據發布實施方案和細則,依托檔案網站、微信公眾號、微博等多樣化渠道,重點和優先發布與公共衛生、社會治理、民生保障等領域密切相關的檔案數據,促進檔案數據開放共享合乎規范。二是規定檔案數據開放共享許可協議。立足國家標準、參照國際通用規范,結合檔案數據資源自身特點和開放利用權限,從開放許可原則、對象及用戶權利和義務等維度出發,擴展制定檔案數據開放共享許可協議,并對其中的通用許可、定向許可、署名許可、免費許可等進行詳細說明,滿足不同檔案數據開放共享平臺的發布使用需求,進而形成權責明確、邊界清晰、有據可循的檔案數據開放共享監督體系,保障檔案數據合理開放、合規共享。

其二,構筑安全控制機制。一是強化檔案數據傳輸安全保障能力。引入第三方平臺對檔案數據傳輸安全狀態、性能等要素進行綜合測評,運用入侵檢測、主動防御、虛擬補丁等技術手段構建檔案數據“防火墻”,及時對檔案數據傳輸、運轉和共享過程中的違規訪問、非法攻擊和肆意污染等行為進行排查和監控,以避免檔案數據在共享傳輸過程中被第三方截取、篡改、污染,保障檔案數據開放獲取的真實性、機密性和完整性。如河南省新密市檔案館運用入侵防御、人工智能、數據可視化等多種技術,打造檔案數據共享利用屏障,確保檔案數據開放共享整個過程安全可控。二是建立用戶隱私風險預警和評估模型。運用機器學習、深度學習等算法,以量化指標的形式建立貫穿檔案數據獲取全流程的用戶隱私風險預警和評估模型,提前分析預測用戶隱私泄露概率,精準識別和控制用戶隱私泄露的風險,有效規避匿名,以及效果丟失、個人身份標識和電話號碼等隱私泄露問題,切實保護用戶獲取檔案數據的隱私安全。

2.3 事后管控機制

事后管控機制是對檔案數據開放共享的維護階段進行監管,實現檔案數據開放共享“閉環式”管理,促進檔案數據開放共享行穩致遠。

其一,構建優化調控機制。一是注重檔案用戶需求反饋。通過搭建實時互動社區、建設數據反饋專欄、設立檔案數據論壇等方式,建立即時有效、安全暢通的用戶溝通反饋渠道[13],同時配備專業人員及時回應和解答用戶的咨詢、求助及反饋意見,并結合意見反饋進一步嚴控和優化檔案數據開放共享。如湖北省荊州市檔案館定期對用戶進行電話回訪,及時了解用戶檔案數據利用需求與體驗效果,以改進檔案數據開放共享形式。[14]二是深化檔案數據創新應用。聯合政府部門、高等院校、數據管理相關企業等單位,共同舉辦數創沙龍、數創大賽、數據企業走訪等檔案數據開放共享創新利用活動,并通過此類創新應用活動為檔案數據開放共享監管所存在的疑難問題提供創新型解決方案。如廣東省深圳市光明區檔案局(館)與本市相關企事業單位、科研機構等開展科研檔案數據知識競賽,通過以賽促學的形式,鼓勵社會為科研檔案數據開放管理和共享監督建言獻策,優化全區科研檔案數據開放共享生態。[15]

其二,建立考核問責機制。一是落實檔案數據開放共享責任?;诶碚?、法理與實踐等層面,制定檔案數據開放共享責任標準的制度規范,同時通過加大組織、資金、技術及設備等資源支持,輔之以在線學習、專題商討、集中培訓、輔導講座等多種形式,不斷落實和強化檔案部門推動檔案數據開放共享的主體責任,切實提升相關工作人員在檔案數據開放共享中的履職能力。此外,按照“誰主管、誰開放、誰負責”的基本原則,依法依規對檔案數據開放共享的尚存問題進行審查和監管,視情況追究相應責任,倒逼檔案數據開放共享規范發展。二是建構檔案數據開放共享評估體系。邀請專業的督察評估機構對檔案數據開放共享整體情況進行全方位、立體化監察和評價,如制度規范、流程設計、內容質量、安全程度等項目,同時兼顧社會公眾的滿意度評估,確保最終評估結果的科學性、客觀性和公平性,根據評估結果、專業意見和公眾反饋加以整改,力求維系檔案數據開放共享平穩合規。

3 大數據時代檔案數據開放共享監管的推進理路

大數據時代,檔案數據開放共享監管是一個復雜的生態系統,涉及頂層設計、技術應用、實施主體等諸多要素。文章立足檔案數據開放共享監管價值與機制,圍繞監管環境、監管主體、監管技術等方面探索檔案數據開放共享監管的實現路徑。

3.1 加強頂層設計,優化檔案數據開放共享監管環境

一是推進檔案數據開放共享監管走進法律視野。加緊制定并出臺專門關于檔案數據開放共享監管的法律法規,明確檔案數據開放共享監管的責任和權力,以強約束力使檔案數據開放共享監管有法可依、有章可循,保障大數據時代檔案數據開放共享合法合規。如俄羅斯聯邦檔案署頒布的《2018年前俄羅斯聯邦檔案署貫徹和實施開放機制計劃》對檔案數據開放共享監管的專職機構、處理辦法、激勵機制等進行了明確規定,為落實檔案數據開放共享監管工作提供了堅實的頂層立法保障。[16]

二是完善檔案數據開放共享監管配套戰略規劃。遵照國家有關法律法規,結合區域實際情況,形成指導本地區檔案數據開放共享監管工作的規劃辦法,并明晰檔案數據開放共享監管的責任主體和職責權限,確保將檔案數據開放共享監管工作落到實處。同時,基于檔案數據開放共享的全流程,充分考慮不同類型檔案數據的特點,重點聚焦開放檔案數據質量、安全、應用等方面制定監管細則,實現對檔案數據開放共享的全鏈條管控。如福建省發布的《福建省數字檔案共享管理辦法》,對檔案數據資源開放共享監管的法律責任、流程規范及保障措施等作出了明文規定,為檔案數據開放共享監管提供了具體行動指南。[17]

3.2 推進多元協同,拓寬檔案數據開放共享監管主體

一是檔案主管部門主導監管。各級檔案主管部門要落實主體監管責任,制定檔案數據開放共享監管的工作計劃方案,構建全局性監管網絡,將檔案數據開放共享監管納入重點工作內容,確保檔案數據開放共享有序推進。如江蘇省無錫市檔案局在《無錫市檔案局2021年工作要點》中,將檔案數據開放監管列為工作重點。[18]

二是加強內部自我監管。一方面,建立績效考核制度。將開放檔案數據的完整性、準確性、可用性等作為具體指標并賦予權重,以此對相關工作人員進行考評,運用激勵懲戒方式加以鼓勵和約束。如浙江省嘉興市檔案館制訂績效考核辦法,統籌推進檔案數據開放共享監管工作。[19]另一方面,夯實檔案數據人才隊伍建設,通過聘用或設置檔案數據館員負責協調檔案數據開放共享監管工作,助推檔案數據開放共享專業化、規范化。[20]

三是社會力量參與監管。通過搭建參與平臺、拓寬監督渠道等方式,激發社會公眾參與檔案數據開放共享監管的動力,形成全社會協同監管檔案數據開放共享的繁榮局面。如上海市城建檔案館在微信公眾號中開通檔案利用咨詢服務,實時為公眾解決疑難困惑,鼓勵公眾參與到城建檔案數據開放監督和監管環節中來,以促進城建檔案數據開放共享的科學化、合法化。[21]

3.3 強化數字賦能,創新檔案數據開放共享監管技術

一是融合多元數字技術應用。依托大數據可視化、云計算深度分析等技術,對檔案數據開放共享的準備階段進行預警防控,有效防范各類風險;借助人工智能、物聯網等技術,運用智能識別、射頻傳感、電子監察等設備,對檔案數據開放共享全流程進行定位、跟蹤和監督,實現全方位動態化監管;利用區塊鏈技術的數據溯源、共識算法、去中心化和非對稱加密等特征,實現檔案數據開放共享全程可回溯和穿透式監管,持續優化檔案數據開放共享工作。

二是加快智能監管系統建設。一方面,融入政府“互聯網+監管”系統。檔案部門應加強同數據管理、市場監管等部門的溝通協作,推動檔案監管融入政府“互聯網+監管”系統建設,為檔案數據開放共享監管提供有力支撐。[22]另一方面,構建檔案數據智慧監管平臺。檔案部門可適當加大資金投入,組織技術力量開發檔案數據智慧監管平臺,將其與政府“互聯網+監管”平臺精準對接,并在運行過程中引入“監管沙盒”模式,精確評估風險、調整技術規則,推動檔案數據監管由硬性向柔性蝶變,提升檔案數據開放共享監管的智能化、精細化水平。如浙江省檔案局貫徹“互聯網+監管”要求,依托省行政執法監管平臺,率先開通檔案監管手機端平臺,實現對檔案數據流通、開放及共享活動的即時性、系統性監管。[23]

4 結 語

檔案數據開放共享監管是推進檔案數據治理體系和治理能力現代化的重要內容。大數據時代,對檔案數據開放共享進行監管,能夠改善檔案數據質量、保護檔案數據安全、促進社會參與檔案數據治理,進而提升檔案數據開放共享效能和水平。為有效合規監管檔案數據開放共享,需要聚焦檔案數據開放共享的全過程,在事前防控機制、事中監控機制與事后管控機制三者互動配合下,通過不斷加強頂層設計、推進多元協同、強化數字賦能等舉措,推動檔案數據持續開放共享,為新時代檔案事業高質量發展增添新動能。

*本文系國家社科基金一般項目“國家大數據戰略背景下檔案數據質量優化控制研究”(項目編號:21BTQ016)階段性研究成果。

注釋與參考文獻

[1][2]金波,添志鵬.檔案數據內涵與特征探析[J].檔案學通訊,2020(3):4-11.

[3]周林興,黃星.大數據時代檔案數據開放共享機制探析[J].檔案與建設,2023(3):8-12.

[4]中辦國辦印發《“十四五”全國檔案事業發展規劃》[EB/OL].[2022-11-16].https://www.saac.gov.cn/daj/ toutiao/202106/ecca2de5bce44a0eb55c890762868683.shtml.

[5]陳朝兵,程申.政府數據開放監管的國際經驗與中國路徑[J].圖書情報工作,2020(12):49-57.

[6]袁紹晚.開放共享環境下城建檔案數據脫敏系統研究與設計[J].檔案與建設,2021(6):52-54,63.

[7]楊冬權.以十九大精神推進新時代檔案開放開發——在“學習貫徹黨的十九大精神 推進檔案開放利用服務高峰論壇”上的演講[J].中國檔案,2017(12):14-21.

[8]周林興,崔云萍.大數據視域下檔案數據質量控制實現路徑探析[J].檔案學通訊,2022(3):39-47.

[9]BOrGErud C , BOrGLund E . Correction to:Open research data, an archival challenge [J]. Archival Science,2020(3):279-302.

[10]邢宇恒,張冰,毛一凡.數據脫敏在海量數據系統中的應用[J].電信科學,2017(S1):8-14.

[11]聶云霞,陳煙然.新《檔案法》背景下檔案開放的優化路徑[J].檔案與建設,2022(5):16-19.

[12]新密市檔案館.新密市檔案館確保檔案數據的完整和安全[EB/OL].[2023-05-27].https://da.zhengzhou.gov.cn/ xqjl/2685909.jhtml.

[13]周林興,徐承來,宋大成.智慧城市視域下政府數據質量優化反饋機制研究[J].情報雜志,2021(7):146-156.

[14]查檔無壁壘,服務不打烊:荊州市檔案館檔案利用服務堅持從“心”開始[EB/OL].[2023-05-27].http://daj.jingzhou. gov.cn/z/zhengwuxinxi/zixunkuaidi/2022-08-31/5361.html.

[15]何穎莎.廣東深圳舉辦檔案知識和技能比賽[EB/ OL].[2023-05-27].http://www.zgdazxw.com.cn/ news/2022-09/01/content_336400.htm.

[16]肖秋會.俄羅斯聯邦檔案署的開放機制建設與開放數據方案[J].檔案與建設,2017(4):21-23,35.

[17]福建省數字檔案共享管理辦法[EB/OL].[2022-11-26].http://www.fj.gov.cn/zwgk/zfxxgk/zfxxgkzc/ fjsgzk/202112/t20211216_5794874.htm.

[18]無錫市檔案局.無錫市檔案局明確2021年全市檔案監管工作重點[EB/OL].[2023-05-28].https://mp.weixin. qq.com/s/nuTBPqn7CI1QxLlYrQlfVQ.

[19]金培中.浙江嘉興市檔案館:構建“智控中樞” 推進共建共享[EB/OL].[2023-05-28].http://www.zgdazxw.com. cn/news/2022-11/17/content_338207.htm.

[20]王蕾,吳加琪.數據治理背景下檔案數據館員能力建設研究[J].浙江檔案,2022(5):49-51.

[21]魏楠,張笑涵.治理理論視域下城建檔案開放中的公眾參與:理論認識與模式特征[J].檔案管理,2022(3):53-56.

[22]徐擁軍,張臻,牟建閩.治理現代化視域下我國檔案行政監管的問題與對策[J].中國檔案,2022(8):20-21.

[23]王凌.浙江探索推進檔案“掌上執法”監管新模式[EB/OL].[2023-05-27].https://www.zjda.gov.cn/ art/2019/6/10/art_1378485_34553497.html.

猜你喜歡
開放共享監管機制大數據
高校實驗教學資源整合與開放共享
大數據時代涪陵政府采購監管機制研究
我國互聯網金融發展探討
基于培養應用型人才的大型儀器開放共享及績效考核模式研究
基于大數據背景下的智慧城市建設研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合