?

面向數字中國戰略的檔案數據產教融合

2023-11-18 12:44馮惠玲
檔案與建設 2023年10期
關鍵詞:數據管理產教數字

馮惠玲

(中國人民大學信息資源管理學院,北京,100872)

寧波是一座江海交融的大港之城,收藏古今,港通天下,它既承載著厚重如檔案的歷史底蘊,也散發著璀璨如數據的時代光輝。今天各路先鋒闖將幾百人共聚于此,共同探討面向數字中國戰略的檔案數據產教融合的全新議題,這次會議在檔案學術、檔案事業以及數據管理方面,一定會留下具有時代價值的光彩一筆。我今天講三個關鍵詞,一是背景——數字中國,二是檔案數據,三是產教融合。對“產教融合”我稍作解釋:檔案數據的管理需要檔案領域政、產、管、學、研各個方面的協力參與,這個報告的“產”是從廣義的社會生產概念出發,把從事檔案業務及行政管理,檔案數據相關企業等統稱為“產業方”,把教學和研究機構統稱為“教育方”,這樣的產教融合就是一個涵蓋各方的大協作圈。

一、 數字中國戰略下的檔案數據管理

從2000 年習近平同志在福建工作時提出數字福建戰略,到2023 年2 月中共中央國務院發出《數字中國建設整體布局規劃》,展示了我國全面推進數字化轉型的戰略安排。這個規劃指出,數字中國是數字時代推進中國式現代化的重要引擎,是構筑國家競爭新優勢的有力支撐。習近平總書記在黨的二十大報告中論述有關實施科教興國戰略、強化現代化人才支撐時,提出了推進產教融合的重要思想,為我國教育改革和發展提出了新的戰略指向。

數字化正在成為中國經濟社會發展的強勁動力,我國在全球數字競爭格局中的地位也逐漸提升。這里和大家分享兩組數據,一個是根據國家網信辦等機構發布的《數字中國發展報告(2022 年)》,我國2022年的數字經濟規模達到了50.2 萬億,總量位于全球第二,同比名義增長10.3%,在國內生產總值中的占比提升至41.5%,這個數據體現了我國整個數字經濟的發展勢頭。第二個是國際數據公司(IDC)的預測顯示,到2025 年,中國的數據產量將達到40.6ZB,占據全球數據量的27.8%,屆時中國將成為全球最大的數據中心,這個預測描繪了我國在全球數據產量和數據處理能力方面的領先地位。

數字中國建設按照“2522”的整體框架進行布局,即夯實數字基礎設施和數據資源體系“兩大基礎”,推進數字技術與經濟、政治、文化、社會、生態文明建設“五位一體”深度融合,強化數字技術創新體系和數字安全屏障“兩大能力”,優化數字化發展國內國際“兩個環境”。

檔案數據在數字中國戰略“2522”整體框架中占據非常重要的地位,它是數據資源體系和數字基礎設施的核心組成部分。在數字中國的戰略大背景下,怎樣挖掘檔案數據和檔案思想的潛在價值,可以稱之為一項時代之問,具有重大時代意義。面對這個問題,一方面,我們需要更深刻理解檔案數據的價值,發掘它在經濟社會發展當中的無限潛能;另一方面,在數字中國建設的各個領域提高數字業務的科學化、規范化水平的過程中,檔案思想、理念、制度和方法,將成為重要的具有廣泛價值的基礎性要素。這個問題由于時間關系今天無法展開,簡單地說,就是數字中國的每個方面都需要檔案方法、檔案思想的加入與支持,非常值得我們重視并展開探討。

在數字中國戰略實施當中,檔案必須突破活動后端記錄的定位,在檔案數據管理的范圍大幅擴展的同時,檔案觀念、檔案思想、檔案意識將滲透到所有的業務領域,“滲透”這個詞將成為重要的實踐,檔案意識將成為與安全意識同等重要的普適性要素,檔案素養也將成為數據人才必備的核心素質素養之一。當然另一方面數據素養也將成為檔案工作者的必備條件。

二、 檔案數據的趨勢和特點

趨勢就是檔案數據不斷升溫,特點主要從檔案數據的“雙重特性”和“雙向融合”兩個方面展開。

檔案數據的升溫可以從檔案數據的生成、管理和研究三個方面來顯示。在現實生活中,越來越多的社會活動記錄以數據形式生成,越來越多的檔案機構開始接收和探索數據形態的管理,如Druva和DataArchiva就是兩個具有相當規模的國際檔案數據存檔保管企業。近三年國家社科基金立項中以檔案數據管理為主題的項目有23 項,占全部檔案項目的40%左右,一個主題占到全部項目的如此之高的比例是很少見的。

在剛剛結束的ICA阿布扎比國際檔案大會上,法國前總統奧朗德在講演中用相當篇幅強調保存氣候變化檔案數據的重要性。他說法國從19 世紀末就開始保存這一類的檔案數據,我想或許類似的檔案數據管理還可以追溯到更久以前和更多事例。

檔案數據是一個很復雜的概念,包括各種環境中生成的各種模態的具有檔案屬性的數據,檔案數據的兩重性是指它既有檔案的屬性,又有數據的屬性。這樣的雙重屬性使得檔案數據既繼承了檔案的記錄和保存功能,又賦予它強大的數據分析和處理能力,共同鑄就了檔案數據的特質和潛能。檔案數據固有的雙重性,要求我們在學術上、實踐上打破原來的壁壘,在兩個門類之間尋求和建立更深層次的融合和創新。

在大數據時代,我們看到檔案越來越多地被賦予數據屬性,或者說按照數據形式來管理,而數據則越來越蘊藏檔案屬性,或者說按照檔案來管理。也就是說檔案逐漸走向數據化,數據也逐漸走向檔案化,這是檔案界和數據界都必須正視的新趨勢。

檔案數據化是在這幾年一直探討的傳統檔案管理顆粒度的細化,我們稱為檔案數據化管理。同時也包括文件檔案直接以數據模態形成,有學者說文件裂變為了數據。檔案模態在歷史上經歷了三個發展階段:紙質或者實體的檔案,電子文件文本,和當前的數據態檔案。如果以重大的事件為例的話,二戰時期的檔案主要以紙質檔案為主,911 事件大部分是電子文件文本,而大量新冠疫情的檔案記錄則是數據態檔案,這兩種情況都可以叫作檔案數據化。

再看數據檔案化。數據管理呈現出了檔案化變革,對于很多大數據的價值認知和管理方式都逐漸呈現出了一種“檔案主義”的趨勢,除了很多機構開始對業務數據加以歸檔管理外,一些數據項目,例如著名的預印本平臺arXiv、全球互聯網檔案平臺Internet Archive,數字人文中的數據集(稱為Archives),以及開源軟件開發社區平臺Git和GitHub,都在借鑒檔案管理的理念和方法。

因此我們得以揭示一個非常有趣,也非常有意義的趨勢性發現,即檔案的數據化和數據的檔案化正在“雙向奔赴”,共同開啟更加廣闊的檔案數據新紀元。

一個重要的變化是檔案管理活動逐漸向以機器為中心轉移。模擬態的檔案是人工管理的,后來有了計算機輔助管理。進入檔案數據階段之后,數據基本上要靠機器來識別、管理和提取,人對于數據的直接掌控力很低,必須借助于機器的管理能力。人工管理主要依靠檔案工作者的經驗和技能,有作坊特征,而檔案數據管理則主要依賴于機器的算法和模型,依賴管理系統的功能,顯示出很強的工程化管理特點。在這樣的發展過程當中,我們也要始終把握人的主體性,在機器管理中加入必要的人工介入節點,避免檔案專業人員的體外化和工具化。

面向機器的檔案數據管理需要具有三大挑戰,即實施主動元數據管理,對底層技術與原理的關注,管理模式和理論的創新。其中第一條,引入“主動元數據管理”的方法與技術將更加智能和面向業務行動。以對檔案保管期限開展主動元數據管理為例,可以實現自動響應環境變化的動態調整,如根據新的法律法規自動調整相關檔案的保管期限,自動發送操作提醒或建議,具有上下文敏感,理解和適應不同的上下文,為不同的應用和場景提供合適的信息和支持等。鑒于時間關系其他兩條就不再展開講述。

必須重視面向機器的檔案管理特性,從這里出發,對更多類型業務數據實施檔案化管理,從而擴展傳統檔案概念和實務邊界,必將導致檔案涵蓋的“泛化”趨向,并根據價值區分形成不同層級數據檔案化管理體系。只要接受數據檔案化管理,就必須接受檔案概念的擴展,或曰“有限泛化”。

三、 產教融合的路徑和方法

當前我們面臨的主要挑戰是怎樣彌合學術界和檔案數據產業界之間的差距或鴻溝。我這里借用“數據編織”概念,它用了一橫一縱的兩個維度。我把學術界比作“經度”,它致力于頂天的理論研究,包括基礎理論和前瞻性研究,但是學術界在實踐舞臺上常常會有一些短板和困惑。我把產業界比作“緯度”,側重于立地的實際探索,與社會需求最接近,逐漸擴展檔案數據的管轄范圍以及對數字中國的支撐點位,急需較為系統的理論指導和前瞻思維。為此我們需要連接基礎與應用,頂天與立地,探索理論經度與實踐緯度的有機交融,協力推進檔案數據管理進展和檔案思想在數據管理活動中的廣泛應用,并促使檔案學界和數據產業界實現協同進步。

從國內產教融合的經驗看,主要有三種類型或功能:一是教書育人型,核心是提高人才培養質量。以教育部的產學合作協同育人項目為例,從2014 年實施以來,已經有1700 多家企業參與立項,立項數量達9.9萬項,企業累計投入經費35.6 億元。2023 年9 月,教育部公布了第一批擬入圍國家級產教聯合體的28 家名單。二是科技攻關型,主要聚焦于基礎理論創新和解決重大技術問題,比如華為的“難題揭榜”和騰訊犀牛鳥基金等都是這一類型的代表。三是社會服務型,以滿足國家重大戰略需求和社會需要為目標。教育部共建“一帶一路”教育行動和“千校萬企”協同創新伙伴行動,以及很多高校承擔的檔案橫向項目都是這種類型。這三種類型各有特色,分別從三個維度推進了產教融合,推動了學術界和產業界的緊密合作和共同發展。近三年國家檔案局的科技項目立項數據顯示,校館合作、校企合作項目從2021年的8 項到2023年的18 項,呈現明顯的增長態勢。

教育界在積極跟進,積累了一些經驗和工作基礎。以中國人民大學信息資源管理學院為例,在人才培養方面,邀請20 多位產業實踐導師,把產教融合理念和產業需求融入人才培養全過程,在科技攻關和社會服務方面,與國家檔案局、多地多類型檔案館、交通運輸部研究院、敦煌研究院、上海鴻翼軟件技術股份有限公司等建立了長期合作關系,這次會議期間又結交了很多新的合作伙伴,學院老師與阿里云計算公司合作開發的項目榮獲“教育部產學協同育人項目優秀案例項目”的表彰,在產教融合方面取得了一些初步成效。

但是,總體上我國檔案數據產教融合還處于相對淺層,如雙方的請進來、走出去。理想狀態是把星星點點的交集節點編織成一張越來越大、越來越密實的織物或屏障,這就需要經度和緯度逐漸拉長、加密、對接、靠攏,并相互滲透,共同應對檔案數據管理的各種時代挑戰。檔案數據方面的產教融合應該成為超越傳統邊界的一種新共識,產業和教育科研需要在承擔各自使命的同時,面向融合重新定位自己的“坐標”和“姿態”,共同探索和開創構建這一新生態、新路徑。在這個過程中需要開展大量探索與創新,包括理論研究、工程實踐、產業治理和人才培養。這些探索所創建的檔案數據新生態是寬廣而光明的,值得我們共同為之努力。

我把這樣一個歷史性探索歸結成4 句話作為我們共同的心愿,每句話都用了“共同”二字。即共同尋求檔案數字化轉型之“道”,發展中國自主的檔案學知識體系;共同連通檔案數據經緯之“網”,推動我國檔案行業實現高質量發展;共同創建檔案數據治理之“規”,切實貫徹《數字中國建設整體布局規劃》;共同鑄造檔案數據平臺之“基”,培育具有中國特色的檔案事業新生態。

猜你喜歡
數據管理產教數字
企業級BOM數據管理概要
定制化汽車制造的數據管理分析
海洋環境數據管理優化與實踐
產教融合人才培養模式探析
產教融合 商以富國
CTCS-2級報文數據管理需求分析和實現
基于產教結合下的中職電子教學研究
產教融合:時尚產業的蛻變之路
答數字
數字看G20
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合