?

大數據研究熱對現代中國檔案學發展的影響

2021-01-07 10:56鹽城師范學院劉露
辦公室業務 2020年23期
關鍵詞:檔案學學科資源

文/鹽城師范學院 劉露

21世紀,數據已經滲透到各行各業并成為重要的生產資料,社會各界已經認識到數據的價值。2012年大數據成為各界關注的熱點話題,各大網站、媒體、報紙均對大數據開展報道,眾多行業相繼提出大數據發展戰略,大數據開啟了繼云計算、物聯網之后的新一輪技術革命。不同學科領域包括檔案學都想要在大數據研究熱潮中占有一席之地。檔案學者們致力于將大數據技術應用于學科信息化建設之中,自此大數據研究在檔案學領域逐步發展起來,這也引起學者們對檔案大數據研究熱的思考和質疑。

一、檔案領域大數據研究的現狀

以“大數據”為篇名在中國學術期刊全文數據庫進行檢索(檢索時間2020年5月14日),2011年相關研究文獻量為192篇、2012年為820篇,到2013年達到了2615篇,說明2013年以后關于大數據研究的文獻數量急劇增加,多學科躋身大數據研究熱潮。截至2020年5月14日,在中國學術期刊全文數據庫以“大數據”和“檔案”為篇名進行精確檢索,時間跨度為2012~2019年,2020年文獻數量不完整,故不列入分析范圍,共獲得檢索結果2075條(如圖1所示)。根據檢索結果,我國檔案學者關注大數據是在2012年以后,最早為施永利的《大數據時代背景下的檔案利用服務探討》一文,分析了大數據時代對檔案管理和服務帶來的挑戰并提出利用數據挖掘技術來提高檔案服務質量。從圖1中可以看出2014年以后檔案領域關于大數據研究文獻數量明顯增加。2016年4月國家檔案局發布了《全國檔案事業發展“十三五”規劃綱要》,4次提到大數據,為檔案界主動加入大數據研究提供了方向。2016~2019年文獻數量逐年劇增,可以看出國內檔案學界關于大數據研究始于2012年,2016年以后呈現爆發趨勢并正穩步發展。研究內容主要集中在:檔案大數據4V特征分析,大數據對檔案利用、信息化等管理工作帶來的機遇和挑戰,數字檔案館服務新模式以及大數據技術在檔案學研究中的應用等方面,學者普遍認同傳統檔案工作需要轉變思維方式、工作方式,利用數據挖掘、數據分析等服務于檔案工作,跟上大數據的潮流。

圖1 2012~2019年中國檔案領域大數據發文量年度趨勢

二、大數據研究熱潮下檔案學發展的誤區

(一)強調共享,忽視檔案開放利用。自國際掀起大數據研究熱潮后,幾乎席卷了各行各業各領域,似乎不談論大數據就是不與時俱進,不與大數據扯上關系就不是創新。當大數據概念被引入檔案學研究時,學者紛紛提出檔案數據符合大數據4V特征,要擁抱大數據時代。同時也有諸如于英香等專家學者對大數據被過度神化的現象提出了質疑。大數據時代的一個基本特點是數據開放與共享,檔案館擁有巨量檔案資源,只有實現檔案開放才能實現大數據技術在檔案領域的廣泛應用。檔案開放是發揮和呈現檔案價值的直接方式,但目前檔案開放存在鑒定責任主體模糊、開放程度低、檔案利用與隱私保護不平衡、缺少補救保障機制等問題。根據國家統計局統計年鑒中的統計數據,國家綜合檔案館檔案開放率由2008年的24.2%降到2018年的15%,如圖2所示。

圖2 2008~2018年國家綜合檔案館檔案開放率(%)

(二)強調融合,忽視學科之間內在聯系。黨的十八大習近平總書記提出構建人類命運共同體,為治國理政提供了新思想,也為跨界合作提供了新視角。學科之間不是反對、排斥關系,而是一種對話、合作、互利、共贏的關系,開放融合成為各學科發展的趨勢和學者鼓勵的方向。追求融合不是兩個或多個學科的簡單嫁接,需要找到契合點,找出學科融合過程中可能出現的短路問題,將其他學科中有價值的、經過驗證的理念、技術通過契合點與檔案學科聯系在一起,實現無縫連接的融合,而不是將所有主流觀點、理念、思想、技術、手段等都強加到檔案學中,否則只會帶來檔案學與其他學科的脫節。融合發展可以借助雙方力量,不單是數量的簡單疊加,更是質量的融合,2018年在黨和國家深化機構改革的背景下,各級國家綜合檔案館推行局館分離,檔案館只擁有保管利用的職能,其行政職能歸屬黨委管理。檔案館要明確自己的核心職能,檔案學科要明確發展方向,在自身發展的基礎上,擁抱大數據技術,形成學科發展的有效性連接,實現兩個學科在融合中的一體化成長。

三、對檔案大數據研究熱的辯證思考

(一)立足學科根本,追求大發展。大數據技術已經被交通、醫療、教育、媒體、金融等眾多行業接受并得到廣泛傳播和應用,但大數據時代對檔案開放、鑒定等方面提出了更高的要求,大數據技術及在檔案領域的應用還沒有成熟,因此,檔案部門不應過多強調大數據技術和應用的追逐,而應關注數據時代的到來給檔案工作內外部帶來的變化,明確學科在大數據熱潮中的方向。

檔案學科自成立以來,理論和實踐方面一直存在難以攻關的重點和難點問題,如檔案開放、鑒定該如何把握一直是實際工作中的難題。檔案開放是檔案開發、利用、服務民眾等各項工作的基礎。檔案館作為國家、機關、社會組織、企事業單位社會實踐活動原始記錄的保管基地,掌握著巨大的數據資源,是擁有覆蓋歷史、現在和未來數據資源的寶庫。大數據研究需要以海量數據為基礎,檔案開放是前提更是基礎,只有解決學科發展中的重難點問題、核心問題,抓住主要矛盾,由小見大,完善學科體系,才能有序推進研究,推動學科長遠發展。2019年10月,十三屆全國人大常委會第十四次會議初次審議《中華人民共和國檔案法(修訂草案)》,我國檔案封閉期擬由30年縮短為25年。加大檔案信息開放力度,由內而外先解決檔案學科自身的基礎性問題已經成為大數據應用到檔案領域的基礎性工作和條件。一個學科的發展要注重廣度,更要注重深度。求小放大和求大放小相結合,以檔案學自身發展為前提,放眼未來,逐步實現與其他學科融合的大發展趨勢。

(二)夯實數字化,邁向數據化。檔案數據化被認為是檔案數字化發展的新階段,它是指檔案部門以用戶需求和業務需要為導向,將數字檔案資源轉換為可供閱讀、分析和處理的檔案數據資源的過程。檔案數字化是數據化的基礎,數據化是在對數據信息進行識別和處理的基礎上完善的。目前我國檔案數字化工作還停留在對數字化檔案資源的組織、檢索層面,通過互聯網已經實現主題檢索、關鍵詞檢索、全文檢索等基礎操作,但對檔案內容信息挖掘并不深入,檔案中所包含的復雜信息內容、信息間隱含的語義關系等都無法得到識別和分析,對檔案內容的組織和檢索服務不夠智能化、智慧化。通過數據化,對數字檔案資源和歸檔電子文件的數字內容進行識別、分類、著錄和標引,對其包含的數據信息進行重新分割和關聯分析,從中提取關鍵數據成分,將非結構化的檔案數據和文檔數據實現結構化分析,可以實現檔案資源由可讀模式轉變為可分析、可計算模式。

在完善數字化工作的基礎上部署實施檔案數據化工作,有助于進一步推進檔案信息資源在數據層級的深度開發,實現檔案數據資源的融合、關聯、挖掘與分析,推動檔案知識發現和知識服務的開展。檔案部門保存著大量有價值的一手檔案資源,作為檔案資源大戶,檔案部門要善于運用數據分析、數據挖掘技術分析檔案數據,對其進行聚類、分類和相關性分析,找到數據間的關系,建立數據模型,從海量數據中揭示出隱含潛在價值的信息,從檔案本身獲取檔案數據,為社會公眾提供智能化、智慧化檔案服務。

(三)積累小數據,放眼大數據。大數據時代,有人說一切文件和記錄都將成為檔案,確實給檔案學科發展帶來了影響,但并沒有改變檔案原始記錄性,只是出現了更多新興檔案門類。面對新事物新概念的出現,需要重新思考檔案學的概念系統和研究范疇,明確哪些數據流具有檔案特征,傳統的管理理論是否適用。檔案是一種重要的社會信息資源,其中蘊藏著無法估量的社會價值,已經成為大數據時代最重要的信息源之一。檔案數據來源于檔案本身,必須做好檔案基礎性管理工作,積累檔案資源,才能從檔案資源中獲取檔案數據信息。大數據與統計學、數學等知識相關,單一數據無法發現其中規律,對大量數據進行搜集和分析才能發現數據本身蘊含的價值。

小數據就是每份檔案所包含的時間、人物、事件、作者等內容信息和背景信息,這些數據信息不僅能展示過去發生的事件,也能通過數據之間的重組、關聯找到某種規律,甚至預測未來的發展趨勢。立足于小數據,可以更好地根據用戶需求提供需要的數據,能根據用戶的特征提供個性化數據。不積跬步,無以至千里,以小數據積累用戶,以大數據洞察外部環境,依托先進的技術手段實現檔案智能化管理,共同助力檔案學科發展。

四、結語

大數據研究熱潮持續升溫,檔案學應在夯實檔案開放利用、數字化等工作的基礎上,充分運用大數據技術挖掘數據資源,放眼大數據,追求既有專業深度又有跨學科研究廣度的發展趨勢,與大數據及其他學科開展跨學科的研究和合作,以期在社會轉型期依然能夠應對各種挑戰,實現檔案學科的大融合、大發展和跨越式進步。

猜你喜歡
檔案學學科資源
學科新書架
【學科新書導覽】
我給資源分分類
資源回收
做好綠色資源保護和開發
“超學科”來啦
檔案學學科入門指導課程專題設計探討
激活村莊內部治理資源
借問學科哪家強?盡言洄服有良方
中國檔案學研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合