?

人工智能在我國檔案管理中的應用現狀與對策分析*

2023-04-16 05:10贠疆鵬加小雙
檔案與建設 2023年2期
關鍵詞:檔案館人工智能檔案管理

贠疆鵬 加小雙,2 王 妍

(1.中國人民大學信息資源管理學院,北京,100872;2.中國人民大學檔案事業發展研究中心,北京,100872)

2017年,國務院印發《新一代人工智能發展規劃》,提出要緊緊抓住發展人工智能的偉大歷史機遇,引領發展人工智能的新潮流,提升國家競爭力。2021年,《“十四五”全國檔案事業發展規劃》明確指出要應用人工智能助力檔案管理工作轉型升級,并與數字檔案館(室)建設相結合。2022年,國家檔案局在科技項目立項工作中也表明要開展人工智能技術應用于檔案管理的研究。[1]那么人工智能技術在我國檔案管理中的應用現狀如何?現階段存在哪些問題?以這些問題為導向,本文通過系統性的文獻研究和實踐案例分析,對現狀和問題進行了闡述,并提出了具體的對策建議,以期為檔案領域更廣泛和深入應用人工智能技術提供參考。

一、人工智能在我國檔案管理中的應用現狀

1.人工智能應用的主要檔案類型場景

就檔案載體形式而言,目前人工智能技術主要應用于聲像檔案管理。例如,訊飛智元信息科技有限公司利用語音識別和人臉識別技術提取音視頻檔案信息和生成字幕,實現了輔助著錄和內容檢索。[2]

就檔案信息內容而言,目前人工智能技術較多應用于歷史檔案、文書檔案、病歷檔案、會計檔案的管理活動中。如在歷史檔案管理上,中央檔案館通過人工智能相關算法建成檔案目錄數據庫,提升了檔案的查全率和查準率[3];在文書檔案管理上,云南稅務部門應用AI技術實現了5大類687個事項2086種文書檔案的電子化歸檔管理[4];在病歷檔案管理上,廣州市婦女兒童醫療中心挖掘病例檔案數據集訓練人工智能,實現了兒科疾病的智能化診斷[5];在會計檔案管理上,廣州供電局會計檔案電子化試點項目利用人工智能實現了檔案的自動整理和元數據的自動生成。[6]

2.人工智能應用的主要檔案業務場景

在檔案收集上,人工智能技術能夠輔助檔案數據的采集。一方面,通過捕獲元數據,收集所需的檔案信息,如百度使用智能Agent從網頁爬取信息,分析并形成結構化數據[7];另一方面,利用人工智能技術對口述史料進行征集和采集,如科大訊飛股份有限公司應用語音識別、轉寫等技術,不斷形成新的檔案成果。[8]

在檔案管理上,人工智能一般應用于檔案整理、檔案價值鑒定、檔案修復保護與安全管理三方面。檔案整理方面,山東省威海市環翠區檔案館采用智能采集系統,解放了基層檔案工作者的勞動力。[9]檔案鑒定方面,北京市市場監督管理局基于相關人工智能模型算法實現了自動鑒定。[10]檔案修復保護與安全管理方面,AI技術助力修復了百年前北京影像[11];江蘇省太倉市智慧檔案館將人工智能技術嵌入門禁系統、識別和定位跟蹤系統及防火墻中,提高了館藏檔案的安全性。[12]

在檔案保存上,人工智能融入電子文件管理系統,實現了自動化歸檔保存。如,2020年中國石油數字檔案管理系統利用AI及其他新興技術,集成財務管理、電子公文等多個系統,實現了電子化的公文、合同、會計票據等自動歸檔保存。[13]

在檔案利用上,體現在檔案檢索和檔案服務方面。一方面,通過人工智能提升檔案查全率和查準率,如,江蘇省太倉市智慧檔案館利用智能Agent技術實現全文檢索[14];北京市市場監督管理局利用圖像識別和信息抽取技術,使部分類型檔案智能精確檢索率超過90%。[15]另一方面,通過人工智能技術助力檔案服務和展覽,如天津市紅橋區采用“人工智能+數字檔案”的新方式,將主題宣傳視頻集中推送至新媒體平臺上。[16]

3.人工智能應用于檔案管理的主要技術

根據2020年《國家新一代人工智能標準體系建設指南》的相關描述,人工智能技術有通用技術和關鍵領域技術之分,其中通用技術有機器學習、知識圖譜、模式識別等,而關鍵領域技術則包括自然語言處理、智能語音、計算機視覺、生物特征識別等。[17]以此分類為認知基礎,目前我國檔案管理對于人工智能技術的應用主要集中在知識圖譜、模式識別、自然語言處理和生物特征識別四個方面,并且實際應用中這些技術往往融合使用。

在使用知識圖譜技術時,側重于對關聯數據的應用。[18]如,河南省數字檔案館基于館藏資源建成智能檢索系統,挖掘大量結構化和非結構化數據,實現信息、數據的關聯,進而形成知識圖譜和檔案知識庫,提高了檔案管理的效率和質量。[19]

在使用模式識別[20]和自然語言處理技術時,側重于實現檔案的數字化和數據化。如,云南稅務部門采用自然語言處理技術識別檔案中的文字,采用模式識別技術抽取音像內容,從而實現稅務執法音像檔案的數字化和數據化。[21]

在使用生物特征識別技術時,主要是將人臉識別技術應用于檔案利用服務中。[22]如,江蘇省昆山市檔案館與市公安局合作開發“網上查檔大廳”系統,利用人臉識別實現身份驗證,確保線上查檔流程安全合規。[23]

二、人工智能應用于檔案管理的主要問題

1.應用檔案類型場景有待拓展和豐富

從總體應用規律上看,人工智能技術應用與資源自身的結構化程度、安全保存狀況和社會利用需求程度密切相關。一般來說,檔案部門傾向于將人工智能技術應用于一些特定類型的檔案,即信息開放程度、結構化程度、信息利用需求較高,或實體安全隱患較突出的檔案。然而,相較于復雜且多樣的檔案類型而言,已有實踐案例依然顯得較為單一,有待進一步拓展和豐富。

就檔案載體形式而言,人工智能應用拓展空間較大?,F階段,我國人工智能應用集中于聲像檔案,對于文本檔案則應用較少。這與人工智能技術自身的發展密切相關?,F階段,人工智能識別圖像的能力在不斷提升,對圖像特征的抓取能力甚至已經超越人類,但是在文字處理方面,對于語義、場景和關系的理解則不盡如人意,相關技術還需不斷探索。

就檔案信息內容而言,人工智能應用拓展空間也比較大。我國人工智能較多應用于歷史檔案、文書檔案、病歷檔案和會計檔案等。相比之下,國外應用人工智能的檔案類型更加豐富,一些專門檔案或者特殊類型電子檔案管理中都可見人工智能技術的應用。如,法律科技公司Everlaw基于AI技術,實現對海量訴訟檔案的查詢,律師們可以在短時間內檢索包括音視頻、電子郵件、圖片在內的上百萬份文件,節約時間成本。[24]又如,斯坦福大學通過人工智能技術實現多種方式的郵件內容檢索,將應用擴展至電子郵件管理。[25]

2.應用檔案業務環節有待深化和集成

一方面,應用業務環節有待深化。目前,檔案部門傾向于將人工智能技術應用于勞動重復性較高、自動化程度較高、檔案信息和數據量較大、對電子檔案四性保障要求較高的環節,但在檔案分類中卻鮮見人工智能技術的有效應用。但國外已經有成功應用案例,如澳大利亞新南威爾士州檔案館利用人工智能技術,將大量非結構化的政務數據進行分類。[26]此外,國外還將AI技術應用于自動化記錄保存、自動索引、元數據分類、篩選涉密或涉及隱私信息等多個環節。[27]

另一方面,集成性綜合應用較為缺乏?,F階段,人工智能技術在我國檔案管理“收管存用”各個環節中的應用往往是零散的,缺少集成性的整體方案。例如,內蒙古自治區檔案館僅將人工智能技術應用于提升查檔效率和精度[28],福建省檔案館僅應用人工智能技術助力開放審核工作。[29]實際上,非集成性應用人工智能技術極易導致檔案數據在業務運行過程中出現數字連續性斷裂,進而帶來數據安全風險或管理成本的增加。

3.應用缺少與檔案管理原則的深度融合

知識圖譜、模式識別、自然語言處理、生物特征識別等各種技術在我國檔案領域已經得到較為普遍的應用,但是從整體上來看,往往更加偏重于工具性的應用,而非真正實現檔案管理原則與人工智能技術的深入結合。這也是目前的最大制約因素。

檔案管理實際上是一項十分講究方法和原則的業務活動,如何將檔案管理的理論和方法與人工智能技術的應用進行有效地融合,仍需深入探索。例如,現有應用人工智能的檔案鑒定方法往往是基于算法和內容,包括識別重復內容或出現頻次等,雖有一定成效,但是如何將檔案鑒定的核心理論(如職能鑒定)有效結合到人工智能技術中,依然是值得探索的重大議題。對此,國外已經開展了許多前沿性探索,比如澳大利亞維多利亞州公共檔案館正嘗試在電子郵件管理項目的鑒定環節中采用職能鑒定。[30]而我國現階段應用人工智能技術鑒定往往是基于內容,如北京市市場監督管理局基于內容劃控鑒定來開放檔案。[31]

三、我國檔案管理應用人工智能的優化建議

1.加快制定人工智能應用規范指南

自2016年年底起,我國每年年底召開的全國檔案局長館長會議屢次提出要“探索人工智能等新技術在檔案管理中的應用”。其中,2020年全國檔案局長館長會議上,國家檔案局局長陸國強提出,要探索將大數據、區塊鏈、人工智能等新一代信息技術應用于檔案管理中,推動數字檔案館(室)建設向更具智慧化方向發展。[32]2021年發布的《“十四五”全國檔案事業發展規劃》也強調將大數據、人工智能等新興信息技術融入數字檔案館(室)建設,推動數字檔案館(室)建設優化升級。雖然這些政策及要求一定程度上推動了人工智能技術在檔案管理中的應用,但更偏向宏觀層面的路徑指引,在具體實施時則需要以更為具體和更具操作性的規范作為指引。對此,建議檔案主管部門聯合相關研究機構,制定更具針對性的應用指南,為檔案管理實踐提供指導。同時,還可以適當開展人工智能技術的應用試點,以便及時總結先進經驗并在全國加以推廣。

2.推進人工智能技術的集成化應用

在數字檔案館乃至智慧檔案館的建設背景下,需要不斷融入人工智能技術,以追求更加智能化的檔案管理與服務。在此過程中,必須高度重視數字連續性的問題,不斷推進人工智能技術的集成化應用。一方面,推進人工智能技術與其他先進技術的集成應用。人工智能技術自身并不構成檔案自動化管理的全部技術內容,往往需要配合其他技術的應用,包括云計算、區塊鏈、物聯網、大數據等。在各種技術的銜接過程中,必須確保技術的集成,這樣才能保證檔案數據的連續性流轉,進而保障其可跟蹤、可溯源、可關聯和可控制的能力。另一方面,推進人工智能技術集成至檔案信息化的整體基礎架構中。人工智能技術只有深度集成至數字檔案館或智慧檔案館建設的基礎架構中,才能真正融入覆蓋數字文件全生命周期、數字信息全流程和數字資源全要素的檔案數據資源管理與服務中,并發揮其獨特的優勢與價值。

3.強化人工智能與管理理論的融合

文件檔案管理是一項專門的業務實踐活動,蘊含著多種專業性的管理理論、原則和方法,包括來源原則、全宗原則、文件生命周期理論和管理原則中的職能分類、職能鑒定、開放鑒定,以及電子文件的前端控制、全程管理、四性保障、元數據管理等。應用人工智能技術管理文件檔案,必須在明確應用場景的基礎上,進一步體現檔案管理基本原則和方法的有效融入,否則會導致各種管理風險問題。對此,必須理性看待人工智能等先進技術在檔案管理中的有效應用,不能“為了技術而技術”,深陷“唯技術論”,也不能因為“害怕風險”,就選擇“故步自封”。立足檔案管理自身特點以及檔案管理過程中存在的實際難題,積極探索檔案管理原則、方法與人工智能技術的有效融合,才是上上之策。

猜你喜歡
檔案館人工智能檔案管理
檔案管理中的電子檔案管理
2019:人工智能
人工智能與就業
檔案管理與企業內部控制關系的思考
數讀人工智能
全省部分檔案館新館掠影
下一幕,人工智能!
太倉市數字檔案館成為“全國示范數字檔案館”
when與while檔案館
健康檔案管理的“云”前景
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合