?

人工智能對檔案管理的影響及發展建議

2019-09-10 07:22李子林熊文景
檔案與建設 2019年6期
關鍵詞:人工智能檔案管理智能

李子林 熊文景

[摘要]人工智能的深度發展將為檔案管理帶來一場全面而深遠的變革。人工智能在檔案界的應用將推動檔案管理理論的發展與創新、倒逼檔案管理模式的優化與轉型、助推檔案管理人員的改造與升級。檔案界在運用人工智能推動檔案管理工作發展時,應注意做到:來源上的優勢發力、借鑒下的因地制宜、融合中的主次有別、運用中的包容開放。

[關鍵詞]檔案管理人工智能技術變革業務創新

[分類號]G270.7

The Influence of Artificial Intelligence on Archives Management and Development Suggestions

Li Zilin, Xiong Wenjing

(School of information Resources Management of Renmin University of China, Beijing, 100872)

Abstract: The in-depth development of artificial intelligence will bring about a comprehensive and far-reaching shifting of archives management. The application of artificial intelligence in the archival field will promote the development and innovation of theory of archives management, force the optimization and shifting of archives management work and enhance the upgrading of archivists. When introducing the artificial intelligence to promote the development of archives management, the archival community should pay attention to: taking advantage of archives collections, learning experiences based on actual needs, integrating the artificial intelligence into specific archives business scenarios and actively and inclusively accepting the new application.

Keywords: ArchivesManagement;ArtificialIntelligence;TechnologyReform;BusinessInnovation

“網紅”機器人成為講解員,智能家居令人耳目一新,阿爾法狗戰勝人類世界圍棋冠軍……目前,隨著算法、數據、計算能力等關鍵要素取得進展,人工智能(Artificial Intelligence,AI)正在加速突破從“不能用、不好用”到“可以用”的技術拐點,不斷拓寬應用領域,日益滲入人們日常生活。人工智能的源起可追溯到20世紀60年代關于如何讓機器做到人類智能之事的研討會——達特茅斯會議(Dartmouth Workshop)。在此次會議上,“人工智能”一詞正式誕生,此次會議的召集者約翰·麥卡錫(John McCarthy)也被后人稱為“人工智能之父”。人工智能的實質是讓機器能夠像人一樣完成智能任務的技術,其發展大致經歷了三個階段:第一,機器學習階段,即智能系統使用一系列算法從經驗中進行學習;第二,機器智能階段,即機器使用一系列高級算法從經驗中進行學習(例如深度神經網絡);第三,機器意識階段,即不需要外部數據就能從經驗中自我學習[1]。相應的,人工智能的研究也呈現進階式的發展,從智能語音識別、聊天機器人到谷歌具備深度學習功能的阿爾法狗,再到模擬神經網絡的超級AI機器便是佐證。同時,人工智能的研究領域廣泛,有人將其按照涉及的學科進行劃分:計算機視覺,包括模式識別、圖像處理等;自然語言處理,包括語音識別、合成以及語音對話;認知與推理,包括各種物理和社會常識;機器人學,包括各種機械控制、設計、運動規劃等;博弈倫理,包含多代理人的交互、對抗、合作等議題;機器學習,包括各種統計建模、分析工具和計算方法等[2]。

人工智能的大熱使得人們都在暢想人工智能時代人類社會的經濟、政治、文化、技術等方方面面迎來的巨大變革。作為檔案人,我們經常會就新技術環境的變化談到社交媒體信息歸檔、基于語義的檔案組織、檔案知識庫、智慧檔案館、智能檔案推送服務等業務活動的新變化,那么人工智能與檔案管理究竟是什么關系?人工智能背景下的檔案管理又將何去何從?這些疑問成為技術變革時代檔案界不可回避且需要勇敢應對、積極尋求解決策略的關鍵點。本文通過梳理當前國內外檔案管理與人工智能的研究情況,分析人工智能對檔案管理產生的影響,并在此基礎上提出人工智能推動檔案管理發展的建議對策,為技術變革時代檔案管理的創新發展服務。

1檔案管理與人工智能現有研究成果回顧

檔案管理與人工智能的關聯初見不顯得緊密,但詳細剖析則發現兩者之間存在千絲萬縷的關系。一方面,從檔案的理論與實踐發展歷程來看,科學技術在檔案界的發展變革中都發揮著源頭促發性、基礎支撐性作用。從紙質環境下的檔案實體管理工作到計算機輔助環境下的檔案信息管理工作再到數字環境下的數字檔案資源歸集與管護(Curation)工作,無不彰顯著技術更新對檔案管理工作模式和樣態的直接作用力。另一方面,檔案學科自身的應用與實踐屬性使得該學科與其他學科相比更具有對技術變化的敏感性。在檔案領域,規范化的業務管理流程,先進的管理技術和工具是推動檔案工作發展的關鍵因素。換言之,誰首先掌握技術上的優勢和主動權,誰就具備掌握更多先進檔案管理思維的可能性,成為引領檔案管理實踐發展的風向標。無疑,人工智能的深化應用將會使檔案管理的時空條件、管理主體、管理手段、管理方式發生深刻的改變,智能化、智慧化成為檔案管理下一階段追求的新目標。

通過對國外圖情檔核心數據庫以及中國知網全文數據庫進行遍歷,以“檔案”(Archives)組配“人工智能”(Artificial Intelligence)、“機器學習”(Machine Learning)、“智能檢索”(Intelligent Retrieval)、“自動標引”(Automatic Indexing)為關鍵詞進行檢索,篩選收集得到相關目標文獻。在對文獻進行篩選和梳理后,發現國內外檔案與人工智能的理論研究與實踐探索情況如下:

國外有關檔案與人工智能的探索與應用研究相對成熟,呈現出聚焦技術應用為檔案業務工作服務的特點。究其主要原因在于人工智能所引發的社會實踐和管理智能化推動了信息資源利用的革命。意大利羅馬特雷大學的學者將機器視覺(Machine Vision)技術運用于梵蒂岡秘密檔案的轉錄工作。為了解決傳統OCR識別技術對中世紀檔案文本識別誤差大、效率低的問題,學者們對每個單詞書寫的筆畫拼圖進行收割并組合成數據集,將該數據集運用于訓練基于神經網絡的機器視覺系統。這種做法使該系統能夠識別不同筆畫組合表示的字母,過濾掉錯誤的轉錄文字,從而提升檔案轉錄工作的精準度和效率[3]。比爾肯特大學研究人員提出建立一個基于場景的視頻監控檔案查詢系統。該視頻監控檔案查詢系統突破了人類感知、推理能力在空間數據處理方面的極限,通過引入倒置追蹤方案,實現對以場景為單位移動對象的查詢和搜索。同時,該系統配置視覺查詢專屬界面,以提升圖像檢索的精確度[4]。另外,2019年3月20日,國際檔案理事會秘書長安西婭·賽勒斯(Anthea Seles)在法國財政部檔案館的新聞媒體會上發表了關于“人工智能對文檔管理的影響”主題演講,并提出:通過人工智能技術實現檔案工作自動化是檔案管理發展的必由之路。一方面,數字環境下海量、非結構化檔案信息的分類、整理與著錄、鑒定工作變得更加復雜,高效檔案管理的目標驅動機器學習等人工智能技術應用于檔案工作自動化系統的開發。另一方面,檔案界也應該意識到機器學習的局限性。運用邏輯運算可以完成大規模檔案數據的整理工作,但是機器學習需要時間,同時,機器也無法完全像人類一樣對檔案數據內容和背景進行正確、精準的理解分析。如果過分依賴人工智能技術及其產生的結果,很有可能會出現偏差。因此,檔案工作者在對檔案工作自動化系統進行訓練時應注意測量精度,調整算法,確保檔案工作自動化系統算法透明,不斷提升自身參與檔案工作自動化進程的技能,夯實檔案專業知識,加強“檔案倫理觀”,避免過分依賴系統造成的偏差[5]。

國內檔案界學者和檔案工作者自20世紀90年代開始對人工智能技術在檔案工作中的應用進行探討和實踐。朱久蘭、馬旭超等學者就人工智能技術應用于檔案檢索,用計算機程序代替人的思維和推理過程,降低著錄標記技術難度,提升檔案檢索工作效率展開探討[6][7]。當前,我國檔案界對人工智能的研究主要涉及以下幾個方面:第一,人工智能給檔案管理帶來的機遇與挑戰。有學者認為建立在人工智能基礎上的智能化為檔案價值實現提供新的路徑,然而在此背景下傳統檔案知識體系將面臨適應智能化時代的檔案認知和檔案管理需要進行更新的任務[8]。也有學者認為人工智能將給常規性、重復性、技術含量低的檔案崗位帶來沖擊,但同時人工智能技術在檔案數字化、智能檢索、提升檔案服務效率等方面有廣泛的應用價值[9]。第二,人工智能技術在檔案管理實踐活動中的應用與探討。太倉市檔案館的智慧檔案館在建設過程中引入人工智能技術為檔案資源收集、檔案智能分類、檔案安全管理、檔案網絡建設工作服務,成效顯著[10]。也有學者認為,運用人工智能技術優化檔案管理系統和服務系統,開展移動端檔案業務以及檔案編研工作,將滿足用戶的個性化需求[11]。第三,我國檔案界關于如何應對人工智能的相關思考。有學者認為立足深度學習與聯想功能的人工智能設備可以處理的信息量呈現幾何級數增長,在此背景下傳統的檔案管理原則、檔案鑒定標準、檔案作用和價值的發揮等均要發生變化[12]。

總體上看,國外與國內檔案界對人工智能的理論探索和應用研究各有千秋。前者側重于人工智能技術在具體業務活動中的應用和實踐,受圖書館、信息資源管理領域人工智能應用研究的影響較為明顯。國內側重于人工智能引入檔案管理活動的可行性、機遇與風險分析,在具體技術應用層的研究還處于探討和初步試驗階段。但值得肯定的是,我國檔案界較為敏銳地意識到:傳統檔案管理理論和管理模式必須結合人工智能環境進行調整和更新,才能以變應變,長遠發展。

2人工智能對檔案管理的影響分析

通過對國內外檔案界有關人工智能理論與實踐的梳理,了解當前檔案界對人工智能主題研究的特點和趨勢,從中總結出人工智能對檔案管理產生以下影響:

第一,人工智能在檔案界的應用將推動檔案管理理論的發展與創新。人工智能技術快速發展并且應用日益廣泛,但適應新技術環境的檔案管理理論仍然處于缺失狀態,無法精準、密切地指導檔案管理事業的發展。傳統檔案構成要素在計算機環境下如何進行重新定義,傳統檔案鑒定理論如何發展以適應計算機批處理檔案鑒定工作,傳統的檔案分類方法論和全宗理論如何滿足數字環境下多元主體協同生成信息的歸檔工作都是需要應對的問題。檔案學作為一門實踐性很強的學科,實踐走在應用理論甚至基礎理論前面是很平常的事。但檔案實踐長期走在檔案理論前面,就不能簡單視為一種正常的現象。因此,人工智能與檔案管理深度融合亟需新的檔案理論支撐。

第二,人工智能在檔案界的實踐將倒逼檔案管理的優化與轉型。通過現有文獻不難發現,人工智能技術在檔案領域的應用幾乎涵蓋了檔案管理的所有流程。因此,基于技術革命而大膽預測,未來人工智能帶來的科技變革,將會極大地影響到現有檔案管理的模式與方法。技術革新將倒逼檔案管理轉型發展,檔案工作自動化系統的開辟,檔案的智能化管理,檔案基礎性業務活動更新與迭代,檔案整合、檢索與利用工作的一站式處理等等,將展現出人工智能技術與檔案業務的深度融合發展。由此,假如檔案界能高度重視人工智能帶來的機遇與挑戰,以開放、包容的心態加入人工智能技術的運用環境之中,探索“人工智能+檔案”的具體實現場景,將會產生科技推動檔案工作轉型發展的強大優勢。

第三,人工智能在檔案界的發展將助推檔案管理人員的改造與升級。未來幾十年是人工智能深度發展應用的幾十年,檔案領域不可避免地將卷入人工智能的浪潮之中,檔案管理人員也需要具備長遠的戰略眼光和高位的職業定位布局,在堅守專業領域“一畝三分地”的同時,具備“開眼看世界”的敏銳視角和綜合能力。檔案管理人員在人工智能領域是否存在生存空間,應該扮演什么角色,參與檔案相關的人工智能項目需要具備哪些技能,應該選取什么樣的組織機構和技術人員開展檔案業務合作……對于以上問題的思考將不斷推動檔案管理人員自身能力的提升,以防止其在人工智能浪潮的裹挾下落入職業消亡的境地。

3人工智能助推檔案管理發展的建議

2017年,國務院印發《新一代人工智能發展規劃》(國發2017〔35〕號),從國家層面提出構建開放協同的人工智能科技創新體系,關注和發展知識計算引擎與知識服務、類腦智能計算、虛擬現實智能建模技術等關鍵技術,培育智能經濟、智能社會、智能政務等。正值我國加強人工智能布局、收獲人工智能紅利、引領智能時代的重大歷史機遇期,檔案領域如何在此時代背景下,明確發展定位、找準發展路徑,需要理性的思考和長遠的籌謀。那么,關于人工智能,我們究竟要堅守什么、轉變什么以及創造什么?筆者提供如下些許建議:

第一,來源上的優勢發力。對檔案界而言,不能正確預判管理技術發展的方向、把握管理形態的變化,不僅會導致“技術代差”,更會引發“部門淘汰”等生存危機。學者Venkatesan M曾說過:“無論人們是在使用算法、人工智能還是機器學習,有一點可以確定的是:如果所使用的數據是瑕疵的,那產生的結果也必將帶有瑕疵”。因此,檔案界要深刻認識到數據是人工智能應用的“立身之本”。換言之,誰能掌握最準確、最翔實的數據信息,誰就更有可能實現所謂的“智能”。檔案部門在數據質量和數據管理方面具備天然的優勢,相較于互聯網上存在的海量的、形態各異的流態數據,檔案數據憑借其真實性、完整性、可靠性脫穎而出,成為機器學習、人工智能研究開展所需的優質數據集。另外,隨著我國電子政務服務的深入推進,具備高附加值特點的跨機構、跨部門、跨地域協同公共業務活動產生的檔案數據成為國家、社會各界爭相利用、開發的重點。因此,檔案界須轉變思維導向,堅持發揮檔案數據的特殊優勢,與相關機構合作打造檔案數據池,借助適宜、有效的智能工具和方法,讓各類檔案數據盡其才、盡其用。江西省贛州市不動產登記中心把國土、礦產、林業、城建、規劃和不動產等分散的檔案資源融合成一個“數字化聚寶盆”,構建贛州市自然資源“一張圖”系統。通過將各主管部門的檔案數據進行整合與集成,融成涵蓋建設用地使用權圖形、建筑物圖形、城市規劃圖、基準地價圖的檔案數據池,為后期引入人工智能技術對檔案數據進行分析與挖掘夯實基礎。

第二,借鑒下的因地制宜。盡管部分專業領域在引入人工智能推進升級、轉型工作時遇到層層阻礙,實踐效果不盡如人意,但是積極尋求應對與融入策略已經成為人工智能時代各行業生存發展的大勢所向?!秶鴦赵宏P于印發新一代人工智能發展規劃的通知》提出,要開展跨學科探索性研究,推動人工智能與神經科學、認知科學、量子科學、心理學、數學、經濟學、社會學等相關基礎學科的交叉融合。這從側面反映:其他學科只要能注意參與、融合,同樣可以在人工智能發展過程中占據一片發展之地。當前,圖書館學、情報學已經先檔案界一步搭乘人工智能的高速列車,專家系統、自然語言處理等技術在圖書館文獻分類、在線訪問公共目錄設計中的應用,預測性搜索、全文搜索技術在文獻查詢檢索服務中的普及,機器人技術在圖書館工作自動化中的發力等等,將為檔案界應用人工智能開拓智慧管理之路提供參考的案例和前期經驗。但是,在此過程中應注意人工智能的應用既需要具備技術可行性,也要貼合主體的實際需求,實現科學且必要的因地制宜。以江蘇省太倉市智慧檔案館為例,該館在館藏系統中引入智能Agent技術,定期自動掃描館藏數字化檔案資源的存儲區域,把可用的文字信息自動分類存入指定的全文數據庫(CFS文件)中,可以有效地將檔案全文檢索的時間控制在0.1秒以內,提高檢索速度和準確度[13]。

第三,融合中的主次有別。技術和工具的存在意義在于服務人類實踐活動的開展,技術唯上、唯技術主義等絕對認識論并不能完全解決實踐活動中的所有問題。就檔案界引入人工智能而言,分清主次、明確核心目標,至關重要。借助技術手段實現業務管理的最終目的是根本要義,切勿盲目追隨技術熱點,強硬嫁接只會適得其反。人工智能技術的使用應該融合到具體的檔案業務場景之中,就業務需求和實踐需要有的放矢,實現技術助力管理的終極目標。以北京市市場監督管理局為例,業務活動中產生的工商檔案數量龐大、存儲分散、格式多樣,面對極速增長的電子檔案查詢服務、電子文件歸檔與歸集、特定檔案內容提取等業務需要,人工智能的用武之地盡顯。其運用文本處理、圖像識別等技術實現對電子檔案的智能比對和分類,設置歸檔批處理標準和程序,提升電子文件歸檔工作的效率,也運用信息抽取技術實現對檔案內容的結構化處理和文本挖掘,為精準查詢、提升檢索效率服務。

第四,運用中的包容開放。目前,大數據應用難以在專業實踐中落地生根是各行各業共同面臨的問題。經分析后發現:技術的成熟與先進程度并不是關鍵制約因素,究其根本在于懂技術懂業務的專業人士的缺乏。大數據技術效用的發揮需要具體的應用場景做支撐,僅有少量或極個別的專業人士能夠把握、推動智能數據處理技術與海量專業數據的無縫對接。因此需要檔案管理人員以包容、開放的眼光尋求與技術人員的合作、交流。多方協同是當今時代各項事業發展的主流趨勢,借力打力,取長補短是檔案界應該意識到的發力點。當前,我國浙江省檔案局、青島市檔案館、北京市工商檔案管理中心紛紛與提供專業人工智能技術服務的公司進行合作,檔案工作者與技術研發人員溝通業務需求,共同確定技術引入節點,立足檔案業務現實問題,探索人工智能技術的應用價值,取得可喜的效果。

人工智能技術進步速度快、影響面廣,檔案人如果等到面臨職業消亡的威脅或在發展迫在眉睫時再想辦法應對,很有可能為時已晚。因此,在各數據部門紛紛借助智能技術實施智慧數據管理和服務的背景下,檔案界要逆流而上,爭取不被淹沒在智慧轉型的浪潮之中。同時,我們也應認識到“智慧”的根源仍在于檔案人,而非智能技術。歸根結底,智慧管理就是對檔案管理實踐中產生的智慧進行整合,使之能與隱藏的管理規律、動態服務需求間形成良好的協同互動。當前,人工智能在檔案界的應用已經無法回避,智能技術取代部分程序化、機械化、模式化的檔案業務工作已成星星之火之勢。在面對人工智能的浪潮時,檔案人要敞開心胸,正視技術變革的利與弊,不斷調整、完善自身知識結構,爭取在未來的競爭中有所依靠。

注釋與參考文獻

[1]傅平,鄒小筑,吳丹,葉志鋒.回顧與展望:人工智能在圖書館的應用[J].圖書情報知識,2018(2):50-60.

[2]Warwick K. Artificial Intelligence[M].Hoboken: Taylor& amp; Francis,2011:13-59.

[3]Artificial Intelligence Is Cracking Open the Vatican’s Secret Archives[EB/OL].[2019-03-10].https://www.theatlantic.com/ technology/archive/2018/04/vatican-secret-archives-artificial-intelligence/559205/.

[4]Ediz Saykol, Ugur Gudukbay, Ozgur Ulusoy. Scenariobased Query Processing for Video-surveillance Archives[J]. EngineeringApplications ofArtificial Intelligence,2010(23):331-345.

[5]Intelligence artificielle et l’impact sur la gestion d’information et les archives.[EB/OL].[2019-03-10].https://www.ica.org/ sites/default/files/mef_intelligence_artificielle_dissemination.pdf.

[6]朱久蘭.檔案信息智能檢索[J].檔案學通訊,1994(4):57-58+39.

[7]馬緒超.人工智能及其在檔案檢索中的應用[J].黑龍江檔案,1996(6):36-37.

[8][12]陳輝.智能化社會檔案價值實現新路徑與檔案知識體系重構探析[J].檔案學研究,2018(4):13-17.

[9]朱云輝.人工智能技術在數字檔案信息資源分類與檢索中的應用[J].資源信息與工程,2018(12):200-204.

[10][13]陳亮.人工智能技術在智慧檔案館建設中的應用初探——以太倉市檔案館為例[J].檔案與建設,2016(7):80-82.

[11]沈牡丹,范智新.人工智能時代檔案工作如何尋求新發展[J].蘭臺世界,2018(5):77-79.

猜你喜歡
人工智能檔案管理智能
關于企業檔案管理體制改革的探討
新形勢下檔案管理工作創新探析
2019:人工智能
智能烹飪機
人工智能與就業
新農村建設形勢下衛生院檔案管理工作探討
檔案管理現代化中檔案管理原理的運用分析
超智能插秧機
數讀人工智能
自由光2.4L專業版+智能包
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合