?

文件連續體理論視域下檔案數據治理能力提升探析
——以NAA《數據戰略2023-2025》為例★

2023-03-22 23:11袁安琦楊智勇
山西檔案 2023年6期
關鍵詞:價值

袁安琦 楊智勇

(上海大學文化遺產與信息管理學院 上海 200444)

1 引言

文件連續體理論是在澳大利亞基于證據和連續體的文件管理思想、文件系列體系思想的基礎上,借鑒后保管主義及結構化理論建構的后現代主義文件保管新范式,它強調文件的運動具有時空延伸性,其終極訴求是建立一個自下而上的、可靠的文件保存體系,以完整保存集體記憶,促進社會民主發展。[1]數字化轉型背景下,檔案資源形態由模擬態加速向數據態、價值態轉化,檔案管理活動逐步邁向檔案數據治理新階段。而文件連續體理論所蘊含的整體性、證據性思想在檔案數據治理中體現了強大的生命力。目前學界對于檔案數據治理的研究主要集中于以下三方面:一是探究其概念內涵,如理論坐標[2]、三重邏輯[3]、認識維度[4]等;二是針對檔案數據治理各要素提出優化建議,如檔案數據質量治理[5]、檔案數據權力治理[6]、檔案數據安全治理[7]等;三是結合具體實踐領域探究治理對策,如高校檔案數據治理[8]、紅色檔案數據治理[9]、醫療檔案數據治理[10]等。澳大利亞國家檔案館(以下簡稱NAA)在數據治理實踐方面處于領先地位,于2022 年12 月頒布的《數據戰略2023-2025》[11](以下簡稱《戰略》)以實現數據價值最大化、數據受到信任和保護、促進數據利用、構建數據能力為目標,實現NAA 2030 年愿景——打造世界領先檔案館鋪設道路,對我國具有參考借鑒價值。為此,本文以《戰略》為例,著眼于檔案數據治理與文件連續體理論的耦合,闡明文件連續體理論應用于檔案數據治理中的價值,探索檔案數據治理能力提升對策。

2 檔案數據治理與文件連續體理論的耦合

文件連續體模型中的身份軸、保管形式軸、業務活動軸、證據軸代表的是文件運動過程中的4 個重要主題。檔案數據治理指的是檔案部門、社會組織和公民等多元主體通過協同合作,利用現代信息技術對檔案數據整個生命周期進行科學有效、合法合規的全程管理,挖掘檔案數據價值,滿足社會利用需求,實現檔案數據善治的活動和過程,[12]其核心內容與文件連續體模型四軸聯系緊密,下文將以《戰略》內容為支撐,針對二者耦合做簡要分析。

2.1 身份軸:構建檔案治理共同體

文件連續體模型中的身份軸主要指的是文件保管活動中的行為主體,包括形成者、業務部門、組織機構和制度。該模型認為“檔案”并不是由單一主體所形成的單一形式文件,而是應包括多元主體所形成的多種形式的證據和記憶。[13]檔案治理共同體是由檔案形成者、檔案保管者、檔案利用者、檔案監管者及相關輔助力量,圍繞檔案的價值生成、價值流轉、價值實現所形成的責任與利益聯合體。[14]《戰略》在原有信息治理框架的基礎上,將館內所有工作人員都界定為數據用戶,并將其劃分為領導層和執行層兩類,以明確其能力與職責。其中,領導層包括信息和數據治理委員會、主管助理、首席信息治理官,對國家檔案館總體運作、項目實施、戰略規劃等進行全面治理;執行層包括數據管理總干事、數據管理員、數據專家、數據用戶(所有員工),負責監管檔案數據質量、防范安全風險、確保資源共享等活動,并對日常工作中的數據使用提出優化建議。NAA 在內部培養館員數據治理能力的同時,也注重構建與外部政府部門或其他機構的數據協作機制,如《澳大利亞數據戰略》《數據可用性和透明度法案2022》《建立公共文件信任:為政府和社區管理信息和數據》《人工智能(AI)行動計劃》等,從而不斷滿足政府的數據需求和公眾的數據期望。[15]理順多元主體在數據流動各環節中的權責關系,有利于形成共建共享、高效安全的檔案數據治理模式。文件連續體理論強調跨越文件保存機構間的合作,以目的為導向的系統方法能夠提升歸檔保存數據的規范性,并使得檔案部門主動地、超前地參與到數據全生命周期治理過程中。

2.2 保管形式軸:檔案態別縱深轉化

文件連續體模型中的保管形式軸主要指的是文件保管活動中的資源形態,包括文檔、文件、檔案和檔案集合。該模型中的“文件”是動態的客體,就其內容及結構的一些意義坐標而言是固定的,但其背景元數據是不斷擴展和豐富的,而正是這些元數據保證了文件在時空運動時的可獲取性、可用性及可靠性和真實性。[16]價值密度高、結構復雜、種類繁多的檔案數據作為檔案數據治理的對象,對其進行處理的技術手段應從傳統數字化、數據化向語義關聯、價值呈現轉變,以實現善治目標?!稇鹇浴分饕嫦騼煞N類型的數據:一是仍處于活躍或半活躍狀態,用于通知、執行、記錄和傳達有關館內業務活動、決策和批示的數據;二是按規定保管和使用的澳大利亞政府最有價值的永久保存數據。該《戰略》采取的是廣義的數據定義,認為數據可以是數字的、空間的、統計的、結構化或非結構化的信息(未處理或已處理),以文本、數字或多媒體等形式傳達,并可以按特定目的或業務主題構建結構化的數據集,由此形成以單個或多個數據集合形式存儲的、有組織的數據庫。為實現數字檔案目標,數據處理過程需要升級優化以提高效率,NAA 序化整理原住民數據、打造Bringing them home 姓名索引數據庫、探索現代云環境Preservica 試點、更新云端數據治理清單,通過將民眾與澳大利亞政府活動和決策的證據聯系起來,使得澳大利亞的文化認同和民主得到加強。[17]檔案數據與傳統紙質檔案雖然在態別和細粒度上有所不同,但是在其整理活動中均經歷了從最初無序生成到最終有序聚合的過程,不斷豐富檔案背景信息,從而使得檔案價值能夠在更大范圍得以實現。

2.3 業務活動軸:全生命周期價值鏈

文件連續體模型中的業務活動軸主要指的是文件保管活動中的行為軌跡,包括業務(事務)、活動、功能和目的,能夠反映數據在不同維度中的不同作用和對同維度其他環節的影響。在實際的管理活動中,檔案數據能直接反映不同場景中形成和利用主體的主要職能及在社會中所扮演的角色,體現了檔案數據實現社會價值的整個過程。[18]檔案數據治理是在確保數據安全的前提下,對檔案數據從最初生成到最終銷毀或永久保存的整個生命周期進行科學規范的管理。NAA 以數據作為基本業務推動力的理念,運用現代技術以改變收集、共享、管理和使用數據的方式,依據國家戰略制定數據傳輸計劃,并提升數據分析能力?!稇鹇浴吩诳紤]數據連續性的基礎上,提出涵蓋數據全生命周期的數據價值鏈。在前端著錄環節,NAA 捕獲一系列元數據并將其與在社會及業務活動中形成的文檔緊密相連;在后端歸檔環節,NAA 改進了社交媒體捕獲流程,促進了對各種渠道的訪問和互動,以豐富的檔案數據資源擴大檔案館的影響力?!稇鹇浴窂娬{以人員素質的提升促進業務活動的規范化,通過開展數字存檔和網絡安全意識培訓來推動館員數據能力的持續優化。[19]文件連續體理論認為“檔案”的價值源自它們最初形成時的背景,是具有持續價值的文件,并且可同時具備多重價值。而檔案數據因其流動性強的特點,借助信息技術手段和治理環節的前移,能夠突破時空界限,在其全生命周期內實現多元價值。

2.4 證據軸:數據安全強化信任

文件連續體模型中的證據軸主要指的是文件保管活動中的價值呈現,包括痕跡、證據、機構/個人記憶和集體記憶,能夠反映檔案數據以其固有的原記錄屬性,以不同形式在不同時空范圍中發揮證據價值的過程。該模型認為文件與檔案的價值和意義由它們最初形成的背景所賦予,因此對于元數據和數據質量的把控是實現檔案數據原始憑證價值的核心要義。數據質量是檔案數據治理的關鍵,是檔案數據規范管理與有效開發的基礎,包括檔案數據自身的質量和檔案數據的過程質量兩方面。[20]《戰略》的四大目標之一是“數據受到信任和保護”,NAA 將保持其作為聯邦檔案數據值得信賴的管理者的角色,從識別數據問題、保障數據網絡安全、嚴密數據防護、高效數據存儲四方面采取相應措施,如基于數據治理成熟度模型方法進行風險評估、提升側重于保護網絡數據的Essential 8 活動、開發并實施數字格式連續管理方法、制定預防數據丟失的戰略和路線圖、制定關于數字材料長期保存和訪問的研究報告、按照國際慣例保存電子文件、管理關鍵業務的系統日志等,以確保政府和社會能夠創建、保護、保存和獲取真實的信息,從而使得數據作為戰略資產加以有效共享利用。[21]文件連續體理論以發揮檔案證據價值和構建社會記憶為核心,而檔案數據治理以保障數據安全為前提,同樣需要確保檔案的真實與完整。

綜上所述,文件連續體理論強調文件與其形成背景的邏輯聯系,弱化文件積累和管理的階段性,將其描述成一個連續的系統性過程。而檔案數據治理是數字時代下的一種必然趨勢,檔案數據的連續性、整體性、多維度特點,以及對于背景信息的重視都遠超傳統紙質檔案。檔案數據的流轉過程貼合文件連續體的時空延伸性內核,文件連續體理論在檔案數據治理中體現出了極強的匹配性。

3 文件連續體理論在檔案數據治理中的價值闡釋

文件連續體理論構建了一個多維坐標體系來描述文件的運動過程,這一體系包括形成維、捕獲維、組織維和聚合維。數據連續性以連續體思想為指導,是指由數據的可關聯性、可溯源性、可理解性及其內在聯系組成的一整套數據保護措施, 其目的是保障數據的可用性、可信性和可控性。[22]文件連續體理論能夠為檔案數據流動提供理論依據,為檔案治理實踐提供系統思維,為檔案價值實現提供目標指引。

3.1 形成維與捕獲維:為檔案數據流動提供理論依據

形成維和捕獲維可視為執行維,這兩維關注的是獲得行為的痕跡,并確保它能作為證據;形成維與捕獲維是根據組織維和聚合維所制定的規范、標準、設計要求及最佳實踐模型來開展的。[23]形成維描述的是關聯性較低的數據,體現了數據不斷生成的過程;捕獲維描述的數據具有一定的關聯性并經過了初步整序,使得數據可從其形成的直接背景中“脫離”出來,并能夠追溯到形成維的各個參與要素。[24]《戰略》中對數據、數據集、數據庫的界定體現出NAA 對數據關聯性的重視,強調數據的連續管理、全程管理、前端控制,關注數據在全生命周期中的動態變化和價值增值。在數據形成之初對數據質量進行嚴格審查,將檔案數據治理環節前移,注重保留數據生成痕跡、數據形成要素、數據生成內容,有助于實現檔案數據的可追溯、可保存、可利用。[25]檔案部門可借鑒文件連續體理論的連續性思維來維護檔案數據的完整、真實、安全和可信,使得檔案部門在組建國家數據局的大背景下理清自身職能范圍,有效發揮檔案數據的原始記錄性及其憑證價值,融入數據全過程管理。文件連續體理論去中心化、非線性化的特點弱化了“文件”和“檔案”作為文件運動端點的特性,數據能夠在流轉過程中持續實現其價值。

3.2 組織維:為檔案治理實踐提供系統思維

組織維可視為控制、規范、標準化及審查維度之一,關注“內部”事務,即機構記憶的形成、管理及提供獲取。[26]組織維中的數據可能來自不同的時間和地點,其數據集合的時空延展性擴大,從而賦予數據在組織機構中更大的可獲取性?!稇鹇浴吩跇嫿〝祿芰?、提升館員素質的同時,在原有信息治理框架基礎上將館內所有人員都視為數據用戶,并劃定相應的數據角色和職能。除此之外,NAA 還建立了館內協同機制,使《戰略》與信息安全政策、檔案風險管理框架、數字資產登記冊、業務連續性政策和計劃等相適應,從而減少戰略實施的阻力,提高政策制定的連貫性。檔案數據協同治理能夠保障數據質量、深化檔案服務、提升善治效能,通過制定統一完善的標準體系,利用語義挖掘等技術對檔案數據進行價值性關聯和語義級開發,充分釋放檔案數據價值,為知識管理奠定基礎。與此同時,檔案數據治理強調檔案部門的“元治”地位,通過不同機構之間的溝通與協調,平衡不同主體之間的沖突,圍繞檔案數據的全生命周期,對檔案數據質量、數據安全等進行治理,提升檔案數據的有序性和科學性,促進檔案數據的有效供給,進而提高檔案數據治理效能,實現“共治”和“善治”。[27]

3.3 聚合維:為檔案價值實現提供目標指引

聚合維可視為控制、規范、標準化及審查維度之一,關注“外部”事務,即集體記憶的構成。[28]聚合維描述的是來自不同機構的數據,能滿足其形成、捕獲及組織過程中所涉及的主體以外的主體多元化需求,雖然檔案數據在這一維度中不直接呈現的背景信息,但通過數據的時空連續性使數據集合提供了更全面真實的信息內容,充分實現數據證據價值和構建社會記憶的功能?!稇鹇浴返氖滓繕耸菍崿F數據價值最大化,加快NAA 數字轉型進程,充分發揮數據在制定和實施政策、項目與計劃中的作用,為此采取提升數據分析能力、制定符合實踐和政府需要的數據收集和管理政策、通過機構電子文件的安全傳輸向公眾開放數據等措施,這與檔案數據治理的核心理念——充分實現數據價值相契合。文件連續體理論有利于檔案數據證據價值最大化發揮,檔案數據從生成開始就在不同維度中擴散和收束,其元數據具有連續的可追溯性,并且能與其他數據進行關聯,利用背景信息的關聯性來強化證據價值,借助數據連續性來提高社會記憶完整性。[29]大數據時代的檔案數據因其生成速度快、價值密度高、關聯性強等特點,需要突破時空界限,借助人工智能、XR、文本挖掘、語義分析等技術深層次挖掘海量數據的多維潛在價值。[30]

4 文件連續體理論視域下檔案數據治理能力提升策略

《戰略》等一系列體現數字化轉型目標和發展愿景的文件,對我國檔案機構規劃、制定與實施數據戰略有一定的參考借鑒價值。文件連續體理論強調的連續性、多維互動、時空延伸與檔案數據治理強調的全程性、多元協同、價值實現相契合。為此,筆者在文件連續體理論的指導下,提出全程管控、主體協同、資源聚合等建議,以期提升檔案數據治理能力。

4.1 全程管控:提升數據質量管控能力,化解治理風險

檔案數據的流轉運動是一個連續性的過程,其背景信息和價值內涵也隨著數據的運動過程愈加豐富,因此將治理環節前移并進行全程管控有助于保證檔案數據的完整性、可用性、安全性。因檔案數據體量巨大、來源廣泛等特征,提升檔案數據質量管控能力既符合國家總體安全利益,又契合我國檔案治理工作的現實需要。數據質量管控能力主要體現在檔案數據質量評價標準與指標體系、檔案業務流程的優化與再造、檔案工作者的專業素質三方面。[31]在檔案數據生成和收集階段尤其要著重提高檔案數據的質量管控能力,通過制定檔案數據質量標準和管理制度,輔以智能技術應用將檔案數據質量量化,按照既定指標對數據進行監測和管控,保證檔案數據真實可靠,高質量地收集檔案數據資源,為后續檔案數據治理夯實基礎。[32]與此同時,應通過加強法律體系建設、完善安全管理制度、構建安全防范壁壘和提升管理人員素質等手段,對檔案數據的采集、傳輸、存儲和利用全生命周期進行綜合管控,構建檔案數據安全治理模型,保障檔案數據的可信、可獲取、可溯源。另外,在整體上要把控檔案數據治理流程,及時改進和持續優化檔案數據治理策略,準確評估和定位檔案數據安全風險,持續優化安全建設,促進檔案數據善治目標的實現。[33]

4.2 主體協同:融入合作思維,共建治理體系

檔案數據治理是一項涉及多元主體的系統性工程,理順各主體在數據生成、流轉過程中的職能范圍和權責關系有助于構建高效的檔案數據治理體系,優化治理環境。一方面,應構建檔案治理共同體,優化檔案數據治理組織體系。黨政機關、檔案主管部門、企事業單位、社會公眾等均為檔案數據治理的主體,應建立科學平等的溝通對話機制使各主體“盡其責、行其權”。具體而言,黨政機關應該把握檔案數據治理的目標導向,使其融入國家治理現代化的大局中來;檔案主管部門應突出其“元治”地位,制定切實可行的檔案數據治理方案,在宏觀上建立檔案數據跨部門流動機制,微觀上完善檔案數據全流程處理程序,自上而下為檔案數據安全保管和共享利用打通屏障;[34]企事業單位和社會公眾應認識到檔案數據的價值和對其進行治理的重要性和必要性,積極參與到檔案數據治理活動中來。另一方面,應完善檔案數據治理法規標準體系,并加強與相關數據部門政策的銜接?!丁笆奈濉比珖鴻n案事業發展規劃》提出要全面推進檔案治理體系建設,完善檔案法規制度和標準規范。檔案部門應將檔案數據治理置于國家治理、社會治理、政府治理的整體布局中,并與如國家數據局等其他數據管理部門的政策法律相銜接,滿足大數據環境下檔案數據治理實踐工作的需要。[35]

4.3 資源聚合:打破時空界限,釋放價值潛能

檔案數據治理的最終目的是擴大檔案價值的實現,利用服務是檔案工作的宗旨,而信息技術在數據價值創造中提供了重要的驅動力。檔案部門應聚焦檔案“收、管、存、用”等方面,積極借助大數據、人工智能、數字孿生、知識組織等現代信息技術,對海量數據資源進行深度分析、知識聚合,在人機物三元智慧融合中不斷增強檔案數據開發能力和服務能力。[36]首先,運用數據挖掘技術,對類型多樣、來源廣泛的海量檔案數據進行格式轉化、語義分析、關聯聚合,充分釋放檔案數據價值;并借助語音識別、OCR 識別、圖像分析、自動標引、智能感知等技術方法,對各種類的檔案進行數據化處理、智能分類、智能著錄、智能鑒定等,充分將數智技術融入檔案數據治理,提升檔案數據運行效能。[37]其次,加強不同系統對接,實現業務與數據的深度融合,化解信息孤島,在業務流程中嵌入電子文件歸檔要求,在業務系統中同步規劃、同步實施電子文件歸檔功能,從源頭上確保實現檔案數據的應收盡收、應歸盡歸,促進業務協同。最后,應加強與高校、科研部門、IT 公司等機構合作,運用區塊鏈、云計算等技術構建全國檔案數據協同治理平臺,促進國家層面檔案數據資源安全傳輸和集成共享,為進一步實現檔案數據挖掘、可視化等提供基礎。

5 結語

隨著數據要素的戰略地位日益凸顯,如何培養數據思維、把握數據浪潮引領下的新機遇、實現檔案館自身數字化轉型升級,從而充分融入國家數據治理總體性框架成為重要時代議題。數智浪潮推動之下,檔案資源形態加速向數據態、價值態轉化,檔案管理活動逐步邁向檔案數據治理新階段。檔案數據治理有利于提高檔案數據質量、釋放檔案數據價值潛能,促進檔案資源開發,提升善治效能。我國檔案數據治理應汲取全球治理實踐的先進經驗,探究檔案學經典理論的時代應用,從樹立治理思維、協同多元主體、深層關聯數據、融入新興技術、整合多方資源等方面提升檔案數據治理能力。

猜你喜歡
價值
踐行初心使命的價值取向
價值3.6億元的隱私
一分鐘能創造多少價值?
一粒米的價值
人與自然的和諧之美——《七月》價值新解讀
“給”的價值
俆衛:用夢創造價值
價值
從平凡中體現價值
“活著就要體現自身價值”
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合