?

基于數字孿生技術的數字檔案備份邏輯關聯及實現進路

2024-01-19 06:55周耀林武漢大學信息管理學院武漢大學政務管理研究中心
浙江檔案 2023年12期
關鍵詞:備份數字

周耀林/武漢大學信息管理學院 武漢大學政務管理研究中心

趙君航/武漢大學信息管理學院

1 引言

數字檔案備份是保障檔案安全的重要措施之一。自2009年始,國家檔案局提出了建立異地備份庫的要求后,各地紛紛響應。截至2023年統計,各省、副省級城市綜合檔案館都完成了備份建設。然而,調查發現,對比國際標準SHARE 78中計算機災難備份與恢復的七個層級[1],當前的備份策略無法實現數據的雙重在線存儲及零數據丟失;實踐中,當前的數字檔案備份存在內容不完整且質量較低、技術手段缺失、可利用性差等問題。因此,如何采取更先進的備份方法仍然有待研究,這也是落實《“十四五”全國檔案事業發展規劃》提出的“館(室)藏全部檔案數字資源完整備份”“積極探索備份新途徑”[2]的重要方面,具有很現實的應用價值。

2 數字檔案備份策略的發展與評價

2.1 數字檔案備份策略的發展

當前,我國現有的備份策略主要包括異地備份、異質備份、登記備份制度、數據備份中心和云備份五大類。

2009年國家檔案局正式提出各級國家檔案館要建立異地備份庫以實現重要檔案的異地備份,同時對重要的電子文件還應異質備份。此后,各地開始了對數字檔案備份制度的探索、創新及實踐應用。2009年浙江省檔案局首創檔案登記備份制度,2010年遼寧省建成全國第一家電子檔案備份中心,檔案云備份是由2012年“檔案云服務高峰論壇”所提出云計算技術應用的基礎上發展而來并最早見諸2017年江西省“檔案云中心”的建設。

異地備份與異質備份最早源于楊冬權在2008年全國檔案局長館長會議上提及,異地備份是指將檔案原件的復制件存放在異地,待檔案原件發生意外損毀、丟失等情況時可啟用異地“副本”,并需滿足雙方所在地相距300公里以上、不屬同一地震帶、電網等條件。異質備份是借助紙質檔案數字化、縮微攝影等技術手段,將檔案信息遷移到縮微膠片、磁盤等存儲介質上,即不同載體間的轉換備份,以減少檔案原件在使用中的損毀,如云南省檔案館落實檔案異質備份策略,以數字檔案轉縮微膠片為工作重心并取得重大進展。

登記備份制度最早由浙江省檔案局在2009年提出并實施,其是由檔案行政管理部門對本區域各單位具有重要保存價值數字檔案的形成、保管、移交情況進行登記,并將數字檔案在各級國家綜合檔案館登記備份中心進行數據備份,如浙江省于2009年12月印發了《關于開展電子文件和數字檔案登記備份工作的通知》[3],對檔案登記備份制度在全省范圍內大幅度推廣。上述備份屬于冷備份。與之相對的是熱備份,即應用系統可通過高速通信線路將數據實時傳輸到備份系統,如檔案數據備份中心和云備份策略[4]。

數據備份中心最早由遼寧省檔案局(館)在2008年提出建設并于2010年建成第一個全國檔案館電子檔案備份中心,其是指以檔案數據的集中存儲為目的,基于網絡存儲技術,通過運用多種手段實現檔案資源的整合、優化與安全維護。

云備份可以追溯到2012年“檔案云服務高峰論壇”所提出云計算技術在檔案行業的應用[5],此后云計算技術被逐漸應用到數字檔案資源備份工作中,尤其是將數字檔案在本地備份之外,還需在其它遠端服務器進行備份保存,以實現檔案數據的多重防護,如江西省加強數字檔案館建設規劃,建設檔案云中心以實現檔案的云存儲、云備份和云開發。

2.2 數字檔案備份策略的評價

現有的數字檔案備份策略的優點主要有:第一,已有備份策略具有穩定可靠、安全系數高等優點[6],例如檔案登記備份制度采用電子文件時點“固化”和第三方存管的方式,能夠避免在備份工作中出現數據丟失、損壞或被竊取等情況并最大限度地確保數字檔案的原始性、真實性。第二,已有備份策略具有易于維護、管理便捷、利用效率高等優點,例如云備份制度借助云存儲系統,能夠實現備份數據的動態管理與隨取隨用[7],省去了存放場地、硬件設施等額外事項以降低備份檔案的管理難度。

與此同時,現有備份策略也存在如下困境:第一,已有備份策略存在流程不規范、標準不統一的問題。例如,國家層面尚未對異地異質備份建設提出統一的意見或標準[8],各地采取不同的方法自愿結為“對子”,存在技術標準與流程規范各自為政的情形,一定程度上會影響備份成果的質量。第二,已有備份策略處于較低層級,無法實現數據的雙重在線存儲及零數據丟失。與此同時,當前備份策略僅是對數據進行簡單的復制,即只是將數據轉移到其他地點或介質上,并沒有對其應用環境進行同步復制[9],也受限于備份數據再次使用時可利用性較差的限制,難以進行創造性開發利用以充分發揮備份數據價值。第三,已有備份策略中缺乏全國性統一備份平臺或備份工作指導機構,各地存在“重復造輪子”的現象,建設同質化的云平臺、數據備份中心等,資源的重復建設也導致資金、人力與物力的浪費[10]。最后,已有備份策略注重維護數據的安全性,備份內容只能恢復備份時間點前的檔案數據,呈現出相對滯后的狀態[11],如若出現數字檔案內容后期修改的情形,則不能滿足數字檔案備份實時更新的需求,也就無法確保檔案備份內容的完整性與真實性。由此可見,現有檔案備份制度除了無法實現零數據丟失外,還存在諸多不足。如何克服上述不足,實現科學備份,實現數字檔案保真,是需要進一步探索的。

3 數字孿生技術與數字檔案備份的邏輯關聯

數字孿生(Digital Twin)理念最早起源于1969年美國國家航空航天局空間飛行器孿生體計劃,2003年美國密歇根大學的邁克爾·格里夫斯(Michael Grieves)教授正式提出數字孿生的概念,是指“用于虛擬表達、描述真實存在的一個或多個特定設施的數字復制品,并以此進行真實環境、條件和狀態的模擬仿真測試”[12]。近年來,數字孿生的應用范圍從航空航天、軍工制造等領域逐漸擴展到虛擬仿真、智能制造、故障診斷等領域。因此,將數字孿生技術應用到數字檔案備份領域,既能順應物理實體與虛擬空間映射、融合趨勢,又是對國家政策及未來數字化轉型戰略重點的準確把握,有助于以技術手段進步為支撐,更好地實現數字檔案真實完整、安全可靠的備份目標。與此同時,數字孿生技術也可實現在數字檔案備份領域的全周期應用,如圖1所示。

圖1 數字孿生技術在備份工作中的全周期應用

依據陶飛等[13]提出的數字孿生五維模型概念,可以進一步探討數字孿生技術與數字檔案備份的邏輯關聯。

3.1 基礎:物理實體數據的精準采集

物理實體即數字檔案,通常由實物檔案與電子檔案兩部分構成,該維度通過運用傳感器等設備實現對數字檔案數據的精準采集,其中,數字檔案數據的采集包括對實物檔案的“高階”數字化和電子檔案的完整收集。

與此同時,數據采集作為數字孿生的基礎性階段,采集的數據質量又會對數字檔案的備份效果產生重要影響。相較于數字孿生技術,運用平面掃描、環物攝影等技術手段采集的實物檔案數據處于初級形態,電子檔案采集過程中也出現格式不規范、標準不統一等問題,由此導致備份效果不理想。以物質文化遺產為例,傳感器所采集的數據將涉及三維坐標、材質構成等信息,全面立體化的數據為實物檔案的虛擬仿真以及備份奠定良好根基。因此,將數字孿生技術應用到數字檔案備份工作中,能實現數據格式的標準統一、數據質量的嚴格把控與數據內容的精準采集。

3.2 核心:虛擬空間映射的仿真實體

虛擬實體維度是數字孿生的核心環節,其原理是將所采集的數據在虛擬空間中完成映射以實現數字檔案的動態仿真,從而創造出虛擬化的“數字孿生體”,其中虛擬化的仿真是對數字檔案真實、全面的數字化形式表達。

換言之,數字檔案進行數字孿生的過程,也就是創造一個“數字孿生體”的過程。一方面,數字檔案備份的核心要義是借助數據及其應用環境的“復制”以實現長期保存、安全維護的目的,而數字孿生技術正契合創建檔案“克隆體”的需求,可為數字檔案備份工作的開展提供全周期支撐。另一方面,數字檔案在數字空間中通過映射所形成的仿真實體,以更“高階”的數字化形態加以呈現,能最大限度地確保數字檔案庫數據的齊全完整。

3.3 目的:檔案數據的長期保存服務

服務維度是數字孿生的目的,即通過對數字檔案所采集的數據進行深度挖掘、分析,開展模擬仿真、模型構建等步驟,并據此提供科學化決策、智能性檢測及精準化維護等服務。

數字檔案的長期保存是數字孿生的首要目的與重要目標,而對檔案數據的深度挖掘和開發利用則是有力保障。數字檔案的備份并不是簡簡單單的“復制”,而是對需備份的數據內容進行智能化分析與深入性挖掘,能更好地實現檔案數據及其應用環境的完整“復制”。一方面,如針對單位日常產生的檔案,可通過大數據分析、數據融合分析等技術手段,挖掘出文書檔案、科技檔案或財務檔案等各類型檔案材料中生成規范程度最高的類別,創建出檔案材料生成的數據模型及數據標準,契合備份工作對標準化檔案材料的需求。另一方面,可基于對實物檔案如珍貴文物檔案的數據采集,開展模擬仿真以分析其狀態,既可預測實物檔案在現實中可能遇到的各種威脅因素,為消除或避免可能對其造成損毀的潛在威脅提供解決方案,實現實物檔案的精準化維護,又能借助檔案“數字孿生體”,通過數據恢復、分析可為實物檔案的修復提供最優策略,高度契合檔案備份對于長期保存、運維和恢復的需求。

3.4 動力:衍生數據驅動信息的增值

通過對物理實體、虛擬實體與服務三大系統生成的檔案數據進行轉換、關聯等操作所形成的檔案孿生數據,即是對數據進行衍生、集成以實現數字檔案相關信息增值的過程,其作為數字孿生的動力存在。

數字檔案備份過程是綜合性與全面性的系統工程,數字孿生契合了檔案備份在數據集成與衍生方面的需求,既能形成更加全面、完整的數字檔案備份內容信息,又有助于借助信息的增值推動檔案高階服務體系的轉型。

3.5 連接:數據的動態實時互聯互通

數字孿生的連接維度是實現物理實體、虛擬實體、服務與孿生數據四大系統間兩兩相連的紐帶并為數據的動態實時傳輸提供橋梁,其在數字檔案備份過程中發揮著紐帶作用。

數字檔案備份以確保內容的“真實”與“完整”為重要目標,但無論是實物檔案還是電子檔案,往往備份之后檔案原件由于各種原因出現內容修改或發生毀損的情況,且內容修改或損毀后的狀態不易被追蹤,因此備份工作也就呈現出相對滯后的缺陷,即原件出現意外情況時只能借助已備份檔案恢復備份時間點前的內容,無法做到檔案備份數據或狀態的實時更新。與此同時,數字孿生技術可以實現檔案原件、檔案數字孿生體與孿生數據間的互聯互通,當數字檔案狀態發生變化時能及時進行數據的動態更新、實時傳輸,避免了數據易被篡改的風險,契合了數字檔案備份安全性維護需求。

由此可見,數字孿生技術在數字檔案備份領域具備較強應用潛力與空間,其邏輯關聯如圖2所示。首先,數字檔案的數據采集是備份工作的基礎,檔案孿生數據也為數字檔案的運維提供科學策略;其次,檔案數字孿生體是基于檔案孿生數據在數字空間中完成映射所形成的虛擬實體,同時也為檔案數據的孿生提供支撐;再次,通過對數字檔案數據進行分析、評估、預測等操作以推動數字孿生備份平臺的構建與數據價值的衍生;最后,圍繞檔案孿生數據為核心,數字檔案、檔案數字孿生體與數字孿生備份平臺三者間也實現著數據的動態、實時互聯互通,能最大限度地確保檔案備份內容的真實與完整。因此,數字孿生技術與檔案備份具備較高契合度,應將探究數字孿生技術應用到數字檔案備份中的實現進路以及兩者間更好地融合放到關鍵位置去考量。

圖2 基于數字孿生技術的數字檔案備份邏輯關聯

4 數字孿生技術背景下數字檔案備份實現進路

數字孿生技術與數字檔案備份領域具備較強邏輯關聯,因此秉持從宏觀到微觀、從內部到外部的視角,探究數字孿生技術在數字檔案備份領域的實現進路具有極強的現實意義。

4.1 發展戰略的前瞻性規劃

當前,《“十四五”全國檔案事業發展規劃》提出建設“國家電子檔案戰略備份中心”的目標,國家檔案局出臺行業標準《電子檔案單套管理一般要求》等,但相關政策并未對數字檔案備份流程、標準等進行具體規制,同時數字孿生技術的體系、框架等尚未完善,也缺乏數字孿生技術在備份工作應用的相關戰略規劃與政策統籌。因此,需將前瞻性的戰略規劃、相關政策與規章制度的制定放到關鍵位置去考量。

第一,檔案主管部門需出臺相應戰略規劃,將數字孿生技術作為檔案領域數字化轉型的抓手,充分發揮數字孿生技術在檔案數字化、長期保存、備份等方面的作用,為實現其在數字檔案備份領域的應用厚植政策土壤。

第二,檔案主管部門需制定數字孿生備份相應的標準及體制機制,一方面,相應的國家、行業標準能為數字孿生技術在備份工作中的應用提供指引,引導其沿著正確合規的道路發展;另一方面,也需完善績效考核體系,在原有綜合考核評價體系的基礎上,將數字孿生備份工作推進成效納入各地檔案部門或區域性備份中心的考核評價中,同時對數字孿生備份的具體程序作出規制,包括備份流程、內容孿生、應急預案等。

第三,各地檔案部門、區域性備份中心等需加強基礎設施建設,一方面是數據采集傳感器、計算機硬件等數字孿生備份硬件設備的配備,另一方面是智能傳感器、人臉識別、物聯網、檔案管理信息系統等數字孿生備份軟件系統設施的完善[14],涉及備份內容數據的收集、分析、挖掘等全流程。

4.2 數字孿生備份平臺的構建

數字孿生備份平臺的目標是為實現數字檔案備份全周期的保障,提供從數字檔案收集歸檔、遷移入庫、數字孿生、數據恢復的全流程服務。與此同時,數字孿生備份平臺可由檔案主管部門牽頭建設,實現國家電子檔案戰略備份中心建設項目的接入,同時由相關單位、科研人員、技術企業等共同參與建設方案、執行標準等的制定,鼓勵各省市、企業使用該數字孿生備份平臺進行檔案數據的備份。最后,具體到平臺運行機制而言:

第一,數字檔案收集與數據采集對應歸檔環節,數字檔案材料的質量會影響備份工作成效,因此平臺需對檔案數據的采集流程、標準等作出規定;

第二,數字檔案遷移對應移交接收環節,電子原文格式類型的繁雜不僅會對數據遷移造成影響,也會出現備份后再次調取無法打開的情形,因此平臺內亟需制定統一的數據遷移標準;

第三,數字檔案基于備份平臺系統的基礎上,在虛擬空間內完成映射,創造出“檔案數字孿生體”,并利用大數據、數據挖掘等技術對檔案數據進行深度挖掘,實現數據價值的集成與衍生;

第四,數字孿生備份平臺將檔案數據存儲在云端數據庫中,當數字檔案、數據或系統等發生災難性損毀導致運行癱瘓時,可借助平臺存儲系統內的遠程復制軟件,由智能存儲系統對云端數據庫內的檔案數據在最短時間內復制到受災系統中[15],實現數據及其應用環境的整體恢復,并做到“全真還原”。

4.3 關鍵技術的深層次突破

技術的不斷進步是數字孿生永葆生命力的基石,換言之,關鍵技術的深層次突破有助于實現數字檔案備份工作的優化與數據更好的孿生。

第一,數字孿生技術部門或企業需積極將時代發展的新型技術產物融入其中,以關鍵技術的深層次突破為抓手,組建關鍵型多元核心技術框架[16]。具體而言,關鍵技術應以3R(AR、VR、MR)、模擬仿真、沉浸式云XR、邊緣協同認知計算、大數據等多元信息技術的突破為引領[17],加強技術攻關,涵蓋數據采集、數據孿生、數據備份、數據恢復技術變革的方方面面,同時關鍵技術的突破也可借助更精準的數據分析挖掘,從而提供更為科學的決策、智能化運維等服務。

第二,制定數字孿生備份科學合理、權威統一的技術標準,推動相關技術標準的改進與完善。技術標準是對技術事項所需制定的統一化標準,其可針對具有普遍性的技術問題提出最優解決策略,而數字孿生技術標準的制定是數字孿生備份技術深層次突破與創新的基礎性保障,可為技術創新體系的構建提供指引。數字孿生備份技術標準的制定可由檔案主管部門牽頭,鼓勵各單位技術部門和相關企業積極參與其中,則更能實現所制定的標準與技術前沿接軌。

4.4 人才隊伍的專業化建設

“人”的因素在數字孿生備份工作中的重要性逐步凸顯,其對掌握或具備檔案、計算機、數據挖掘、數字孿生等多領域能力的復合型人才需求日益迫切。

第一,為契合數字孿生備份工作需求,數字孿生技術的應用促使檔案部門工作人員除掌握檔案及檔案備份的專業知識,還需具備運用大數據、數字孿生等新技術的能力。因此,一方面,各級檔案主管部門可組織開展工作人員的繼續教育工作,鼓勵并支持工作人員參加針對綜合能力提升的繼續教育培訓班,制定科學合理的激勵機制,以期提升其在檔案、信息管理、計算機等方面的技能與信息化素養;另一方面,各地檔案部門需積極“引智”,加強引進數字孿生備份工作各環節所需的專業化人才。

第二,各地檔案部門一方面可加強與本區域內高等院校的合作,既可將數字孿生、大數據、建模等技術理念融入檔案學專業培養體系中,又可成為高等院校檔案學專業的實習基地,鼓勵檔案學專業學生在數字孿生備份的業務實踐中進行實習,以期為未來數字孿生備份工作的發展儲備人才;另一方面,各地檔案部門可定期組織本單位工作人員去數字孿生備份工作實施成效好的單位、企業參觀交流,學習其先進經驗。

4.5 虛擬交互的沉浸式體驗

數字孿生技術應用的檔案備份工作具備虛擬交互特征,通過對檔案數據進行集成、衍生與挖掘,亦可豐富檔案備份工作內涵,實現開發利用方式的創新與實體運維手段的豐富。

第一,數字孿生技術可帶來虛擬交互的沉浸式體驗,創新了檔案備份工作保護與管理的方式。部分珍貴檔案材料由于年代久遠,經常性地翻閱、展覽等會對檔案材料造成不可逆的損毀,同時數字孿生備份技術可實現對檔案材料的模擬仿真,從而打破時空限制,代替實物檔案進行異地展覽、在線查閱等。與此同時,借助數字技術、新媒體技術與計算機技術,基于檔案數據孿生、衍生與集成,能以可視化的形式對備份數據進行直觀展示、科學管理與挖掘利用。

第二,數字孿生技術可實現對檔案備份數據的孿生,為數字檔案及數字孿生體的動態感知、模擬仿真、智能運維、科學決策及風險預警等提供保障。當前關于檔案數字化“備份”以實現安全維護的研究頗豐,如Sharaf Alkheder[18]從約旦沙漠宮殿三維可視化檔案系統建設的角度入手,對其中應用的技術進行詳細解析,但與此同時,針對實物檔案的3D化并不能實現其自身維護需求,數字化“備份”也未充分發揮在長期保存、運營維護等方面的作用。因此,借助數字孿生對珍貴檔案進行備份時,可通過數字化虛擬實體的構建,實現數字檔案相關數據的動態采集、實時傳輸,使保管單位能及時感知實體的動態變化,并借助大數據、數據挖掘等技術,為其風險預警、災害規避等提供科學策略。

5 結語

數字孿生技術是近年來出現的新興技術模式,既可為驅動檔案備份工作由物理空間向數字空間的映射及實現物理世界與虛擬世界的交融提供契機,又有助于推動“數智時代”背景下檔案備份工作的數字化、數據化轉型。數字孿生技術在檔案及檔案備份領域具備廣闊的應用前景,將會成為未來檔案事業發展新態勢,因此數字檔案備份工作亦應順應信息技術發展,抓住契機,實現檔案備份工作的創新性、跨越式發展。

猜你喜歡
備份數字
“備份”25年:鄧清明圓夢
創建vSphere 備份任務
數字
答數字
從取證角度解讀MacOS系統Time Machine備份數據
數字看G20
成雙成對
發射機備份是安全播出的重要措施
基于3G的VPDN技術在高速公路備份鏈路中的應用
成雙成對
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合