?

論登記備份數據的備份與管理

2023-07-22 02:48王銀炎浙江省檔案館災備中心
浙江檔案 2023年6期
關鍵詞:磁帶備份載體

王銀炎/浙江省檔案館災備中心

黨的二十大報告指出,“以新安全格局保障新發展格局”,安全在發展中的作用愈發重要,隨著信息化建設的快速發展,電子文件規范管理與檔案信息安全已越來越受到各級黨委和政府的重視,特別是政府部門電子數據在不斷加速增長,服務經濟社會的作用越來越大,加強電子數據的安全備份,對于確保政務服務系統安全穩定,保障政務服務工作有效開展具有重要的現實意義。當前檔案工作以“三個走向”為根本遵循,充分發揮檔案工作在“兩個先行”偉大征程中的基礎性支撐作用,切實把檔案保管好、利用好,記錄好、留存好,更好為黨和國家工作大局、為人民群眾服務。

以浙江省檔案館為例,2013—2022年浙江省電子政務數據災難備份中心(以下簡稱“災備中心”)接收備份的單位數量已超過150家,數據量超過150TB,其中數字化成果數據占80%,電子公文占4%,業務數據占16%,2018—2022年因各種原因導致的備份單位原始數據未保存或缺失的單位有9家,通過災備中心的備份數據恢復數據量超過8TB(以數字化成果數據和電子公文數據為主)。災備中心是開展檔案安全工作重要載體,為新形勢下電子檔案數據保管工作提供了安全保障,隨著全省登記備份工作的持續推進,電子檔案數據的不斷產生,檔案登記備份工作的重要性也逐步體現出來,但隨之而來的問題也漸漸浮現。其中登記備份數據的備份和管理問題已直接影響當前各地檔案館登記備份工作的開展。本文結合筆者工作實際,就如何對檔案登記備份數據(以下簡稱登記備份數據)的備份和管理談幾點看法及建議。

1 登記備份與數據保管流程

1.1 登記備份流程

以浙江省檔案館登記備份流程為例,各備份單位根據備份通知登錄檔案登記管理系統,將本單位的檔案管理情況進行登記并提交上報。具體流程如圖1所示。

圖1 登記備份流程

1.2 登記備份數據保存與管理流程

備份數據流程結束后,登備數據接收及保管單位(以下簡稱備份中心)會將接收到的登備數據進行保存與管理,具體流程如圖2所示。

圖2 登記備份數據保存與管理流程

備份中心定期將登備數據備份到LTO磁帶或光盤(檔案存儲用藍光光盤),脫機備份信息記錄到登記備份管理系統,磁帶或光盤脫機存放到載體管理庫房中。每年對存放超過2年的LTO磁帶或光盤載體進行抽樣檢測。備份中心制定登記備份管理制度,通過登記備份管理系統輔助,按照制度保存與管理登備數據,定期進行數據的恢復和可用性測試。通過以上流程,備份中心會源源不斷地接收登備數據,數據量會隨著時間的推移而不斷增加,隨之而來的問題也會逐步顯露出來。

2 登記備份數據龐大所帶來的問題

登記備份工作開展至今已超過十個年頭,面對登記備份日漸增大的備份數據量,備份中心碰到的問題:

2.1 擴容問題

備份數據量飛速增加,存儲不夠用時擴容雖然能達到立竿見影的效果但卻只能解決燃眉之急。建設成本與擴容經費投入的持續增加,配套系統和設備的運行維護費用和管理費用也會隨之增加,建設和管理成本與經濟和社會效益之間的平衡、當前財政信息化經費的縮減、對信息化技術人員素養的要求等都是需要面對的問題。

2.2 數據安全問題

一是數據使用安全,雖然在做備份數據的整理時會將涉密數據和非密數據分離開來,但很多檔案數據中都包含各個單位的內部文件數據,有的甚至還有涉密數據遺留混雜在其中。二是數據存儲的安全,當前很多業務系統都遷移到了云計算平臺上,云平臺有其自身的優點,但在數據安全和數據泄露上存在重大隱患。備份數據量越大、數據來源越廣泛、敏感信息越多數據安全問題所面臨的挑戰就越大。

2.3 信息技術人員缺乏問題

檔案信息化技術力量本來就薄弱,技術型人才嚴重不足,檔案備份中心工作人員中有很大一部分并非信息化專業人員,大部分備份中心都沒有專業的信息化專業技術隊伍。尤其是當前很多軟硬件平臺設備由國產化設備和平臺替代后,備份中心的建設、系統管理對人員的信息化技術素養要求更高。就算有了充足的資金和設備,沒有高素質的技術人員來建設、管理和維護,備份中心也無法可持續發展。

3 備份機制、方法和管理

尋找一個適合備份中心自身實際情況的平衡點,建立有效的登記備份機制和備份方法,可以考慮幾個方面:

3.1 備份方式

當前除了傳統的本地應用系統,很多業務系統都遷移到了云計算平臺(以下簡稱云平臺)上。本地應用的備份形式有冷備份(離線備份)、熱備份(在線備份),云平臺則是云快照、云鏡像,一些主要針對數據庫系統的備份方式如按模式分類有邏輯備份、物理備份,按邏輯分類有全備份、增量備份、差異備份。

冷備份的優點是操作非常便捷的備份方法(只需拷貝文件)、容易歸檔、容易恢復到某個時間點上、能與歸檔方法相結合、低度維護和高度安全。缺點是單獨使用時,只能提供到“某一時間點上”的恢復。在實時備份的全過程中,數據不能有變動,必須等待備份完成。占用存儲空間,只能拷貝到磁帶等其他外部存儲設備上,備份速度慢?;謴蜁r需要中斷業務先導入備份數據,因此恢復速度慢。熱備份的優點則是備份速度快、恢復速度快、可以做到全自動接近無縫切換,缺點是維護困難、成本高、不能出錯,否則后果嚴重。云鏡像是在云端創建服務器數據副本,主要用于創建容錯和冗余服務器計算基礎架構。云快照是一種基于時間點的數據拷貝技術,記錄某一特定時刻的數據信息并加以保存,其分為物理拷貝和邏輯拷貝。云平臺的優點是降低計算機成本、改進的性能、降低資源成本、優化存儲、數據可靠性(數據在云中存儲是分節點存儲存在多副本多位置)、管理的便捷性(一個終端一條網一個賬戶就可以方便地進行管理),但針對敏感檔案數據而言存在幾個威脅最大的幾個問題:數據丟失與泄露、共享技術漏洞、云平臺供應商可靠性不易評估、身份認證問題、透明度問題。云上云下如何選?可以對比以上優缺點,再結合備份中心自身的業務需求來選擇。

3.2 數據標簽

數據在備份之前需要進行篩選整理,將備份數據格式按備份標準進行統一,再對統一格式后的數據打標簽形成標簽化的登備數據,這是登記備份環節最重要也是目前登記備份工作中最具挑戰性的工作。無論是借助備份工具軟件執行自動化備份或歸檔,還是利用信息化管理系統外加人員的半自動化備份,最終都需要對數據進行管理。做好數據管理,需要對數據分配身份,有了身份后再給每個有身份的數據賦予特定的屬性(唯一編號、來源、標題、內容、數據包摘要或時間戳值、容量、格式、時間、關聯信息、外部依賴、有效期限、備份方式、分類級別、是否密級等),這就是數據標簽。其中有效期限也叫生命周期,在實際登記備份工作中這個屬性標簽大部分用默認標簽(永久或長期),那么這個標簽等于無效,起不到作用。備份數據不斷進來,備份中心照單全收,只要存儲夠用就不會去考慮數據清理,到了容量報警時再去補救,發現這個數據也不敢刪,那個數據也不敢刪,清理數據時沒人愿意簽字畫押,這樣重復和無用的數據就會越積越多。備份中心可以給出備份數據有效期限定義的標準和方法,如何定義登備數據的生命周期、制定和執行數據過期策略、重復數據刪除等,這些工作都需要依賴于登備數據標簽。有了完善詳細的登備數據標簽才能方便且高效地管理登備數據,做好登備數據生命周期管理才能有效降低備份中心的數據存儲及數據管理壓力。

3.3 備份計劃和策略制定

執行備份操作前需要先制定備份計劃,例如使用頻率極低的數字化成果以及敏感檔案數據的備份可以選擇在本地先歸檔再進行備份,因其存儲和管理更安全。對業務連續性要求高、數據變化量大的核心業務系統做好熱備份(至少是雙機熱備),再云平臺上的系統則可以利用云平臺做好快照和鏡像,碰到事故發生時可以在更短時間內恢復業務,縮短業務的中斷時間。除此外還需做好數據的容災備份,雖然部分檔案數據使用頻率不高,有的甚至保存幾年也不會用到,但其數據的檔案屬性仍然存在,這些數據可以考慮先對其進行歸檔再對歸檔數據進行脫機離線備份(磁帶或光盤)來作為防災級別的備份和長期保存。

備份策略制定可以參考已有的備份管理制度執行。一般備份策略中先確定備份模式再確定備份周期和備份執行時間,還需要依賴專業的備份軟件和信息系統來管理備份計劃、備份任務、備份執行情況、備份數據的生命周期、定期巡檢、脫機載體、脫機備份頻次、載體檢測或抽檢等。備份模式可以分為完全備份、增量備份、差異備份,這幾種模式各自的特點:完全備份最慢但恢復最快、重復文件最多需要的空間也最多。增量備份最快但恢復最慢、備份使用空間最少。差異備份速度和備份容量介于完全和增量備份之間,但有也會產生大量重復文件。

登記備份的備份周期大多為周、月、季度、半年、一年,主要結合備份中心自身的情況、備份要求、經濟、技術和人力等情況綜合考慮。一般全備份周期在半年或一年一次的頻率,增量備份則時間相對較短,可以選擇周或月度,差異備份則介于增量備和全備之間。完全備份操作簡單、恢復也方便快捷、簡單,缺點是浪費空間。

備份不一定都要采取高等級備份方式,在選擇備份方式時需要明確重心進行取舍和區別,要根據各備份中心實際情況制定計劃。

3.4 備份工具和歸檔軟件

更具數據的應用場景來選擇合適的軟件工具進行備份,例如對業務連續性要求高、數據變動頻繁的業務系統中的數據庫、臨時表單附件等可以采用數據備份工具;對于變動頻率低的非結構化數據文件,以小文件為主而文件數量龐大的檔案數據文件,如果直接使用備份軟件進行備份實際應用中效率和管理上效果都不理想,可以使用歸檔軟件進行歸檔(形成歸檔包、iso格式等)后再進行備份。文件歸檔工具選擇范圍比較廣,考慮維護和兼容性為主,可以選擇支持標準格式和協議的歸檔軟件。備份工具對備份效率、可靠性、恢復速度要求比較高,但備份軟件都廠商有自己的文件格式兼容性低一般不對外開放,比如AnyBackup(愛數,國產化備份系統,支持國產化系統平臺)、VERITASNETBACKUP(簡稱NBU,跨平臺、功能強大,但價格昂貴、維護成本高、非國產,不支持國產化系統)、CommVault(康孚,目前只支持Windows平臺,漏洞多容易受到攻擊,功能有限,非國產,不支持國產化系統)等等。利用備份工具可以對備份數據進行系統化管理,備份的自動化運行,方便備份策略的定制等便利。通過備份工具備份的數據與備份工具的依賴性很強,例如脫離備份系統后數據能否正?;謴鸵约盎謴托枰拇鷥r,備份系統本身的備份及安全問題,系統迭代升級后對老版本系統和數據的兼容支持情況及還原能力等。避免出現時間過去十幾年后當初的備份數據無法還原或無法提取的狀況。

3.5 脫機存儲載體

對數據進行定期脫機備份時需要考慮脫機備份載體的選擇,目前長期存放冷數據主要使用LTO磁帶、光盤存儲(檔案級藍光光盤)也逐步開始使用。對脫機載體需要按其載體特點和溫濕度要求存放專門的載體存放庫中,并定期對載體進行狀態檢查,例如LTO磁帶一般需要2年至少檢查一次。需要根據載體讀取設備的更新換代對載體進行更新或重新備份,以防止使用備份數據時無可用的讀取設備而無法取出數據,例如LTO類型磁帶一般只向下兼容兩代,兩代中最近的一代為讀寫兼容,之后為只讀兼容,速度仍然按照各個類型的速度,例如LTO8可以讀寫LTO7速度為300M/S,可以只讀LTO6的磁帶速度為160M/S,但已經無法讀取LTO5及之前的磁帶。目前LTO9的單盤非壓縮容量為18TB,磁帶讀寫速度為400MB/s。光盤存儲的讀寫效率目前未能超越磁帶讀寫,單盤存儲容量較低(目前主流是100到300GB之間),但光盤對載體的保存環境要求比磁帶寬松,目前國產化產品也有可選余地。

除了備份工具外還需建議使用備份管理系統輔助備份工作的管理,例如一些審批和交接單據管理、備份數據屬性管理、載體存放信息管理、定期檢查或抽檢情況、數據調取及利用管理等。

4 登備數據的可用性驗證

數據備份進了存儲、卷了磁帶、存放到異地、進入了管理系統,但數據備份工作還沒有全部完成。數據備份的最后一項工作就是數據的可用性驗證。數據的可用性可以從數據的一致性、準確性、完整性、時效性及實體同一性五個方面進行驗證。登備數據的可用性驗證可以通過:定期檢測載體、定期檢測數據包可用性、抽樣選取備份數據開展備份數據的定期恢復演練三種主要方式來保障數據的可用性。載體檢測和數據包檢測是通過技術手段,可以利用工具軟件達到目的?;謴脱菥毷菍崙鸱绞降尿炞C,可靠性和信任度更高。

猜你喜歡
磁帶備份載體
“備份”25年:鄧清明圓夢
創新舉措強載體 為僑服務加速跑
堅持以活動為載體有效拓展港澳臺海外統戰工作
創建vSphere 備份任務
老磁帶真的值錢嗎
舊瓶裝新酒天宮二號從備份變實驗室
創意磁帶
TiO_2包覆Al_2O_3載體的制備及表征
出版原圖數據庫遷移與備份恢復
創新德育教育載體
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合