?

基于NAS架構的數據容災備份系統的設計與實現

2018-05-15 02:19葉虹余
軟件工程 2018年3期
關鍵詞:數據恢復

摘 要:石油行業地質資料數據具有數據量大、增長快和數據種類復雜等特點,如何備份這些海量的數據成了一大難題。以中國南海東部海域石油勘探數據為例,結合石油行業數據特點,設計了“兩地三中心”的數據備份系統架構,建成了三級數據備份系統。該系統以NAS存儲數據快照技術為基礎,各級備份系統采用不同的備份策略,對應不同的風險級別,通過對各級備份數據進行恢復驗證,各級備份數據都是完整有效的,取得了預期的效果,達到了系統建設的目的。

關鍵詞:NAS;數據備份系統;異地容災;數據恢復

中圖分類號:TP309.3 文獻標識碼:A

Abstract:The geological data of petroleum industry has the characteristics of large data volume,fast growth and complex data types.How to backup these huge data is a difficult problem.Taking the data of oil exploration in the eastern South China Sea as an example,combining with the characteristics of the oil industry data,the paper designs the Three Centers for Two Places data backup system architecture,and constructs the three-level backup system.The system is based on NAS storage data snapshot technology,and different backup strategies at all levels are adopted,corresponding to different levels of risk.Through the study of recovery verification,all levels of the backup data are complete and effective,and the expected results and the purpose of system construction are achieved.

Keywords:NAS;data backup system;remote disaster recovery;data recovery

1 引言 (Introduction)

隨著中國南海東部海域石油勘探逐漸進入深水領域,勘探所涉及的海域面積越來越大,由此產生的石油勘探開發數據量也越來越大,這些數據是進行石油勘探開發的基礎,也是企業最重要的財富。因此,為了保障勘探開發科研數據的安全,降低因人為誤操作導致數據丟失的風險,防范因各種自然災害而造成硬件設備損毀導致的數據丟失,建設一套有效的數據容災備份系統顯得尤為重要。

傳統的數據備份多以磁帶庫為介質,這種備份模式具有介質不易管理、存儲容量有限和數據查找恢復不便等缺點,已不能滿足新形勢下的企業級數據備份需求。文中設計的數據容災備份系統以NAS存儲為基礎,建立了多級備份系統,可滿足從過去幾小時到幾年內的數據恢復需要,并在異地建立了數據災備中心,為企業的重要數據建立了多重安全保障[1]。

2 現狀分析(Analysis of the situation)

南海東部海域經歷30余年的勘探開發,已實現連續20年油氣產量超千萬方,經過多年的積累,形成了海量的勘探開發數據資料庫,目前共有數據大約170TB,數據類型及數據量如表1所示。

從上表來看,勘探開發數據主要是GeoFrame應用數據,該類數據是GeoFrame軟件應用平臺下的綜合地質資料數據,采取結構化的存儲形式,結合Oracle數據庫,利用GeoFrame軟件平臺進行地質資料綜合解釋,其次是Eclipse油藏數據,該類數據用來進行油田數值模擬,采取非結構化的存儲形式。

由于數據量大,數據種類多,數據增長快,數據讀取頻率高,目前所有數據的存儲使用模式已由過去的單一機器存儲,變成了分布式的網絡存儲,其存儲形式為NAS存儲(網絡附屬存儲),利用磁盤陣列和專業的軟件來管理數據[2,3]。以此為基礎再結合應用服務器、數據庫服務器、應用客戶端和千兆光纖網絡,形成了分布式的應用系統架構[4],其系統架構圖如圖1所示。由于所有數據都是存儲于NAS設備上,應用人員只需要一臺瘦客戶機(PC)即可使用各種專業軟件,調用所有數據。

3 系統建設(System construction)

3.1 設計要求

根據目前的系統架構和數據容量,以及每天的數據增量,綜合考慮建設成本和網絡帶寬限制,結合系統故障風險承受能力和需求分析,提出了“兩地三中心”的系統架構設計方案,即在深圳建設兩套數據備份系統:近線備份系統和同城備份系統,在北京建設異地數據容災備份中心,其數據流圖如圖2所示。

按照“兩地三中心”的系統架構設計方案,需要在深圳和北京建設三套備份系統,其中近線備份系統是對生產應用系統的在線備份系統,部署在與生產應用系統的同一地點,同城備份系統為近線備份系統的半同步備份系統,部署在與近線備份系統同一城市的不同地點,異地容災中心為同城備份系統的異步備份。三級備份系統分別對應不同的風險等級[5],其中近線備份系統對應一級風險,主要包括人為誤操作和軟硬件及系統故障導致的短期內數據丟失,需要利用近線備份系統恢復數據;同城備份系統對應二級風險,主要是水災、火災等災難導致主機房硬件設備損毀導致的數據丟失,需要利用同城備份系統恢復數據,以及需要找回過去更長周期內的數據;異地容災中心對應三級風險,主要是地震、恐怖襲擊等不可抗力因素導致所在城市毀滅,繼而導致當地所有硬件設備損毀和數據丟失,需要利用異地容災中心恢復數據。三級備份系統分別采取不同的備份策略進行數據備份:近線備份系統的備份策略是數據保留周期短密度高,同城備份系統的備份策略是數據保留周期長密度適中,異地容災中心的備份策略是數據保留周期短密度低[6]。

3.2 技術方案

根據設計要求,備份數據流傳輸路徑依次為生產應用系統至近線備份系統,近線備份系統至同城備份系統,同城備份系統至異地容災中心。目前生產應用系統數據采用NetApp存儲設備,通過進行調研和需求分析,并結合前期的各項測試結果,最終決定近線備份系統也采用NetApp存儲設備,同城備份系統和異地容災中心采用DELL Compellent存儲設備,生產應用系統至近線備份系統之間數據傳輸利用NetApp Data ONTAP的SnapMirror模塊實現,近線備份系統至同城備份系統的數據傳輸利用Nexenta NexentaStor的Auto-Tier模塊實現,同城備份系統至異地容災中心的數據傳輸利用DELL ENTERPRISE MANAGER的Replication實現,其架構圖如圖3所示。

3.3 方案實施

近線備份系統采用NetApp存儲設備,主要硬件配置為NetApp FAS8020 控制器,以及配套的NetApp DS4243磁盤柜,磁盤柜配置4T/7200RPM的sata硬盤,軟件許可配置為SnapMirror、SMO、OSSVhe和FlexClone等模塊。

由于近線系統采用NetApp存儲設備,與生產系統存儲設備屬于同構設備,因此數據傳輸可利用SnapMirror實現。SnapMirror是NetApp ONTAP的一項集成功能,可在各存儲端之間提供一種高效的數據復制解決方案,通過配置SnapMirror參數,可滿足從幾分鐘到幾小時不等的數據恢復點目標要求,從而滿足了近線備份系統周期短密度高的數據備份需求。

同城備份系統采用DELL存儲設備,主要硬件配置為Dell Compellent SC8000控制器,Dell Compellent SC200磁盤柜和3T/7200RPM的sata硬盤,由于近線備份設備與同城備份屬于異構設備,因此還配置一臺Dell Powerdge R720控制器,用于安裝Nexenta公司的NexentaStor軟件產品,該軟件能夠解決不同廠商的設備兼容和數據傳輸問題,其中的Auto-Tier模塊實現了數據從近線備份系統至同城備份系統的傳輸,并能對數據進行重復刪除和壓縮,Auto-Snap模塊能對文件系統做快照備份,從而滿足了同城備份系統數據保存周期長的需求。

異地容災中心也采用DELL存儲設備,硬件配置與同城備份系統一樣,作為同城備份系統的異地備份,通過iSCSI協議利用DELL ENTERPRISE MANAGER的Replication模塊從廣域網進行數據傳輸[7]。

4 關鍵技術(The key technology)

4.1 磁盤陣列

RAID是英文Redundant Array of Independent Disks的縮寫,中文簡稱為獨立冗余磁盤陣列,簡單來說,RAID就是一種把多塊獨立的硬盤按不同的方式組合起來形成一個大的存儲資源池,從而提供比單個硬盤容量更大、可靠性更高的數據存儲技術。硬盤的不同組合方式,對應RAID不同的級別,提供了不同的數據讀寫速度和可靠性。

在此次數據備份系統建設中,各級備份系統都采用了RAID技術,通過RAID技術,有效保障了各級備份系統的數據安全。近線備份系統采用RAID 5,即將所有硬盤形成一個大的存儲池,將所有數據和奇偶校驗信息條塊化的存儲在所有硬盤上,并通過設置Hot-Spare(熱備份)盤來提高數據的安全性,即使RAID有硬盤出現故障,也能保證存儲數據的安全。同城備份系統和異地容災中心由于采用了ZFS文件系統,因此使用了RAIDZ解決方案,RAIDZ可以利用ZFS文件數據的校驗和其他機制進行錯誤檢測和更正,可以對所有數據進行校驗,并可在有正確副本時對錯誤數據進行恢復。

4.2 存儲快照技術

存儲網絡行業協會SNIA(StorageNetworking Industry Association)對快照(Snapshot)的定義是:關于指定數據集合的一個完全可用拷貝,該拷貝包括相應數據在某個時間點(拷貝開始的時間點)的映像??煺湛梢允瞧渌硎镜臄祿囊粋€副本,也可以是數據的一個復制品??煺盏淖饔弥饕悄軌蜻M行在線數據備份與恢復,當存儲設備發生應用故障或者文件損壞時可以進行快速的數據恢復,將數據恢復至某個可用的時間點的狀態。

同樣,在此次數據備份系統中都采用了存儲快照技術,通過對備份系統中的數據卷按時間點做快照,即可形成該時間點的數據保護點(CDP),若該時間點以后出現數據丟失,則可利用快照恢復至該時間點,從而找回丟失的數據??煺盏念l率和保存時間長短決定了對數據的保護程度,在此次備份系統建設中,根據需要制定了不同的快照策略,即對近線備份系統采取密度高保存周期短的策略,滿足近線備份系統短期的數據保護需求,而對同城備份系統和異地容災中心,則采取密度低保存周期長的策略,滿足數據保存時間長的要求。

4.3 數據卷克隆

數據卷克隆主要是針對數據恢復的,一般來說,數據快照是只讀不可寫的,因此要真正使用快照恢復的數據,需要進行數據卷克隆,即利用快照克隆出一份與相應數據集一樣的可讀可寫的數據卷,從而達到數據恢復并可用的目的。

5 數據恢復與驗證(Data recovery and validation)

數據容災備份系統建成后,還需要配備相應的備用服務器,搭建應用軟件環境,以便對備份數據定期進行數據恢復驗證,確保備份數據是有效和可靠的。此次數據容災備份系統包括三級備份系統,系統架構復雜,實施難度大,在系統建成后,制訂了詳細的備份系統日常管理辦法和應急恢復預案及數據恢復操作手冊,形成了完整的制度規范。

按照制度要求,除了日常對各級備份系統進行日常維護、故障預警、日志記錄和運行評估外,還需定期進行數據恢復驗證,其中對近線備份系統每月進行一次數據恢復驗證,同城備份系統每季度進行一次數據恢復驗證,異地容災中心每年進行一次容災恢復演練,通過模擬生產應用系統出現數據丟失或系統崩潰,從備份系統恢復丟失的數據或進行系統切換,并對恢復過程和結果進行記錄。

6 結論(Conclusion)

此次容災備份系統的建設,從前期的需求分析、調研測試、方案設計,到方案的實施、軟硬件的安裝部署,前后歷經半年時間,目前系統運行狀態良好,所有數據都能按照設計的鏈路進行傳輸,數據壓縮和重復刪除功能也都得到了實現,各級備份系統的數據經過驗證都是有效的,均符合前期設計要求。該系統建成后,為企業的重要數據建立了多重保障,已多次利用備份系統找回因誤操作和系統故障而丟失的數據,受到了廣大應用人員的好評,極大的提高了南海東部海域勘探開發數據的安全性。

在數據容災備份系統的建設及日常維護過程中,筆者有幾點經驗體會:一是前期要做好調研,結合自身的應用需求和現狀,制訂一個符合自身需求的建設方案;二是系統建設要通盤考慮,要結合軟件、硬件、存儲、網絡、機房等因素,確保方案從技術層面是可行的;三是備份系統數據一定要進行恢復驗證,要定期進行數據恢復演練,檢驗備份數據的可用性;四是系統建設和日常維護要進行記錄,要制訂相應的管理規定和操作手冊,形成系統的技術文檔和總結報告,并歸檔保存。

參考文獻(References)

[1] YU J,REN K,WANG C,et al.Enabling Cloud Storage Auditing with Key-Exposure Resistance[J].IEEE Transactions on Information Forensics and curity,2015,10(6):1167-1180.

[2] YU Y,LI Y N.Public Integrity Auditing for Dynamic Data Sharing with Multiuser Modification[J].IEEE Transactions on Information Forensics & Security,2015(10):1717-1726.

[3] YU Rongwei,WANG Lina,WANG Dejun,et al.Study on Security Enhancement Technology for Disaster Tolerant[J].Wuhan University Journal of Natural Sciences,2009,14(1):019-023.

[4]鄭如秋,梁庭瑋.一種分布式并行文件系統的介紹及在海洋地震數據處理中的應用[J].電腦與信息技術,2015,23(4):44-46.

[5] 汪生珠,何慶兵,歐陽欣.集群NAS存儲技術在石油勘探高性能計算中的應用[J].中國科技信息,2016(6):29-31.

[6]陳勝華,伍德雁.異地數據容災備份與恢復的應用研究[J].科技訊,2012(13):45.

[7]王春才,閆磊,李英韜.基于iSCSI的網絡數據存儲技術研究[J].吉林師范大學學報(自然科學版),2014(4):98-100.

作者簡介:

葉虹余(1984-),男,本科,工程師/信息系統項目管理師.研究領域:信息系統開發、運維及管理.

猜你喜歡
數據恢復
常見硬盤數據丟失的分析與恢復
淺議數據安全與恢復
基于Android—x86的windows恢復系統研究與設計
Windows操作平臺下的數據恢復技術
Redis基于RDB+AOF的數據恢復策略研究
淺析數據恢復技術
數據備份技術
Windows下數據恢復的一點認識
服務器數據備份和恢復研究
淺談計算機數據恢復
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合