?

大數據系統數據安全保護研究

2023-05-30 01:22高亞楠
電子技術與軟件工程 2023年6期
關鍵詞:數據系統安全措施數據安全

高亞楠

(國家信息中心 北京市 100045)

隨著互聯網技術的發展和普及,數據可視化和智能分析技術的發展使得大數據系統可以更好地呈現和分析數據。大數據系統的出現也給人們的生活和工作帶來了很多便利,大數據系統可以通過收集和分析家庭成員的行為和偏好,為家庭提供智能化的家居服務,如自動調節溫度、智能照明等。大數據系統可以通過收集和分析交通數據,為用戶提供實時的交通狀況和最佳路線,減少交通擁堵和出行時間。

但同時也帶來了很多安全隱患,大數據平臺可能會遭受 DDoS 攻擊、 SQL 注入攻擊、XSS 攻擊、CSRF 攻擊、木馬攻擊、社會工程學攻擊等。大數據系統數據也面臨了許多安全威脅,如數據泄露、數據篡改、數據丟失、數據濫用、數據攻擊、數據隱私攻擊、勒索病毒等[1]。

大數據系統數據的安全保護成為了一個重要的問題。本文從大數據系統數據安全保護的需求出發,探討了大數據系統數據安全保護模型的研究現狀和發展趨勢。

1 大數據系統數據安全保護的背景和意義

1.1 大數據的背景

大數據系統數據是指通過大數據系統承載,數據量巨大、類型繁多、處理速度快的數據集合。大數據系統的出現主要是由于互聯網技術的發展和普及,人們在使用互聯網的過程中產生了大量的數據。這些數據包括文本、圖片、音頻、視頻等各種類型,數據量巨大,處理速度快,對數據存儲、處理和分析能力提出了很高的要求。

大數據系統數據具有以下特點:

(1)大量性:大數據系統通常處理的數據量非常大,超出了傳統數據處理工具的處理能力。

(2)多樣性:大數據系統數據來源多樣,包括結構化數據、半結構化數據和非結構化數據等多種類型。

(3)高速性:大數據系統數據的產生速度非???,需要實時或近實時處理。

(4)高維度:大數據系統數據通常包含多個維度的信息,需要進行多維度分析。

(5)不確定性:大數據系統處理前數據存在著不確定性和噪聲,需要進行數據清洗和處理。

(6)價值密度低:大數據系統數據中有很多無用信息,需要進行篩選和提取。

1.2 大數據系統數據安全保護的意義

大數據系統數據安全保護是指對大數據系統中數據進行保護,防止數據泄露、篡改、丟失等安全問題。其安全保護具有以下意義:

(1)保護個人隱私:大數據系統數據中包含大量的個人信息,如姓名、地址、電話號碼、電子郵件地址等,如果這些信息被泄露或濫用,將會對個人隱私造成嚴重的威脅。

(2)防止數據泄露:大數據系統數據中包含的信息量非常龐大,如果這些信息被泄露,將會對企業和個人造成巨大的損失,因此需要采取措施來防止數據泄露。

(3)防止數據篡改:大數據系統數據中的信息可能會被黑客篡改,導致企業和個人的利益受到損害,因此需要采取措施來防止數據篡改。

(4)提高數據安全性:大數據系統數據安全保護可以提高數據的安全性,保護企業和個人的利益,同時也可以提高數據的可靠性和準確性。

(5)保護商業機密。大數據系統數據中包含了很多商業機密信息,如企業的財務數據、客戶信息等,如果這些信息泄露,將會給企業帶來很大的損失。

2 大數據系統數據安全保護的挑戰和難點

大數據系統數據安全保護面臨的挑戰和難點包括:

(1)數據隱私保護:大數據系統數據中包含大量的個人敏感信息,如姓名、地址、電話號碼、信用卡號碼等,如何保護這些信息的隱私性是大數據安全保護的重要挑戰。

(2)數據完整性保護:大數據系統數據中的數據量龐大,數據來源復雜,如何保證數據的完整性和準確性是大數據安全保護的難點[2]。

(3)數據安全性保護:大數據系統數據中的數據存儲在分布式系統中,如何保證數據的安全性,防止數據被惡意攻擊、篡改或泄露是大數據安全保護的重要挑戰,其中保持數據的一致性也具有一定挑戰性。

(4)數據訪問控制:大數據系統數據中的數據訪問量大,如何控制數據的訪問權限,防止未經授權的人員訪問數據是大數據系統數據安全保護的難點。

(5)數據治理和合規性:大數據系統數據中的數據來源復雜,如何進行數據治理和合規性管理,保證數據的合法性和規范性是大數據系統數據安全保護的難點。

3 大數據系統數據安全保護模型

大數據系統數據安全保護的模型劃分為層面維度、生命周期階段維度和安全措施維度的三個維度。具體的大數據系統數據安全保護模型如圖1所示。

圖1:大數據系統數據安全保護模型

層面維度包括基礎設施層面、數據平臺層面和計算分析層面,通過劃分為不同的層面,將安全管理責任和安全管控措施進行層層防護,以便將核心數據資產保護在最中心的位置。

生命周期階段維度包括數據收集、匯集、處理、存儲、傳輸、分析、導出、導入、銷毀等,以便于將數據安全防護工作落實到數據的全生命周期階段及業務處理流程中去。

安全措施維度主要包括身份鑒別、訪問控制、惡意代碼防范、惡意攻擊防范、安全審計、數據清洗、數據脫敏、數據加密、數據完整性保護等。

通過這三個維度,可以開展大數據系統數據安全的立體防護,并通過分析不同層面存在的安全風險,以研究對應的數據生命周期要求和安全措施。以便有效應對風險,并將安全工作落實到各個環節、各個維度和各個層面,全面提升大數據系統安全保障能力。

4 基礎設施層面安全保護要點

大數據系統的基礎設施層開展安全防護時,主要采用的思想是一個中心,三重防護思想,其中一個中心是指安全管理中心,三重防護是指的安全區域邊界。安全計算環境和安全通信網絡,并通過搭建在安全物理環境之上來實現基礎設施層的安全保障。

基礎設施層所采取的安全措施與另外兩個層面有所分離,源于其保障的重點是在于基礎的環境和軟硬件設備,而不針對具體數據。但其依舊與數據全生命周期緊密相關,例如數據銷毀的時候往往需要進行物理介質的銷毀?;蛘呶锢斫橘|的處理,以確保數據的不可恢復性。僅安全措施部分,與其他兩個層面的交叉內容較少。

4.1 安全風險

基礎設施層面面臨的安全風險類別包括機房環境、網絡設備、安全設備和服務器設備、軟件系統、管理系統、安全配置和安全管理。

在機房環境方面,有可能因為地震、暴雨等自然災害導致機房發生事故,或者由于盜竊、社會工程學攻擊等導致機房被非授權訪問。以及因為發生火災導致出現軟硬件設備組件損毀。此外,還可能因為地下水的滲透、雨水的內滲、雷擊以及電磁泄漏導致的數據泄露等安全事件的發生。

在網絡設備、安全設備、服務器設備方面,可能由于訪問控制策略配置的不當,導致惡意人員訪問相關設備、更改安全配置和策略,導致系統被攻擊后網絡失陷或者留存后門?;蛘哂捎谠O備故障,導致網絡中斷或癱瘓,影響大數據業務開展。此外,還可能因為角色權限以及賬戶分配不合理,導致部分人員權限過大?;蚬觅~號,導致惡意操作無法追溯以及惡意內部人員謀取利益等。

在軟件系統、管理系統方面,可能由于“輸入過濾功能”覆蓋模塊不全導致發生SQL 注入和跨站腳本攻擊事件,出現權限旁落和數據泄露的后果。還可能因為代碼審計未開展或不全面,導致軟件存在后門或漏洞,使系統易遭受網絡攻擊或惡意訪問。此外,還包括端口及服務過度開放,以及接口管理缺失,發生惡意攻擊的行為。

在安全配置和安全管理方面,可能由于管理不到位或存在漏洞,導致投機取巧或內部惡意人員謀取利益等。

4.2 防護措施

基礎設施層面的安全措施主要包括,訪問控制、身份鑒別、統一安全管理、安全監測、安全設備、惡意代碼防范、入侵防范。加密協議、加密算法、介質銷毀等。

相關安全措施,通過相應的安全軟硬件設備及組件等提供安全防護,或者通過多個設備組件進行聯動防護。相關安全措施之間具有相互彌補性、相互補充性及安全疊加效果。

4.3 生命周期防護

基礎設施層面涉及到的數據生命周期階段主要包括收集、存儲、傳輸、導入、導出和銷毀等。其中在收集和導入導出階段,主要涉及的是數據的接口和導入導出軟硬件。有的系統是直接通過專線方式或者光纖接入方式進行數據的導入、導出和收集,而有的系統則用專用的收集設備進行收集,這些都需要注意基礎設施層面的安全保護。此外,在存輸、存儲方面,包括數據庫中數據存儲的加密性、傳輸的加密性及完整性等,需要相關的操作系統、數據庫等采用加密協議開展傳輸,并采用加密算法開展加密。在數據銷毀方面,則需要針對數據在硬件磁盤中進行清零以及硬件介質的不可恢復銷毀,如使用化學用劑或碾碎方式進行物理銷毀[3]。

5 數據平臺層面安全保護要點

5.1 安全風險

數據平臺層面面臨的安全風險類別主要數據泄露、數據篡改、數據脫敏可逆、數據聚集風險等。

在數據泄露方面,可能由于數據平臺代碼層面存在SQL 注入風險等,導致數據庫中數據被竊取?;蛘哂捎趹贸绦蛑写嬖诳缮蟼髂_本的漏洞,導致權限喪失。此外,還可能由于數據的管控不到位,導致數據被非授權訪問從而泄露,以及通過勒索病毒方式進行數據的竊取。

在數據的篡改方面,可能由于數據傳輸采用明文傳輸,或數據交換協議不安全等原因,導致數據被篡改后相關大數據組件和系統無法發現相關事件。

在數據的脫敏可逆方面,可能由于脫敏算法和脫敏方式的選擇存在邏輯或安全漏洞,導致已脫敏數據發生可逆的情況,從而導致數據安全事件發生。

在數據聚集安全風險方面,可能由于數據的聚合和匯集等,將許多敏感信息和敏感內容從普通數據中提取而出或分析而出,形成敏感畫像或信息,造成個人或組織的經濟或權益損失。

5.2 防護措施

數據平臺層面,安全措施主要包括安全標記、數據標簽、數據脫敏、數據標識、數據分類分級、源代碼分析、滲透測試、數據溯源、訪問控制、身份鑒別等。

該層面的安全措施,根據所處理和分析計算的方式不同,而有較多的變化和組合性。部分安全措施集成在了相關的數據處理、分析及計算的組件之中,或者集成在了數據安全管理系統中,如血源系統和溯源系統等。

甚至有些采用了新技術應用開展安全防護,例如采用零信任技術作為信任安全管理措施,以及采用區塊鏈技術作為數字交易管理措施等。

5.3 生命周期防護

數據平臺層面涉及到的數據生命周期階段主要包括數據導入、導出、處理、存儲、傳輸和分析等。在數據導入導出階段,主要是進行數據的導入,導出安全管控,防止數據出現非授權訪問和處理的情況。在數據處理階段,主要是包括數據清洗的有效性、安全性及保真性。數據存儲階段和傳輸階段,主要是針對密鑰管理,以及采用加密算法進行數據加密及解密的調用。在數據分析階段,主要包括數據建模安全性、數據模型安全性、數據分析安全性等。該層面數據生命周期保護的重點是基于數據的分類分級,開展數據全生命周期的相關保護工作。

6 計算分析層面安全保護要點

6.1 安全風險

數據分析層面面臨的風險主要包括:

(1)數據質量問題:數據質量不佳可能導致分析結果不準確,從而影響決策。

(2)數據泄露:在數據分析過程中,可能會泄露敏感信息,如個人身份信息、商業機密等。

(3)數據誤解:數據分析結果可能被誤解或被用于不當用途,從而導致錯誤的決策。

(4)數據安全問題:在數據分析過程中,可能會遭受黑客攻擊或數據泄露,從而導致數據安全問題。

(5)數據偏差:數據分析結果可能受到數據偏差的影響,如樣本選擇偏差、測量誤差等。

(6)模型不準確:數據分析模型可能不準確,從而導致錯誤的預測或決策。

(7)人為因素:數據分析過程中可能存在人為因素,如數據篡改、分析人員的主觀判斷等,從而影響分析結果的準確性。

6.2 防護措施

計算分析層面的安全措施包括數據加密、數據標簽、數據標識。密碼協議、密碼算法、數據認證和數據溯源等。由于計算分析層面需要依據數據平臺層面開展相關工作,因此,與兩個層面之間存在著界限模糊的情況,而安全措施也有著一定的重疊,有些安全措施,同時作用于數據平臺層面和計算分析層面,例如某大數據平臺提供數據服務時,平臺中的數據不可直接導出。大數據應用僅能使用計算池中的模型算法,進行數據模型的個性化搭建,然后導出分析結果。此時其中的安全措施就存在著數據平臺層面和計算風險分析層面的大量重合,部分措施如加密等還存在著一定的傳遞性,密鑰管理系統也較為復雜。

6.3 生命周期防護

計算分析層面涉及到的數據生命周期階段,包括分析、處理、計算、傳輸、存儲、共享交換等。在數據處理方面,需實現數據處理代碼的安全性防護。由于數據處理多采用人工智能等新技術方式實現,所以需要加強人工智能和機器學習安全性防護的力度,以及提升數據的有效性和數據處理結果的可靠性。在數據計算方面,大部分大數據系統采用了分布式及高性能計算方式,其分布式等特點,導致了相關系統中存在著特定的安全風險,則需對相關風險進行針對性的安全防護。在數據傳輸和存儲方面,則需進行數據加解密的算法調用以及設計。在數據共享交換方面,需要注意數據共享時相關方的安全管理,以及數據責任的邊界劃分,數據交換時安全性的傳遞等。

7 安全保護模型的使用

采用大數據系統數據安全保護模型開展保護工作時,需遵循的步驟如下:

(1)開展大數據系統數據安全規劃設計,對大數據系統安全防護進行頂層設計,從安全物理環境、安全通信網絡、安全區域邊界、安全計算環境、安全管理中心和管理安全等方面進行安全設計,設計規劃方案需經過專家評審后實施。

(2)開展大數據系統數據安全建設工作,在大數據系統建設的同時開展數據安全建設工作,采用三同步的方式開展安全工作,包括同步規劃、同步建設、同步運維,將安全落實到大數據工程建設的不同階段。

(3)對基礎設施層面、數據平臺層面和計算分析層面的資產進行梳理,確定各層面包括的硬件設備、軟件程序、系統程序、基礎環境、組件、接口、配件等。

(4)分析各層面的業務和數據面臨的安全風險性。識別業務面臨的安全威脅,識別上述資產中存在的脆弱性,識別上述資產和系統已有的安全保護措施,根據以上識別內容進行風險的分析和計算,明確大數據系統數據安全風險[4]。

(5)部署安全措施。通過分析各層面可部署的安全措施,開展安全防護,將防護措施與生命周期階段緊密結合。

(6)開展大數據系統數據全生命周期安全防護,將安全措施落實到生命周期的各個階段中去。

猜你喜歡
數據系統安全措施數據安全
化工企業易燃液體處理的安全措施
承壓類特種設備安全措施的優化
超高墩柱翻模施工工藝及其安全措施分析
云計算中基于用戶隱私的數據安全保護方法
基于Spark的高速收費站大數據系統的設計與實現
基于計算機軟件開發技術的物聯網數據系統
建立激勵相容機制保護數據安全
玩輪滑
非均勻采樣數據系統的新型模型描述方法
大數據云計算環境下的數據安全
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合