?

可信計算下的大數據安全

2017-06-05 13:47胡如會曾造賀道德

電腦知識與技術 2017年10期

關鍵詞：存儲認證大數據

胡如會　曾造　賀道德

摘要：針對信息時代中大數據在管理及使用方面的安全問題，提出在可信計算下，通過加密數據、度量平臺完整性、檢測用戶身份認證等方式，實現網絡主動防御，確保大數據在存儲、傳輸、認證整個信息處理過程中可控、可信、可管，使大數據更加安全有效。

關鍵詞：可信計算；大數據；存儲；傳輸；認證

中圖分類號：TP309.2

文獻標識碼：A

文章編號：1009-3044（2017）10-0016-03

1.引言

21世紀的今天，是一個全新的互聯網大數據時代，數據以每年50%的比率遞增，每兩年翻一番。在數據公開的信息社會中，不管你是否愿意，任何人、任何公司或機構都可以了解你。美國政府將大數據比喻為“未來的新石油”，一個國家對大數據的占有和控制將成為海、陸、空之外的另一種國家核心資產，是綜合國力的重要組成部分。在國內，政府各個部門都擁有很多原始數據，如金融數據、信用數據、交通數據、住房數據、醫療數據、教育數據等。這些數據在每個部門都是獨立的、靜態的，如果將這些獨立的數據關聯起來，對其進行分析和統一管理，其價值是無法估量的。隨著大數據的進一步集中和互聯網技術的發展，傳統的信息安全技術已成為大數據快速發展的瓶頸。大數據的安全問題會因為數據規模、數據處理、數據存儲等因素而面臨新的安全威脅與挑戰。傳統的“封堵查殺”防護機制并不能有效地保障數據在互聯網中的安全，互聯網的可信運行才是保障大數據安全的關鍵。面對大數據安全的威脅性和脆弱性，可信計算可以從根本上轉變“封堵查殺”的被動防御模式，使攻擊者進不去，進去后非授權者拿不到數據，竊取保密信息后無法破解，基本實現大數據在網絡中的主動免疫和可信管理。因此，本文通過分析可信計算與大數據的關系，針對大數據的安全問題，對可信計算下大數據的安全存儲、安全傳輸、安全認證方面作了進一步探討和論述。

2.可信計算與大數據

可信計算（Trusted Computing）指計算機系統所提供的服務是可信賴的，是一種運算和防護并存的信息安全新技術，使計算結果總是與預期一樣，全程可測可控，具有狀態度量、保密存儲和身份識別等功能，使系統和網絡安全可信?？尚庞嬎阋訲PM（Trusted Platform Module）設備作為基礎，其基本思想是在計算機系統上置入一個可信平臺模塊硬件芯片TPM，以其作為平臺的信任根，再從信任根開始到硬件、操作系統、應用層建立一條信任鏈，逐級測試、逐級驗證，將信任擴展到整個計算機平臺，確保整個信息系統的可信。大數據（Big Data），在IT行業又稱巨量數據集合，是指“無法用現有的軟件工具搜索、存儲、提取、分析、共享和處理的海量的、復雜的、多樣的數據集合?！本S基百科將大數據定義為：“無法在一定時間內使用常規數據庫管理工具對其內容進行抓取、管理和處理的數據集?！痹诰S克托·邁爾一舍恩伯格編寫的《大數據時代》中用5個“v”來概括了大數據特征：Volume（大量）、VelociIv（高速）、Variety（多樣）、Value（低價值密度）、Veracity（真實性）。大數據本質上還是數據，是互聯網發展到現階段的一種表象或特征，其已經滲透到每一個行業領域，成為重要的生產因素。隨著大數據的快速發展，未來幾年數據泄露將會泛濫，數據泄露事件的增長率也許會達到100%，除非數據在其源頭就能夠得到安全保障。以服務為中心的計算任務中，大數據的應用需要可信作為發展前提，需要可信度量作為基礎。如果沒有相應的可信機制，將無法保證大數據在存儲、傳輸、認證方面的安全。

3.可信計算下的大數據安全

3.1可信安全存儲

大數據中非結構化的數據占主流，傳統的數據處理技術不能有效地處理半結構化和非結構化的多維數據，面對復雜多樣的大數據存儲，目前的數據存儲管理模式容易造成數據失竊和篡改。大數據的安全存儲涉及3個方面的問題：（1）數據的存儲環境是否安全可靠；（2）采用何種存儲方式存儲才能確保數據不被攻擊和泄露；（3）如何保障數據存儲機制的安全?？尚庞嬎闶悄壳按髷祿踩囊环N新技術，是從使用終端開始主動防范攻擊，其有別于傳統的安全防御機制。針對大數據安全存儲的存儲環境、存儲方式和存儲保護等3個問題，利用可信計算技術設計了大數據安全存儲方案，如圖l所示。這種技術以可信平臺模塊TPM作為信任根，通過可信計算提供的安全特性來提高大數據的存儲安全。

存儲環境的安全可靠是大數據存儲的前提，內置于計算機系統中的TPM作為一個可信的信任根，通過完整性度量機制來判斷大數據存儲環境是否被攻擊和篡改。完整性度量就是對當前大數據系統平臺運行狀態的收集，其度量過程也就是信任鏈的建立過程。目前主流的度量方法有基于屬性的度量、基于二進制的度量和基于語義的度量。大數據系統平臺從信任根開始啟動，先度量系統BIOS，將度量結果通過擴展方式存儲到對應的系統平臺狀態寄存器PCR（Platform State Register）中，由此繼續往下度量操作系統啟動模塊、系統內核、系統上的應用程序，并為它們建立起一條信任鏈，每完成一次度量，都把度量值存儲到PCR中，平臺狀態一旦被度量和存儲，攻擊者就無法偽造平臺的狀態來竊取數據。如圖2，用戶訪問大數據平臺時，通過平臺完整性報告的度量值與已存儲的度量標準參考值進行比對，依靠可信平臺來鑒定存儲值的完整性，如果一致則說明存儲環境完整可信，否則表明系統啟動過程中數據發生了改變。

要確保大數據不被攻擊和泄露，加密存儲是關鍵。大數據在被上傳到服務器后，一方面服務器出現故障會導致數據泄漏，另一方面服務器被非法入侵后，數據存在被竊取和篡改的風險。如果數據擁有者在將數據上傳服務器之前就對大數據進行拆分、加密，即使大數據在傳輸或存儲過程中丟失，也會因為事先加密而不會發生信息泄露。加密算法是把明文變成密文，密文再變回明文，變不回來的不能算是加密。目前市場上基于可信計算技術常用的加密算法是RSA公鑰加密算法和ECC橢圓曲線加密算法。RSA加密算法是目前最具影響力的公鑰加密算法，RSA加密算法已被ISO推薦為公鑰數據加密標準。ECC橢圓曲線加密算法是目前已知的公鑰體制中，對每比特所提供加密強度最高的一種體制，具有大數運算、大容量存儲等特點。加密算法的安全性取決于密鑰的安全性，由于公共大數據平臺的用戶眾多，大數據服務系統需要管理大量的用戶密鑰。一旦用戶密鑰泄露，與之相關的大數據資源將會被竊取和篡改，將給用戶帶來不可估算的損失。因為可信計算平臺TPM具有防篡改功能，所以用戶密鑰存儲在其內部相對較安全，為了對眾多的用戶密鑰進行保護，可信計算組織提出采用樹形結構對其進行存儲和管理。大數據迅猛發展使數據量急劇增加，公共數據平臺的存儲安全問題更加突出，由于可信計算技術的研究與應用在國內已經比較成熟，所以使用可信計算提升系統的安全性是解決大數據存儲安全問題的有效方法之一。

3.2可信安全傳輸

大數據時代，信息交流離不開大量數據的傳輸，數據傳輸的安全性問題不可回避。數據在傳輸前，必須保證該數據來自受信任的一方，且要確保數據的機密性和確保數據免受意外或被故意修改。因此，重要數據的傳輸更需要一種強有力的安全措施來確保其不被竊取和篡改，基于可信計算的數據加密算法為大數據傳輸提供了較好的解決方法。

數據在傳輸過程中要通過口令或數字證書來進行身份驗證，以確保數據來自可信任的一方。發送者用姓名、證件號等私鑰加密一個簽名，接收者用公鑰來解密，如果成功即能確保數據可信，否則，數據不可信。假設A發送文件給B，則A和B至少需經過三個步驟：（1）A用其私鑰加密該文件；（2）A將加密文件發送給B；（3）B用A的公鑰解密A發送的文件。為確保數據信息在傳輸過程中不被泄露和篡改，在大數據平臺中引入可信認證服務，增加身份和平臺合法性的認證，這種可信認證方式能確保數據安全傳輸，從而保證了大數據在傳輸中的可信與安全。由于TPM的密鑰采用樹形結構進行管理，所以A在傳輸前，用自己的私鑰將文件從子密鑰、父密鑰到根密鑰SRK層層加密，以確保數據在傳輸過程中的機密性；當B接收到A傳來的文件后，必須先將其從根密鑰SRK到該密鑰的所有的父密鑰進行層層解密，直到該密鑰對應的數據被完全解密為止，才能看到該文件的明文。

為了確保數據在傳輸過程中免受意外或被故意修改，可以通過驗證被傳輸的數據是否完整來判斷。數據傳輸前先通過SHA-1求出其對應的哈希值，接收者收到數據后，將該數據的哈希值與傳輸數據的哈希值進行比較，判斷該數據是否被篡改。如果對比不上，說明已被破壞或篡改，則拒絕進一步接收數據。如果對比符合，說明發送端和數據可信。由于大數據在傳輸過程中的安全需求不同，不同的數據加密要求也不同，所以數據在傳輸過程中為了確保其安全、可靠，應在可信計算下，根據不同的數據安全要求提供不同的數據傳輸方案。

3.3可信安全認證

傳統的大數據認證技術主要通過用戶口令或持有的數字證書來鑒別，這樣就會存在問題：一方面，攻擊者一旦竊取到用戶口令或用戶持有的數字憑證就能輕松通過認證；另一方面，傳統認證技術中的認證方式越安全就意味著用戶負擔越重，如果采用先進的認證技術如生物認證，又需要用戶終端具有生物特征識別功能，這樣反而是增加了系統更大的開銷和不現實。傳統的大數據認證技術已不適合應用于當前的大數據管理，如果在認證技術中引入可信計算則能夠有效地解決上述兩個問題。根據可信計算技術，首先為用戶構建配有安全芯片TPM的可信終端，用來度量大數據平臺的完整性，加密重要信息和檢測惡意代碼，同時采用基于可信計算的ECC橢圓曲線加密技術，該技術在目前加密算法中具有高強度的保密性。其次，為確保數據在傳輸中的安全，除終端設備需要可信性自認證外，還需通過檢測代理和服務器的可信認證。根據可信計算技術中可信網絡連接的相關規范，可在用戶終端不同網關處設置可信檢測代理，用以檢測惡意行為。用戶終端需要訪問大數據服務平臺時，必須經可信檢測驗證判斷其是否安全可信，若通過驗證則允許用戶訪問網絡，否則拒絕請求。如圖3所示，當用戶終端向大數據平臺服務器發出需求請求后，可信檢測代理

首先檢查網絡連接以排除非法數據鏈接，然后用終端公鑰解密簽名以驗證終端用戶的合法性，當服務器認定用戶身份可信時，再用大數據平臺的私鑰解密用戶終端傳來的數據信息，然后響應用戶傳輸數據請求。

4.結束語

總之，大數據已成為各個國家和相關領域關注的重要戰略資源，將會帶動科技創新和未來生產力發展，對國家治理、政府決策、企業規劃以及人們的生活方式等都將產生一系列的影響。原有的數據處理手段已經不適應迅速增大的數據量，原有的計算環境、存儲方式、傳輸模式也在隨著數據關聯、數據分析、數據挖掘等大數據技術的發展而變化。在可信計算下，以數據訪問控制為核心，實現主動防御，確保大數據在存儲、傳輸、認證整個信息處理過程中可控、可信、可管，使大數據更加安全有效。

猜你喜歡

存儲認證大數據

中職校園網絡安全管理系統設計

考試周刊(2016年92期)2016-12-08

檔案管理中電子文件的存儲探究

科學與財富(2016年26期)2016-12-01

電腦知識與技術2017年10期

電腦知識與技術的其它文章: 淺析醫院信息系統及信息安全; 淺談關系數據庫中的關鍵詞查詢結果動態優化; Qt本地數據庫開發; 以臨床數據倉庫為核心的醫院大數據平臺構建; 上網行為管理系統在大中型企業的應用; 基于SIP的呈現服務系統的設計與實現

91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合