?

基于伯努利大數定律的云存儲數據方法研究

2018-05-15 02:19陳維華何彩虹
軟件工程 2018年3期
關鍵詞:云存儲

陳維華 何彩虹

摘 要:隨著科技水平的提高,對云存儲服務的可靠性、安全性和穩定性都有了更高的要求。面對云存儲服務,如何優化資源配置,進而提高用戶的體驗質量,本文提出了基于大數定律的云存儲方法,具體方法是用伯努利大數定律按照存儲頻率,根據歷史信息確定用戶對資源的需求,然后進行再分配,從而減少了數據訪問延遲。

關鍵詞:大數定律;云存儲;數據分配

中圖分類號:TP399 文獻標識碼:A

Abstract:with the improvement of science and technology,there are higher requirements for the reliability,security and stability of cloud storage service.In terms of cloud storage service,how to optimize the allocation of resources and to improve the quality of user experience. This paper proposes a method of cloud storage based on the Law of Large Numbers,in which the concrete way is to determine and redistribute users' demand for resources based on the frequency of storage and historical information by means of Bernoulli LLN,thereby reducing the data access delay.

Keywords:Law of Large Numbers (LLN);cloud storage;data distribution

1 引言(Introduction)

云計算的發展在現如今的信息技術中應用越來越廣泛,云存儲服務[1]也憑借著它的高擴展性、高可靠性、成本低、方便數據管理的諸多優勢受到人們的青睞,與云服務相關的產品也越來越受到用戶的喜愛。云存儲系統[2-4]是一個以數據存儲和管理為核心提供云計算能力的高性能計算系統。它可是實現對于海量數據的采集、管理和保護等功能。用戶可以通過云存儲實現不同區域,不同時間的資源共享和互動,并且通過應用權限的控制、傳輸加密、信息加密和數據隔離技術這些技術保證數據的安全性。

在享受大量數據在云存儲服務中的便利的同時,其對于數據的訪問速度也有了更高的要求。由于在云端人們不斷的把數據上傳保存上去,在海量的存儲空間中對數據信息進行存儲。隨著存儲的數據量越來越大,對于數據的訪問時間也就越來越長。云存儲系統的DBAS結構為B/S三層體系結構,分別是用戶層、應用層、數據存儲層。在數據存儲層存儲大量的數據信息和數據邏輯,所有與數據有關的安全、完整性控制、數據的一致性、并發操作都是在這層完成的。B/S結構的特點是分布性強,維護方便、開發簡單并且共享性強、總體擁有成本低等特點。但是數據安全性問題,以及數據傳輸速度慢等的缺點也顯而易見。由于系統期望用戶可以從云存儲中及時的獲得想要的數據,因此減少用戶在對數據進行訪問的時候造成訪問延遲成為數據資源分配有待解決的問題。

目前針對云存儲中的數據資源分配問題,研究者們提出了各種不同的云數據存儲方案。祁志陽[5]從經濟學原理的角度分析了云計算的經濟學模型,以用戶對資源評價的相似度為約束條件進行資源調度管理,結合經濟學的超邊際分配方法對資源進行分配的。由于在建模過程中數據是靜態的,而在物理環境下數據是動態形式,會造成數據不準備等缺點。Siva ThejaMaguluri[6]根據一個隨機的過程,如果作業到達時請求訪問資源,采用加入最短的隊列算法和MaxWeight調度選擇算法,建立了一個負載均衡,以便在資源利用的過程中提高吞吐量。Fabien Hermenier[7]提出了一種通過減少虛擬機遷移和分配到主機的云計算時間的方法,以提升資源利用率?;诖?,本文的主要工作要工作有:

(1)通過歷史訪問痕跡對用戶進行分類。由于不同類型用戶對于寬帶、延遲等的要求不同,所以需要提供的服務也不一樣。不同類型用戶有不同的需求,可以根據歷史信息計算各類型用戶需求量。

(2)應用伯努利大數定律確定各類用戶對數據的需求,根據需求分配存儲資源。

2 數據存儲(Data storage)

2.1 云存儲數據的資源配置

在云存儲數據資源配置的過程中,涉及數據的采集、數據維護、數據的存儲方式等多個要素,它們彼此之間的相互協作構成了云存儲數據的資源配置過程。然而,不同用戶對云存儲的資源進行上傳和下載的過程中,對資源的需求也不同,對需要云服務數據的配置也會有不同的要求,這樣就加大了資源配置的復雜性。從用戶的角度來說,對需求的服務造成延時,會降低用戶的使用效率,同時,對云存儲服務器也會造成負載不均衡的狀態。

因此,本文通過訪問痕跡對于每一類的數據需求進行分類,在流量約定設置的優先級里,一些特定的網絡數據流也需要定義服務質量。比如多媒體數據流要求有保障的通過量;IP電話則需要嚴格的抖動和延遲限制;在遠程外科的手術中則要求有可靠保證的可用性。除了這些特定的數據服務外,對于一般的普通用戶而言也需要要有針對性的數據服務??梢酝ㄟ^訪問痕跡對每一組數據的內容進行分析,對數據內容可以按興趣愛好、年齡、性別、工作性質等大致分成幾類。對于這些訪問的數據用伯努利大數定律計算出每一類的需求量,從而確定服務器存儲數據內容的優先級。

根據用QoS服務分析每個傳送的報文內容,將這些報文歸類到以CoS(分類的標準)值來表示的各個數據流中,對它進行標注。

由于云計算環境具有虛擬化的特點,把硬件物理資源虛擬化為虛擬服務資源,這樣可以對虛擬服務資源利用軟件程序進行重新配置,并通過配置子程序實現不同用戶的需求。

2.2 根據伯努利大數定律計算量建立存儲結構

在伯努利大數定律計算的數據量建立的存儲結構中,按照計算的數值,云計算服務系統被劃分為無數個資源池。這些資源池不只是存儲資源,還要對已有的資源池進行管理。每一個資源池里,信息管理系統對資源中分類的數據信息進行統一管理。

如圖1所示:客戶端和服務端兩部分構成了伯努利大數定律計算數值建立的存儲結構。

下面給出伯努利大數定律的計算公式:

設定μ是n次獨立試驗中事件A發生的次數,且事件A在每次試驗中發生的概率為P,則對任意正數ε>0,則成立。

其中公式中的n是訪問的數據量,μ指的是在n次訪問的數據量中某一類型在固定的時間內訪問數據的次數,且A是每次實驗中發生的概率為P。

相應的根據伯努利大數定律確定的數據量的值確定的存儲結構的步驟:

Step1:對參數進行初始化,設定任務的數量和屬性;

Step2:根據瀏覽器的訪問記錄計算當前的訪問數據值;

Step3:根據興趣愛好,性別、年齡將數據資源劃分為幾類;

Step4:通過伯努利大數定律計算每一種類型的所占比;

Step5:依據每一種類型的所占總訪問量資源的比重重新對云存儲數據的方式進行設置。

3 實驗與分析(Experiment and analysis)

3.1 實驗環境

針對本文所提出的根據伯努利大數定律的云存儲數據方法,本文在QoS服務的基礎上,通過瀏覽器的訪問數據痕跡進行了仿真實驗,并計算了幾種不同類型的用戶對數據訪問量的數值。在實驗過程中,主機的內存為8GB,硬盤為520GB,操作系統為windows 10。本文提出的基于伯努利大數定律的云存儲模型與文獻中[5]的信譽度約束下的超邊際約束的云存儲資源分配模型與文獻[6]最短隊列算法進行對比,通過在執行任務的平均時間t和負載均衡度σ作為指標來衡量QoS服務質量的性能。因此有如下定義:

定義1:t表示執行任務的平均時間,在資源上執行任務n所用的整體的時間T,max{tci}表示在任務集T中完成最后一個任務的時間,min{tcj}表示在任務集T的第一個任務開始的時間,則有如下公式:

定義2:σ表示負載均衡度的大小,即云服務資源處理任務所需時間的方差L與帶處理任務數n的比值。其中vli表示虛擬機負載量,m表示虛擬資源的數量,avlc表示虛擬服務資源的平均負載值,則:

σ的值越小,說明負載均衡的性能越好。反之,性能越差。

3.2 性能分析

本文選定了50的虛擬服務系統,通過比較伯努利大數定律的云存儲數據的方法與信譽度約束超邊際分析云存儲數據方法和采用對短隊列算法進行比較。選取50的虛擬服務器,將任務數量從50到1000個獨立任務構成的任務集,對執行任務的平均時間t和負載均衡度σ的進行分析得出以下量表數據信息,如圖2和圖3所示。

圖2可以看出:用伯努利大數定律算法比信譽度約束算法和最短隊列算法執行任務的平均時間越來越少,曲線也更平穩。

在圖3中,最短隊列算法的負載均衡度較大,變化幅度也大,不穩定;在信譽度算法和大數定律的算法中兩者的負載均衡度差距不是很大,但是大數定律的曲線更平穩。因此,用伯努利大數定律算法能更好的提高資源利用率,是云服務系統的負載均衡達到更好的效果。

仿真結果表明,對于云服務數據存儲的資源配置問題,依據伯努利大數定律的數值結果進行分配,使云計算資源節點的使用率達到最佳,減少了延遲,并提升了任務完成時間。

4 結論(Conclusion)

本文分析云服務數據存儲方式在資源配置過程存在負載不均衡問題進行了研究,提出了一種基于大數定律的云存儲數據方法,給出了思路和過程。通過對歷史訪問數據的分類和用伯努利大數定律的計算,計算了不同類型的數據訪問量的數值,并加以分析。實驗表明本方法對數據訪問量的計算,可以以此為依據對數據資源進行合理分配。提高了資源利用率,減少訪問延遲。

參考文獻(References)

[1] 冬瓜頭(張東)大話存儲II[M].北京:清華大學出版社,2011:22-24.

[2] MATHER T,KUMARASWAMY S,LATIF S.Cloud security and privacy:an enterprise perspective on risks and compliance[M].Cloud Security and Privacy:An Enterprise Perspective on Risks.Sebastopol,CA:OReilly Media,2009:35-72.

[3] 傅穎勛,羅圣美,舒繼武.安全云存儲系統與關鍵技術綜述[J].計算機研究與發展,2013,50(1):136-145.

[4] 李暉,孫文海,李鳳華,等.公共云存儲服務數據安全及隱私保護技術綜述[J].計算機研究與發展,2014,51(7):1397-1409.

[5] 祁志陽,馬滿福.信譽度約束下超邊際分析的云存儲[D].西北師范大學,2015.

[6] HuberN,BrosigF,Kounev S.Model-based self-adaptive resource allocation in virtualized environment[J].in:SEAMS,ACM,2011:90-99.

[7] DuPontC,GiulianiG,HermenierF,et al.Anenergyaware framework for virtual machinePlacement in cloud federated data centers[C].Future Energy System:WhereEnergy,Computing and Communication Meet (e-Energy),2012 Third International Conference on.IEEE,2012:1-10.

作者簡介:

陳維華(1978-),女,碩士,副教授.研究領域:物聯網技術及應用.

何彩虹(1980-),女,碩士,工程師.研究領域:物聯網技術及應用.

猜你喜歡
云存儲
基于橢圓曲線的云存儲數據完整性的驗證研究
高校檔案云存儲模式探究
地鐵高清視頻存儲技術的應用分析
云數據存儲安全關鍵技術研究
基于云存儲的氣象數字化圖像檔案存儲研究
試論云存儲與數字版權的沖突、法制與協同
云存儲出版服務的版權侵權責任風險分析
云存儲技術的起源與發展
基于云存儲的數據庫密文檢索研究
淺析龍巖煙草業務數據與監控數據中的云存儲與大數據
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合