?

基于霧計算的電力信息高效存儲與共享算法

2024-05-03 09:44劉成江張千千黎燕張洪
沈陽工業大學學報 2024年1期
關鍵詞:云端差分閾值

劉成江 張千千 黎燕 張洪

摘要:針對電力信息數據量較大且存儲速度較慢的問題,提出了一種基于霧計算的電力信息存儲與共享方法。該方法包含了基于差分同步的數據存儲方式與基于霧計算的組合數據共享機制。數據存儲方法將一部分數據的計算和存儲工作轉移到霧服務器中,以減少云計算平臺的工作負載,從而實現更高效的數據存儲;組合數據共享機制通過在霧端建立虛擬化數據共享機制來防止電力信息數據的丟失、損壞及惡意修改。仿真實驗與結果表明,該方法能顯著減少云服務器的響應次數,進而減輕云計算的負擔,具有更高的數據恢復率,相比于傳統方法,所提方法可實現高效、安全的電力信息存儲及共享。

關鍵詞:云數據;數據存儲;數據安全;霧計算;組合共享;數據共享;差分同步;虛擬化

中圖分類號:TM76 文獻標志碼:A 文章編號:1000-1646(2024)01-0001-06

隨著互聯網與物聯網技術的快速發展,電力系統開始使用大量的傳感器設備對電網運行狀態進行監測,由此產生了海量數據。然而,傳統的數據存儲和計算模式已難以滿足電網對海量數據的處理需求。為了實現電力系統大教據的安全、可靠存儲,國內學者及企業提出將云計算關鍵技術與傳感器網絡相結合,以實現電力電網信息的存儲和計算。其中無線傳感器網絡專注于獲取及檢測電力信息,云平臺則主要負責對搜集的信息進行深度處理,從而為電網用戶提供深度服務與業務支持。

云計算是一種以數據處理和管理為核心的計算機系統,其通過集成網絡技術、集群技術以及分布式文件管理技術來實現網絡中大量不同類型服務器的協調工作,進而為用戶提供業務處理與數據存儲服務。同時云計算還具有可伸縮、高效的特點,能夠為用戶提供便捷、快速及按需訪問的計算資源池。此外,將云計算與無線傳感器網絡相結合,可為該網絡在計算能力與內存等方面提供資源。故對于電力信息系統而言,低時延、高數據率、高計算與高存儲能力的云計算平臺顯得尤為重要。無線傳感器網絡通常存在較高的通信時延、較低的可靠性與安全性等問題,因此,為實現高效、快速的電力信息處理,霧計算作為一種部署于終端設備附近的計算服務逐漸成為了研究熱點。在該計算模式下,具有數據存儲和處理能力的節點均被部署在無線傳感器網絡與云數據中間。而霧計算設備則可當作一個分布式的基礎設施,并充分調動靠近無線傳感器網絡的邊緣設備進行協同工作。相比于傳統的云計算系統,霧計算模式更為靈活,且能夠克服傳統系統的多種限制及缺陷。

由于云計算平臺對用戶上傳的數據實行統一管理,故用戶無法對其存儲的數據進行控制。這意味著數據的管理權與所有權產生了分離,也導致了云計算平臺面臨著嚴重的存儲及傳輸安全問題,由此阻礙了該技術的進一步發展。云計算的安全問題主要包括數據的機密性、完整性與可用性三方面。其中,數據機密性主要負責對數據進行認證限制,以保護數據所有者的隱私;數據完整性負責保證用戶上傳的數據不會被篡改和破壞;數據可用性則根據數據所有者的意愿來訪問其上傳的數據。相比于傳統的云計算平臺,霧計算模式具有更高的安全性需求。

針對電力信息數據量較大與低時延存儲的需求,本文提出了基于霧計算模式的電力信息存儲及共享方法。通過采用基于差分同步的數據存儲方式,實現了對霧計算模式下電力系統無線傳感器網絡數據的存儲。同時,該方法還可以減少云端的工作負載,實現更高效的數據存儲。此外針對云端數據共享的安全性問題,本文設計了一套基于霧計算的組合數據共享機制,實現了高效、安全的電力信息存儲與共享。相比于傳統方法,該方法具有更快的數據存儲速度及更高的共享數據恢復率。

1 基于差分同步的數據存儲方法

在傳統的云存儲方法中,即便只對數據進行細微修改,也需要將整個文件傳輸到云平臺。然而電力信息通常需要頻繁更改部分數據段,因此使用傳統的云存儲方法將導致數據出現冗余和延遲。為解決這一問題,本文提出了一種基于差分同步的數據存儲方法。

基于差分同步的數據存儲方法將霧計算引入到傳統云存儲模式中,并將霧服務器作為緩存服務器放置于云服務器與邊緣設備之間。在數據存儲時,該方法將計算和存儲的部分任務交給霧服務器進行處理,從而達到緩解云端數據存儲負擔的目的,方法流程如圖1所示。

圖1中從上到下分別為云服務器、霧服務器及電力系統的無線傳感器網絡。隨著電網狀態的改變,傳感器網絡監測的數據也會發生變化,這部分數據包括相關信息和差異數據。無線傳感器網絡上傳數據到云端時,霧服務器便會將此類數據暫存。當緩存的數據量達到一定閾值時,再將該數據與云服務器進行同步。不同于傳統方法,本文采用差分同步方式來實現云端數據的同步,將文件中的新數據塊上傳至霧服務器,并非上傳所有數據。該方法可將無線傳感器網絡及云服務器的部分工作轉移到霧服務器,從而有效緩解云端的工作負載,避免將某些變化頻繁的數據反復上傳到云端。假設待上傳的文件為F,基于差分同步的數據存儲方法將文件劃分成大小為w的文件塊,霧服務器的緩存閾值為Th,則所提方法的具體計算過程如下:

1)將文件F均分為M塊,則第f個文件塊為

2)檢驗每個文件塊的強弱校驗碼,并將碼存入Table1和Table2中,則有

式中:Adler32校驗算法通過求解兩個16位的數值,將結果連接成為一個32位的整數;MD5為信息一摘要算法,用于確保信息傳輸的完整性和一致性。

3)將強弱校驗碼表Table1和Table2傳輸到霧服務器中。

4)在霧服務器上對每個文件塊進行一致性檢測,判斷文件修改的數據量是否超過閾值Th。若超過,霧服務器將該文件發送至云端進行同步;若未超過,記錄本次修改,并繼續檢測下一個文件。

5)對于無線傳感器網絡發送的每一個文件重復進行上述操作,進而實現數據的存儲。

基于差分同步的數據存儲方法,采用閾值Th來判斷是否對文件進行同步。本文方法將新文件表征為新、舊數據塊的總和。其中,新文件塊是由于對文件進行更改而出現差異的數據。通過設置閾值來表示文件的變化率,令Th為0.5,即當至少有一半的文件數據發生變化時才能向云端進行同步。假設文件每次超過閾值的概率為p,則對其進行q次修改時,傳統方法需上傳q次文件,而本文方法僅需上傳∑qi=1f(p)次文件。由此可以看出,基于差分同步的數據存儲方法明顯比傳統方法更有效。

2 數據共享與恢復方法

在傳統的數據存儲方法中,每類數據僅在云端存儲一份。故當數據發生破壞或丟失等情況時,此類方法無法保證數據的完整性與機密性。為解決這一問題,本文采用“無線傳感器網絡-霧-云”三層結構對數據加以存儲,提出了一種基于霧計算的數據共享機制,將數據的共享委托給霧服務器進行分析及處理。假設霧服務器集合為U={u1,u2,…,un},其中n為霧服務器的數量,數據文件被存儲在k個不同的霧服務器節點,記為V={v1,v2,…,vk}。本文將文件F按照(k,n)的組合規則劃分為n個數據塊,然后再根據霧節點的異構特性將數據分為g個子段,每個數據子段均包括k-1個共享數據塊,每個霧服務器保存一個數據子段。用戶讀取數據時僅需獲得k個子集,即可恢復完整的文件。圖2為基于霧計算的數據共享與恢復方法。在數據恢復過程中,由于霧節點中可能存在重復的共享數據塊,在恢復原始數據時,本文方法將會選擇性地接收非重復數據塊.并在數據傳輸完成后恢復原始數據。

2.1 數據共享

數據共享過程是根據霧節點的剩余存儲量、霧節點與云平臺間的距離d以及網絡帶寬b來確定共享數據塊的大小,并生成對應的共享數據塊。本文定義共享數據塊{s1,S2,…,sm}所滿足的比例關系為

s1:s2:…:sm=d1r1b1:d2r2b2:…:dmrmbm (3)

式中,r為霧節點的剩余存儲容量。數據塊s,的表達式為

式中:S為原始數據集合{σ1,σ2,…,σn}的大小,其中,σn為第nd個數據塊的大??;nd為數據塊的數量;m為共享數據塊的數量;k為霧服務器的節點數量。共享數據塊的計算過程為:

1)計算每個數據塊各分段索引的共享數據塊之和,計算公式為

式中:y為霧節點所存儲的數據;F為要恢復的文件;G為恢復出的共享數據塊。

3 實驗與分析

為驗證所提方法的有效性,本文使用25.3MB的圖片數據、85.6MB的音頻數據及624MB的視頻數據進行仿真測試。使用5-60個硬件設備作為霧節點,每個節點的傳輸速度從10-100Mbit/s不等,且每個節點均可連接40-100個無線傳感器。

為了驗證基于差分同步數據存儲方法的有效性,本文設置了兩組數據傳輸實驗進行測試:1)原始文件為79.7kB,先對文件進行細微修改,并得到大小為98.6kB的新文件,隨后再對文件進行第二次修改,進而獲得大小為112kB的文件;2)原始文件為79.7kB,先對文件進行內容添加并得到大小為112kB的新文件,然后對文件進行二次修改獲得大小為98.6kB的文件。兩組實驗分別模仿了數據修改的不同方式,即只是對文件進行細小修改和對文件進行較大幅度的修改。同時為保證實驗數據量的一致性,需要對細微修改的實驗組填充數據。為保證實驗結果的可靠性,本文在后續實驗中均進行了100次重復實驗,取平均值作為最終結果。為了驗證所提方法的有效性,將本文方法與文獻[14]中所提方法進行比較,文獻[14]方法采用傳統的文件替代方式進行存儲,即只對數據進行細微修改,也需要將整個文件傳輸到云平臺。

由于不同窗口大小對數據上傳的時間會產生影響,故本文給出了設置不同窗口大小時數據同步時間的變化情況。圖3a為當窗口大小分別為文件的1/2、1/4、1/8、1/16及1/32時,采用本文方法進行數據上傳用時的變化。由圖3a可知,隨著窗口的逐漸減小,數據同步的時間將不斷增加。為了保證數據上傳的效率,需選擇適當大小的窗口來減少數據存儲時間。在不同實驗設置時,本文方法與文獻[14]中所需數據的同步時間對比如圖3b、c所示。其中,文獻[14]將所有數據不加區分地更新、同步至霧平臺。由于文獻[14]方法需要將整個文件傳輸到云端,故其傳輸時間最長。而本文方法將霧服務器作為緩存,可有效減少上傳至云端的數據量。本文方法通過設置閾值來避免重復操作,從而明顯減少數據同步所需時間。

為驗證數據緩存閾值Th對同步時間的影響,圖4給出了設置不同大小的閾值時,本文方法在兩種數據傳輸情況下的數據同步時間。從圖4中可以看出,Th值由小到大的變化過程中,兩種情況下的同步時間均逐漸減小,但減小到一定值后便不再發生變化。這是由于數據變化情況小于閾值,且沒有達到同步條件時,無法實現云端同步。因此,需設置合理的閾值來實現所有數據的同步及傳輸效率的提升,本文將該值設置為7。

對數據進行分塊可明顯減少云服務器的響應次數,為驗證這一結論,本文比較了數據塊數不同時,文獻[7]方法、文獻[14]方法和文獻[15]方法與本文方法的云服務器響應次數。10次實驗結果如表1所示。從表1可以看出,本文方法的云服務器響應次數顯著減少,進而減輕了云計算的負擔。

為驗證所提出的數據共享與恢復方法的有效性,本文比較了使用不同數量的總節點以及霧服務器節點進行數據共享時的數據恢復率,具體結果如表2所示。由表2可知,本文方法能保持30%以上的數據恢復率。當參與數據共享的霧節點數量增加到一定程度時,會導致數據恢復率下降。因此,本文選擇總運行節點數量的10-20%作為恢復的霧節點數。

4 結束語

本文提出了一種基于霧計算的電力信息存儲與共享方法。該方法將霧服務器作為中轉節點,采用差分同步的數據存儲方式實現更高效的數據存儲。相比于傳統方法,本文方法具有更高的數據恢復率,能明顯減少云服務器響應次數。通過比較使用不同數量的總節點以及霧服務器節點進行數據共享時的數據恢復率,驗證了本文所提出的數據共享與恢復方法的有效性。

(責任編輯:鐘媛 英文審校:尹淑英)

猜你喜歡
云端差分閾值
數列與差分
云端之城
小波閾值去噪在深小孔鉆削聲發射信號處理中的應用
基于自適應閾值和連通域的隧道裂縫提取
比值遙感蝕變信息提取及閾值確定(插圖)
美人如畫隔云端
行走在云端
云端創意
室內表面平均氡析出率閾值探討
基于差分隱私的大數據隱私保護
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合