?

機構內網信息優化配置

2023-11-29 11:26福建師范大學林馨
數字技術與應用 2023年11期
關鍵詞:數據量容量服務器

福建師范大學 林馨

隨著科技的發展和互聯網的普及,各種組織機構的內部人員常需要從互聯網獲得工作、學習等相關信息。通??梢酝ㄟ^直接訪問外部網絡或將常用數據存儲到本地服務器以獲取信息,兩種方式都會產生一定的費用。本文將綜合兩種獲取信息的方式,從節約成本的角度,給出優化策略。

1 問題

隨著現代科技的發展,網絡上的資訊也豐富多樣,互聯網成為我們學習工作生活中不可分割的部分。各種組織機構,如學校、醫院、企業等日常都需要從網絡獲取各類信息,以提高工作效率,提升產品或服務的質量等。

從網上獲取信息會產生網絡通信費。若機構將一些經常需要訪問的數據塊下載存儲到本地服務器,就可以節省部分由于訪問外網所產生的通信費用。同時我們注意到,購買以及維護本地服務器也需要一定的費用,因此我們要在二者之間找到平衡點,設計出既經濟又合理的方案。

假設已知每個本地服務器的存儲容量、購買價格以及維護費用,機構所要獲取的數據塊并以日常訪問頻次確定每個數據塊的重要性權重,以及從網絡獲取每個數據塊所需通信費用。如圖1 所示給出了內網配置方案所需考慮的因素。

圖1 內網配置方案需考慮的因素Fig.1 Factors for Intranet configuration scheme

引用[1]中已探討了當數據塊不可分割且服務器中存儲單位數據量的成本相同時,購買服務器以及數據塊的存儲方案。本文將考查數據塊可分割存儲且服務器中存儲不同數據塊單位數據量的成本不同時,需要購買的服務器數量,選擇存儲哪些數據塊以及如何將數據塊存儲在服務器上,從而給出使機構能獲取所需信息,同時又能節約成本的方案。

2 求解

設總共有m個數據塊,其中第i個數據塊的數據量為Qi,從外網獲得第i個數據塊時產生的通信費用為Bi,則第i個數據塊單位數據量的通信費是Fi=Bi/Qi.設每個服務器的存儲容量為W,價格是V,則服務器單位容量的價格為P=V/W。由于不同數據塊訪問頻次不同,服務器存儲第i個數據塊單位數據量的維護費為Si,因此服務器存儲第i個數據塊單位數據量的成本Ci=P+Si.

求解思路:對第i個數據塊的單位數據量而言,若訪問外網產生的通信費大于服務器存儲成本,即Fi>Ci時,則將第i個數據塊存儲到服務器;將滿足以上條件的所有數據塊歸為A 類并全部存儲在服務器中,從而確定需購買的服務器數量;若存儲了所有A 類數據塊后,服務器有剩余容量,則對剩余的滿足0.95Ci

我們先將數據塊歸為A 類以及B 類[1]。假設A 類共有t個數據塊,B 類共有k個數據塊。完成數據塊分類之后,我們利用貪心算法將數據塊存儲到服務器。

貪心算法[2]是通過一系列的選擇來得到一個問題的解。它所作的每一個選擇都是當前狀態下某種意義的最好選擇,即貪心選擇,并希望通過每次所作的貪心選擇導致最終結果是問題的一個最優解。

所謂貪心選擇性質是指所求問題的整體最優解可以通過一系列局部最優的選擇,即貪心選擇來達到。貪心算法所作的貪心選擇可以依賴于以往所做過的選擇,但絕不依賴于將來所作的選擇,也不依賴于子問題的解。因此貪心算法是自頂向下,以迭代的方式做出相繼的貪心選擇,每做一次貪心選擇就將所求問題簡化為一個規模更小的子問題。

一個典型的貪心算法如Kruskal 算法求簡單無向圖的最小生成樹:首先把所有頂點看作孤立點作為初始圖,將所有的邊權按從小到大排序,每次選出權值最小的邊,若加入該邊不產生回路,就將其加到圖中,直到得到最小生成樹,如圖2 所示。

圖2 Kruskal 算法求圖(a)的最小生成樹(f)Fig.2 Kruskal algorithm for MST (f) of graph (a)

將數據塊存入服務器的基本步驟:(1)將A 類數據塊存到服務器。首先,將A 類數據塊按Fi-Ci的值降序排列;之后,按順序將數據塊存入服務器:若當前數據塊數據量不超過當前服務器剩余容量,則直接存儲;若當前數據塊數據量超過當前服務器剩余容量,則將此數據塊分割,一部分填滿當前服務器,另一部分存入下一個服務器;重復這個過程,直到將A 類數據塊全部存儲直服務器,這時統計所需服務器數量以及服務器剩余容量。(2)將部分B 類數據塊存儲到服務器。首先,將B 類數據塊按Ci-Fi升序排列;之后按順序將數據塊存入服務器:若當前數據塊數據量不超過當前服務器剩余容量,則直接存儲;若當前數據塊數據量超過當前服務器剩余容量,則將此數據塊分割,一部分填滿當前服務器。至此,所有A 類數據塊和部分B 類數據塊已存入服務器。

算法1:將A 類數據塊存儲到服務器。

Step1. 將A 類數據塊按Fi-Ci的值降序排序[3],得D1,D2,...Dt,i=j=1,Wj=W;

step2. 若i>t,則轉step4;否則,轉step3;

step3. 若Di

step4.n=j,停止。

我們由算法1 知,共需要n個服務器,在存儲了A類數據塊中總共t個數據塊之后,服務器Ln的剩余容量為Wn,如圖3 所示。

圖3 A 類數據塊存入服務器的三種情形Fig.3 Threeways type A data stores at servers

雖然B 類數據塊的單位數據量所產生的通信費小于服務器單位容量的存儲成本,但若是存儲完A 類數據塊,服務器仍有剩余空間,我們將部分B 類數據塊存入可充分利用服務器的存儲空間。

算法2:將B 類數據塊存儲到服務器的剩余空間。

Step1. 將B 類數據塊按Ci-Fi的值升序排序[3],得D1,D2,...Dk,i=1;

step2. 若Wn=0,則停止;否則,轉step3;

step3. 若Di

Step4. 若i>k,s=i-1,停止;否則,轉step3。

由算法1、算法2 知,服務器總共存儲了A 類共t個數據塊,以及B 類共s個數據塊,且服務器無法再存儲B 類中剩余數據塊,如圖4 所示。至此,服務器存儲了A 類中所有數據塊以及B 類中部分數據塊,其余需要數據都通過訪問外網獲得,產生通信費用。

圖4 數據塊存入服務器的總體方案Fig.4 Overall scheme for data storage at servers

3 結語

本文通過優化算法給出了將哪些數據塊存儲到本地服務器以及存儲的方案,從而使得組織機構能在較低的成本下,為其內部成員提供所需的數據信息。由于從網絡上獲取信息存在風險,而計算機系統是通過多個防御層來防止遭受惡意活動的攻擊,包括政策(安全審核、個人使用限制、培訓等)和技術(防火墻、反病毒、入侵檢測系統、漏洞掃描、數據冗余等)在內的防御措施,將會對機構的風險類型產生各種影響。因此,在本文的基礎上,還可進一步探討機構網絡安全策略,即在盡量減少成本的前提下選擇適當的防御措施。

猜你喜歡
數據量容量服務器
基于大數據量的初至層析成像算法優化
計算Lyapunov指數的模糊C均值聚類小數據量法
高刷新率不容易顯示器需求與接口標準帶寬
寬帶信號采集與大數據量傳輸系統設計與研究
通信控制服務器(CCS)維護終端的設計與實現
中國服務器市場份額出爐
得形忘意的服務器標準
計算機網絡安全服務器入侵與防御
2015年上半年我國風電新增并網容量916萬千瓦
2015年一季度我國風電新增并網容量470萬千瓦
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合