?

大數據技術的媒資檔案管理方法

2022-02-15 02:48廖金材張燕丹
信息記錄材料 2022年12期
關鍵詞:媒資加密分類

廖金材,張燕丹

(福建省龍巖市永定區融媒體中心 福建 龍巖 364100)

0 引言

媒資檔案是在廣播電視節目制作以及傳播過程中形成的電視、網絡等媒體的資源檔案,不僅包含文字資源,還包括語音、視頻等資源信息,具有數量大、種類多等特點,因其獨特的特性存在,導致媒資檔案管理具有難度高、易丟失、工作量大等特征。最初媒資檔案管理方法主要是通過人工收集、整理、建檔存儲,對于文字類的媒體資源信息整理成紙質檔案,對于語音、視頻類的媒體資源信息存儲到獨立的硬盤上,并將標簽貼在硬盤上,方便媒資檔案查找和使用。這種方式需要花費大量的資金,并且消耗大量的人力資源,不僅效率低,如果不對其進行定期整理和檢查,非常容易出現檔案丟失現象。隨著信息技術和網絡技術逐漸與檔案領域融合,為了提高檔案管理效率,相關學者提出了數字化管理方式,在一定程度上推動了媒資檔案數字化、信息化建設。左晉佺等[1]利用大數據技術,構建用戶、節點、組織、下屬機構、檔案云儲存模式的檔案管理平臺。在數據庫中利用元數據特征屬性完成可視化檔案管理。但是,該方法無法對檔案管理系統中存在的數據進行融合處理,導致檔案管理響應時間較長,存在系統響應效率低的問題。相世強[2]以Java語言為基礎,利用JFinal技術構建急速WEB開發框架,實現系統化、自動化、多元化的檔案信息管理。但是,該方法在規定時間內無法對多個媒資檔案數據包進行有效處理,存在系統媒資處理能力和并發性較差的問題。

雖然目前媒資檔案管理已經取得了相應的成果,但是由于國內媒資檔案信息化管理起步比較晚,仍然處于比較低的技術水平?,F有的管理方法存在不足,在實際應用中當對海量媒體資源信息管理時,經常出現信息殘缺,建立的媒資數字檔案完整性較差,檔案信息丟失量較大、響應時間較長、并發性較差等問題?;诖?,本文提出大數據技術的媒資檔案管理方法,以期優化媒資檔案管理效益,同時確保檔案信息安全性和完整性。

1 基于大數據技術的檔案序列加密分類

為了保證媒資信息的完整性和安全性,利用大數據技術對媒資檔案數據序列進行加密分類,在加密分類前對待管理的媒資信息建立相應的數字標簽,以元數據作為檔案數字標簽構建的對象,以媒資信息內容元數據為主,比如媒資主題、信息源、資源、時間,其中媒資主題的確定是根據媒資信息中出現頻率最高的關鍵詞確定,以關鍵詞作為媒資檔案主題,對媒資檔案本體劃分[3]。信息源是指媒資信息的來源,資源主要為媒資信息的主要形式,包括文本、圖片、音頻以及視頻。時間是指媒資信息的產生時間,根據以上四個媒資信息屬性,生成媒資檔案數字標簽,用公式表示為:

式c中,V表示媒資檔案s數字標簽;a表示媒資檔案主題;表示媒資信息源;表示媒資檔案資源類型,其中文本資源類型用“1”表示,圖片資源類型用“2”表示,音頻資源類型用“3”表示,視頻資源類型用“4”表示;e表示媒資檔案時間屬性[4]。

根據媒資檔案數字標簽,對媒資數據序列進行加密分類處理,下圖為基于大數據技術的媒資數據序列加密分類如圖1所示。

圖1 基于大數據技術的媒資數據序列加密分類示意圖

媒資數據序列加密包括3個功能層:數據分類層、數據塊內部結構層和加密分類格式層。數據分類層實現媒資數據包中的文本、圖片、音頻以及視頻等類型劃分。數據塊內部結構層主要包含數據頭、數據塊和數據位,通過數據頭存儲媒資數據基本信息,利用數據塊對空間進行實時調整,根據數據位改變鏈接行或遷移行。加密分類格式層中通過數據塊數量計算索引數據,限制數據操作者數量擴大空余空間,根據大數據長度讀取媒資數據記錄,利用本組擁有密鑰管理和跟蹤數據塊。

隨機選取一個已經生成數字標簽的媒資信息,假設該媒資n信息數據序列長度為h,該媒資信息數據操作者數量為,按照等價分類法將媒資信息數據序列分類成長度相等的m和大數據塊,每個大數據塊的第一個數據作為該數據塊的密鑰,將其作為變量,計算出媒資信息數據密鑰組合值,其計算公式為:

式中,x表示媒資檔案數據密鑰;wm表示第m個大數據塊密鑰[5]。生成大數據塊密鑰后,設定length-sive為大數據塊列表,利用singther-length表示大數據塊位長,根據大數據塊所在位置,生成大數據塊位置編號,并將其與數據塊密鑰添加在大數據塊塊頭位置,媒資信息密鑰組合值添加在大數據塊塊尾位置,從而實現為媒資信息數據序列的加密分類。

2 媒資檔案整合

按照分類的大數據塊信息特征,對媒資檔案進行整合,首先構建媒資檔案信息分析模型,該模型用公式表示為:

式中,u表示構建的媒資檔案信息分析模型;Cm表示媒資信息數據塊特征量;F(X,t)表示時間t時媒資數據X的模糊度;p(t)表示媒資數據分類函數;K表示媒資信息總特征值[6]。利用該模型對媒資檔案信息特征進行分析,根據分析結果對媒資檔案信息特征進行重構,得到的媒資檔案主成分特征為:

式中,z表示特征重組后的媒資檔案信息主成分特征;A表示媒資檔案信息的模糊特征分量;g表示媒資檔案信息的譜分解系數;α表示媒資檔案信息狀態點頻率;γ表示媒資檔案信息采樣率[7]。根據媒資檔案信息主成分特征,對具有相同特征的媒資檔案信息組合在一起,從而實現媒資檔案整合。

3 媒資檔案存儲管理

將整合后的媒資檔案存儲到數據庫中,進行建檔存儲,為了保證數據存儲具有充足的空間,配備西部數據(Western Digital)硬盤,存儲容量為14 T,輔助數據庫完成媒資檔案存儲管理任務[8]。將整合好的數據信息進行轉碼,其中音頻和視頻信息統一轉化為MP4格式,圖片轉換為JPG格式、文字信息統一轉化為PDF格式,在數據庫中建立數據表格,利用數據表格對媒資檔案進行分類存儲,表1為媒資檔案存儲數據表。

表1 媒資檔案存儲數據表

將整合后的媒資信息存儲到數據表中,生成媒資數字檔案,將其存儲到數據庫中,當用戶想要訪問媒資數字檔案時,數據庫會自動審核用戶身份,如果身份驗證通過,用戶在數據庫檢索欄中搜索關鍵詞,數據庫根據媒資檔案特征,將媒資數字檔案與關鍵詞進行匹配[9]。用戶可以事先在數據庫中設定一個匹配閾值,如果關鍵詞與數字檔案匹配度大于該閾值,則數據庫會向用戶發送媒資數字檔案壓縮包,用戶利用密鑰對數字檔案進行解密處理,即可實現對媒資數字檔案可視化展示,用戶在服務器上對媒資數字檔案進行下載、轉發等操作,從而實現對媒資檔案管理。

4 實驗論證分析

為了驗證本次提出的基于大數據技術的媒資檔案管理思路的可行性與可靠性,選取某媒資檔案數據包作為實驗對象,該媒資檔案數據包大小為10.62 GB,其中包含2.62 GB文字信息、3.46 GB音頻信息、1.06 GB視頻信息、1.61 GB圖片信息以及其他信息,利用本次設計方法與左晉佺[1]方法、相世強[2]方法對該媒資數據包進行檔案管理。為了保證本次實驗結果具有較高的可信度,兩種方法的實驗環境相同,均采用Windows11操作系統,配備兩臺SFHF-554服務器,以及一臺西部數據(Western Digital)硬盤,按照上述流程對媒資檔案數據序列加密分類、整合以及存儲,實驗共生成7個媒資檔案。

4.1 媒資檔案信息丟失量分析

存儲完成后,令用戶每隔1 s對媒資檔案進行下載和轉發一次,30 min后檢驗媒資檔案信息是否存在丟失,記錄每個媒資檔案信息丟失量,將其作為三種方法管理質量評價指標,信息丟失量越大,表示媒資檔案完整性越低,媒資檔案管理質量越差,根據記錄的實驗數據繪制成表格,具體數據如下表2所示。

表2 不同方法應用下媒資檔案信息丟失量對比

通過對上表中數據分析,可以得出以下結論:應用設計方法管理媒資檔案,檔案信息丟失量較小,最小可以達到0,最高數據丟失量僅為0.09 GB,數值較小,基本可以忽略不計,說明設計方法能夠有效保證媒資檔案信息的完整性。而應用左晉佺[1]方法管理媒資檔案,檔案信息丟失量最小為0.38 GB,最高數據丟失量已經達到0.96 GB,相世強[2]方法管理媒資檔案,檔案信息丟失量最小為0.18 GB,最高數據丟失量為0.77 GB。左晉佺[1]方法和相世強[2]方法數值遠遠高于設計方法,設計因為本次設計方法采用大數據技術對媒資檔案信息進行了加密分類處理,提高了檔案數據信息的安全性。因此實驗結果證明了在保證檔案完整性方面,設計方法優于左晉佺[1]方法和相世強[2]方法,相比較左晉佺[1]方法和相世強[2]方法更適用于媒資檔案管理,同時也驗證了大數據技術在媒資檔案管理中具有良好的應用效果。

4.2 檔案管理響應時間分析

在媒資檔案數據包中隨機選取文字信息、音頻信息、視頻信息、圖片信息以及其他信息共計800個檔案信息數據作為測試對象,分別采用設計方法、左晉佺[1]方法和相世強[2]方法對檔案信息數據進行管理,對比不同方法的檔案管理響應時間,測試結果如圖2所示。

圖2 檔案管理響應時間

分析圖2可知,隨著檔案信息數據數量的增加,設計方法、左晉佺[1]方法和相世強[2]方法的檔案管理響應時間不斷增長。對上述方法的測試結果進行對比發現,設計方法的檔案管理響應時間均低于左晉佺[1]方法和相世強[2]方法的檔案管理響應時間,由此表明設計方法具有較高的檔案管理響應效率。這是因為設計方法利用大數據技術在媒資檔案數據序列加密分類前對媒資信息建立了相應的數字標簽,以元數據作為檔案數字標簽構建對象,以此提高了檔案管理響應效率,進而縮短了檔案管理響應時間。

4.3 檔案信息融合能力分析

每分鐘檔案信息融合個數表明檔案信息融合能力,即檔案管理能力。因此,將檔案信息融合能力作為測試指標,在時間為30 min內,測試設計方法與左晉佺[1]方法、相世強[2]方法的檔案信息融合能力,測試結果如圖3所示。

圖3 檔案信息融合能力

對圖3中的數據進行分析可知,時間與管理媒資檔案信息數據集之間成正比關系,隨著時間的增加,設計方法、左晉佺[1]方法和相世強[2]方法檔案信息融合數量不斷增加,在相同時間內,左晉佺[1]方法和相世強[2]方法的檔案信息融合數量均低于設計方法。這是因為設計方法構建了媒資檔案信息分析模型,以數據塊特征量為依據完成媒資檔案整合,進而提高了檔案信息融合能力。在相同時間內檔案信息融合數量越多,表明媒資檔案數據管理能力越強,通過測試發現設計方法具有較強的檔案管理能力。

5 結語

綜上所述,此次將大數據技術應用到媒資檔案管理中,提出了一條新的媒資檔案管理思路,并通過實驗驗證了該思路的可行性與可靠性,有效保證了媒資檔案信息的安全性和完整性,此次研究為了提高檔案管理質量,推廣大數據技術在媒資檔案管理中的應用,為基于大數據技術的媒資檔案管理提供理論參考,具有良好的現實意義。但是由于此次研究時間有限,并且提出的管理方法尚未在實際中進行大量應用與操作,在某些方面可能存在一些不足之處,今后會對基于大數據技術的媒資檔案管理方法優化進行研究,為媒資檔案管理提供有力的理論支撐。

猜你喜歡
媒資加密分類
淺談新時期廣電行業媒資檔案的管理與開發
全媒體時代的版權媒資管理探析
一種新型離散憶阻混沌系統及其圖像加密應用
分類算一算
內蒙古廣播電視臺IPTV媒資補全系統簡述
一種基于熵的混沌加密小波變換水印算法
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
認證加密的研究進展
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合