?

探究網絡信息安全防范與Web數據挖掘技術的整合

2018-03-06 11:10蔣家錢
網絡安全技術與應用 2018年3期
關鍵詞:數據挖掘信息安全分析

◆蔣家錢

探究網絡信息安全防范與Web數據挖掘技術的整合

◆蔣家錢

(六盤水職業技術學院 貴州 550025)

現在我國的網絡經濟獲得了一定的發展,然而隨之而來的網絡信息安全問題卻對網絡經濟的后續發展產生了制約。想要提高網絡信息安全的保護措施最重要的技術是Web數據挖掘技術。本文首先建立了一個Web數據挖掘的網絡信息安全防范模型,然后對這個模型運行的原理、Web挖掘的數據資源、挖掘所用技術方法、所建模型作用,運行注意事項等內容做出了詳細的剖析。

網絡信息安全;防范;Web數據挖掘技術;整合

1 網絡安全問題

隨著社會經濟的迅速發展,互聯網在我們生活中的應用越來越廣泛,和人們的生活息息相關,人們開始借助互聯網做各種各樣的業務往來,非常方便和快捷。由此產生了電子商務,它是伴隨著網絡經濟而產生的,在世界范圍內,電子商務得到了迅速的發展,走進人們的生活。從另一個角度來說,現在網絡經濟安全不容忽視,很多不安全因素時刻威脅著人們在網上的經濟往來。網絡信息安全問題產生的原因主要是網絡和信息系統本身存在一些漏洞很容易讓不法分子鉆了空子,從而威脅到網絡信息安全,這個問題也是我國目前國防安全的一個重點關注內容,它的存在對我國網絡經濟進一步發展產生了制約。2006年金山公司發布了2006年我國互聯網年度信息安全報告,從報告中我們能看出,這一年,電腦病毒直線增加,一共發現和攔截了二十四萬多種電腦病毒,是2003年和2005年兩年發現的病毒數量之和的三倍。

2007年,我國公安部對當年全國的信息網絡安全狀況做了一個調查,從調查結果中我們能看出來,一些重大的信息網絡安全事件產生的主要原因有以下幾點:中了計算機病毒,網絡遭到惡意攻擊,收到不正常的電子郵件,網頁被惡意修改等。同年,艾瑞市場咨詢對當年中國個人網絡安全發布了一份分析報告,從報告上的相關數據我們可以看出來,很多專業的制造網絡病毒的人,依靠木馬程序比如盜號程序、黑客程序和下載程序等來獲得非法的經濟收益,他們的目標不僅是網銀里面的錢,還有一些虛擬財產。想要完全解決掉網絡信息安全問題這是不可能的事情,理論和技術都實現不了。所以我們要尋找新的解決方法,有人開始設想,能不能把其他技術和網絡信息安全防范技術有機的結合起來,參考以前的一些數據,來提高網絡信息安全防范的手段呢?隨后這種設想變成了現實,產生了Web數據挖掘技術,這種技術對于提升網絡信息安全防范的效果是非常有用的。

2 提升網絡信息安全防范績效的關鍵技術:Web數據挖掘技術

數據挖掘主要說的是從非常多的亂七八糟的、沒有處理過的數據里面挑選出人們沒有發現但是非常有用的一些內容和信息。然而以往用來挖掘數據的辦法有很多的問題,只能對那些同質、同構的數據做出分析,互聯網上的信息很多都是異構的文本信息、日志信息、超鏈接等數量非常龐大,用以前的方法很難達到目的。人們開始研究新的技術來解決這個問題,把以前的數據挖掘技術和Web結合在一起,從而產生了現在的技術——Web數據挖掘技術。Web數據挖掘其實就是從Web文檔和Web活動中把那些潛在的有用模式和隱藏的信息挑選出來。它的主要目的是為了從Web上挖掘有用的信息,把各項技術和Web有機結合起來。

3 Web數據挖掘的技術方法

想要防范好網絡信息安全,最重要的是借助Web數據挖掘把那些不正常的數據挖掘出來,從而判斷出這些數據哪些是正常的行為產生的,哪些可能對信息安全造成威脅,從而做好網絡信息安全的防范工作。

在這個模型里面,用到的Web數據挖掘技術方法主要有下面幾種。

3.1關聯規則

它是對數據庫立面的各項數據之間的關系作出一個總結,換句話說,如果這項數據出現在一個事物中,那么另一個數據可能也會出現在這里,主要說的就是那些隱藏的數據相互之間的一些聯系。要是積累了很多的安全事件,這時候就有可能挖掘出某些事件之間的關系。舉個例子來說,挖掘能夠正確的分析出網絡的正常訪問和不正常的訪問情況,然后第一時間對不正常的訪問情況做出處理。

3.2序列模式

序列模式挖掘技術的含義是在一些時間上、有一定順序的事物里面找出了一組數據項,然后會發現另一數據項也出現了的內部事務模式,換句話說就是挖掘出來的會話集之間有時間序列關系的模式,然后會產生一組根據時間來排列的會話。序列模式挖掘能夠幫助我們更好的了解到審計安全事件的時間序列的產生原理,我們得到的時間標準模型也能夠用來判斷網絡事件是不是正常時間,推動了網絡信息安全防范模型建設。

3.3分類分析

分類就是把一組個體按照一定的要求和標準分成幾個大類。分類主要是為了借助各種方法比如統計、機器學習方法等來建設一個分類模型,建好之后把數據庫里面的數據映射歸到一個特殊的分類中去,利用這個分類的標準來把其他數據庫里面的數據分出類別。舉個例子來說,在檢測入侵程序的時候,能夠收集到非常多的用戶或程序數據,根據分類的方法來算出一個分類器,可就能夠對以后產生的一些數據是不是正常做出正確的判斷。

3.4聚類分析

聚類分析實際上就是把一個數據集分成幾個不同的組,在同一個分組的點相互之間有一定的相似之處,和其它組里面的點有很大的不同。聚類能夠對全部的區域進行識別,不管是集中的區域還是分散的區域,對全局的分布和數據之間的聯系有一個全面的了解。在挖掘Web數據的過程中,聚類分析法能夠把有相似訪問方法的用戶放在一起,為以后來防范網絡信息安全起到一定的積極作用。

3.5異類分析

異類分析又叫做孤立點分析。孤立點主要指的是那些和大數據群分離的數據,就是不符合大眾模式和行為的那些數據。孤立點分析有孤立點的發現和分析這兩部分的內容,孤立點的發現一般能夠讓人們發現一些以前沒有看到的數據信息;孤立點的分析可能會發現一些非常有價值的數據信息。從一些研究中我們能夠看出來,在網絡安全管理這一方面,孤立點挖掘是一項非常有發展潛力的技術。舉個例子來說,入侵檢測其實就是對數據的分析,比正常的行為少的入侵行為就是孤立點。所以運用孤立點挖掘技術來檢測沒有發現的未知入侵行為是非常有效的。

3.6路徑分析

路徑分析其實是一種尋找頻繁訪問路徑的方法,它的主要工作原理是對Web服務器的日志文件里面的訪問站點的次數進行研究,從而找到頻繁訪問的路徑。在防范網絡信息安全的時候,我們可以把信息訪問路徑看做是由多個信息節點和信息鏈路組成的一條通路,對路上的關鍵點做出研究能夠找到并發現這些點存在的問題。

3.7統計分析

從Web站點中挑選知識最常用的方法就是統計分析法,對會話文件中的各個維度都能做出頻度、平均值的統計分析。統計分析一般會用在對檢測入侵的系統里面,它發展的比較完備,能夠準確的發現和正?;顒佑兄黠@不同的活動,界定成異?;顒?。

4 結語

綜上所述,本文首先對我國目前存在的網絡信息安全問題做出了介紹,然后讓我們對于防范網絡信息安全的關鍵——Web數據挖掘技術有了一個充分的了解。Web數據挖掘其實就是從Web文檔和Web活動中把那些潛在的有用模式和隱藏的信息挑選出來。而Web數據挖掘技術方法有七個大類:關聯規則、序列模式、分類分析、聚類分析、異類分析、路徑分析、統計分析。通過這七種web數據挖掘方法,我們能夠發現那些異常的數據,及時的做出處理。這種技術對于提升網絡信息安全防范的效果有著積極的意義。

[1]唐立江.數據挖掘技術在消防滅火救援中的應用[J].電子技術與軟件工程,2017.

[2]方旭,朱敏,王保琴,肖春霞.數據挖掘技術在軍車使用情況判定中的應用[J].軟件,2017.

[3]李翼,孟莉.大數據條件下的數據挖掘技術及應用[J]. 電子技術與軟件工程,2017.

猜你喜歡
數據挖掘信息安全分析
探討人工智能與數據挖掘發展趨勢
隱蔽失效適航要求符合性驗證分析
數據挖掘技術在打擊倒賣OBU逃費中的應用淺析
信息安全專業人才培養探索與實踐
電力系統不平衡分析
保護信息安全要滴水不漏
高校信息安全防護
電力系統及其自動化發展趨勢分析
一種基于Hadoop的大數據挖掘云服務及應用
自動化博覽(2014年8期)2014-02-28
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合