?

淺析數據挖掘技術的應用與發展

2020-12-08 02:12夏英明
數碼設計 2020年16期
關鍵詞:技術方法數據挖掘應用

夏英明

摘要:數據挖掘自誕生之日起就成為信息產業的熱點研究領域,從大量數據中挖掘有潛在價值的信息對商務、生產、科學探索等活動具有現實價值和重要意義。隨著數據挖掘技術在不同領域的不斷深入應用,獲取有用信息的過程越來越快速、高效、便捷。

關鍵詞:數據挖掘;技術方法;應用

中圖分類號:TP311.13?? 文獻標識碼:A?? 文章編號:1672-9129(2020)16-0081-01

1 數據挖掘

數據庫系統的成功使事務處理具備了更高效便捷的工具,然而人們更希望計算機能夠對豐富的數據進行分析理解,為決策提供依據,于是數據挖掘就成為了處理信息的更高需求。數據挖掘不同于簡單的數據搜索,從多種數據源中提取關鍵性數據只是挖掘的第一步,分析這些數據表達的規則、概念、內在聯系等才是其核心目標[1]。作為一門發展極快的邊緣性學科,數據挖掘從多門其他學科領域汲取營養,借鑒經驗,也促進這些交叉學科的蓬勃發展。

2 數據挖掘技術方法

2.1統計學。統計學是利用統計模型完成數據的收集、分析、解釋和表示,一些成熟的統計學技術,如主成成分分析、聚類等已經被廣泛應用到數學、物理等科學領域。數據挖掘過程也經常利用統計學的相關理論,例如,描述統計學可以作為分析數據總體客觀規律的基礎;而借助推斷統計學可以對已知的隨機樣本數據進行建模,以樣本推斷總體,提取結論。

2.2機器學習。機器學習是計算機向人工智能轉化的主要途徑,包含決策樹、神經網絡等多種技術方法[2]。機器學習在實際應用過程中限制較少且具備自動化、可自定義等優點,因此也受到數據挖掘的重視。例如,目前已有將神將網絡用在部分疾病特征分類、識別上的醫療數據挖掘和將支持向量機用于葡萄酒品質分析的食品數據挖掘。

2.3信息檢索。信息檢索是搜索文本或多媒體信息的科學,通常以關鍵字作為主要查詢目標,使用主題模型表達一個文本文檔集詞匯表的概率分布模型,方便對文本信息的理解分析。由于數字化應用和網頁應用的快速普及,針對文本和多媒體信息的有效搜索和分析也成為數據挖掘的主要任務之一,因此信息檢索技術的集成也變得尤為重要。

2.4數據庫。大部分數據挖掘任務都涉及對大型數據集的處理,有些高要求任務更是需要挖掘能夠實時處理。很多數據庫系統已經集成了數據建模、查詢優化、存儲索引等功能,在處理相對結構化的大型數據集上有巨大優勢。因此數據挖掘可以利用數據庫的優點獲得處理大數據集的高效率和可伸縮性。

3 數據挖掘技術應用

3.1市場營銷。對于市場營銷而言,如何更好的理解顧客、市場供求、市場資源和競爭對手等背景信息至關重要,由此數據挖掘是應用在市場營銷分析層面的重要工具。舉例來說,分類挖掘可以為市場形勢、供應等方面提供依據;聚類挖掘可以劃分相似顧客,為顧客提供更優質的服務;特征挖掘分析顧客喜好,選擇性推送更符合顧客喜好的資訊或產品。

3.2工業制造。工業4.0時代的核心是智能制造,而智能制造同樣離不開數據挖掘。工業制造過程會產生大量生產、測試數據,利用數據挖掘對數據進行科學分類、統計對比,得到產品的合格率、質量特性等信息,不僅可以提升制造效率,也能保證產品優質程度,創造更大效益,推動智能制造的發展。

3.3科學研究??茖W研究的首要步驟就是從海量數據中獲取有效信息,其次要進行不斷的實驗嘗試和改進,最后要歸納、分析、總結實驗數據,可以說數據是科研工作成敗的關鍵。數據挖掘可以快速篩選、甄別有效信息為科學研究提供基礎[3],還可以對實驗數據進行不同形式的處理,剖析數據內在聯系,為科學研究的決策提供重要參考。

3.4網絡安全。對互聯網安全問題的探討自互聯網技術應用至今從未停止,而數據挖掘為非法入侵的檢測和預防提供了新的技術手段。防護過程主要針對攻擊特征和網絡異常進行檢測,數據挖掘可以根據已知數據導出分類模型、正常行為模型檢測入侵和行為異常;可以構建關聯模式挖掘網絡數據的內在聯系,選擇更有利于檢測的屬性;還可以通過流數據分析、分布式挖掘等,提供更全面的預防手段。

4 數據挖掘技術發展

4.1定向應用。最早應用數據挖掘技術的就是各類購物網站,電商平臺收集用戶搜索、瀏覽、購買等數據信息,分析用戶的購買習慣、消費水平、個人喜好,推送相關產品的廣告達到宣傳目的。隨著技術的不斷成熟,數據挖掘也會探索其他應用領域,如金融、醫療、教育、電信等。由于特定應用領域問題具有不同的特征和挖掘需求,因此數據挖掘也會針對不同應用環境開發定向的系統和工具,降低傳統技術系統的局限性。

4.2完善技術。不同的挖掘需求對數據挖掘技術的發展提出了很多極具挑戰性的研究問題,比如針對不同類型數據(時間空間數據、多媒體數據、生物醫學數據等)要不斷完善、改進挖掘技術,完成高效挖掘。此外,為了防止利用數據挖掘技術惡意侵犯個人隱私數據的行為出現,使用數據挖掘要遵循的技術規范和安全機制也需要更多關注。

4.3集成化。作為一種數據分析手段,數據挖掘還需與其他技術工具集成,提高可擴展性和更豐富的功能。例如,數據挖掘可以和數據庫、搜索引擎、云服務等主流的信息存儲、處理、計算系統耦合成統一架構,也可以內置高級用戶圖形界面等可視化工具對挖掘過程和挖掘結果進行顯示。

5 結論

數據的爆炸式增長使有效信息的獲取不能再僅僅依靠傳統數據處理技術,數據挖掘作為功能更強大的通用工具應運而生,也成功應用在多個領域,成為信息化社會不可缺少的重要技術。本文簡要介紹了數據挖掘借鑒的部分技術,列舉了數據挖掘的幾類應用領域,并對數據挖掘未來的發展趨勢進行了分析。

參考文獻:

[1]胡佳宇.數據挖掘技術應用與研究[J].信息通信,2020,(8):128-129.

[2]馬琳,董智鶴,夏嵩,等.數據挖掘技術綜述淺析[J].數字技術與應用,2019,37(10):230-231.

[3]郭偉偉,吳文臣,隋亮.大數據時代的數據挖掘技術與應用[J].數字技術與應用,2020,38(8):103-105.

猜你喜歡
技術方法數據挖掘應用
數據挖掘綜述
軟件工程領域中的異常數據挖掘算法
土木工程灌漿技術的應用實踐及實施要點分析
網球運動員雙手握拍反手擊球技術及訓練方法
現場足跡檢驗技術方法分析
淺談節約集約利用土地應用
GM(1,1)白化微分優化方程預測模型建模過程應用分析
煤礦井下坑道鉆機人機工程學應用分析
氣體分離提純應用變壓吸附技術的分析
會計與統計的比較研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合