?

大數據:讓世界更加善解人意

2019-09-10 07:22樂佳
電腦報 2019年16期
關鍵詞:海量因果關系結構化

樂佳

隨著云計算、人工智能的興起,使得數據實時準確的分析成為了可能;這些都使得大數據成為了當下最熱門的科技詞語之一。那么,什么是大數據?大數據到底有多大?嚴格來講,大數據是一種涉及數據的收集、存儲、分析、處理,從而提取數據背后價值的綜合性技術,它不光包括海量的數據本身,還包括對這些數據的處理和應用。

大數據的四個V

大數據通常被認為具有如下四個特點:大量(Volume),多樣(Variety),高速(Velocity),價值(Value)。由于這四個特征的英文首字母都是“V”,所以通常被稱為大數據的“4V”特性。

大量(Volume):大量是大數據最顯著的特點,也是很多人對于大數據最直觀的感受。根據IDC發布的《數據時代2025》白皮書中的統計,2018年全球的數據量大約是33ZB,為了有一個更加直觀的理解我們做一個簡單的換算:33ZB大約是354億TB,每天大概是9700萬TB,我們現在每臺家用電腦的硬盤容量一般平均是1TB,也就是說我們每天需要用9700萬臺新的電腦來存儲我們每天產生的數據。而且隨著物聯網的興起,到2025年我們每年產生的數量預計可以達到175ZB,如下圖所示(注:圖片來源于《數據時代2025》)。

多樣(Variety):大數據的多樣性既包括數據來源的多樣性:個人計算機、平板、物聯網中的傳感器、各種智能終端等;也包括數據類型的多樣性:文檔數據、郵件數據、視頻數據、音頻數據、圖片數據以及各種信息系統產生的數據(比如:企業內部辦公系統產生的數據、財務系統產生的數據以及醫療系統產生的數據)等。我們通常會將這些數據分為結構化數據:數據間有較強的因果關系,比如剛才提到的各種信息系統產生的數據等;非結構化數據:數據間通常沒有因果關系,比如視頻、音頻、圖片數據等;半結構化數據:數據間有較弱的因果關系,比如郵件、HTML文檔數據等。

高速(Velocity):大數據的高速特性不光體現在傳播速度上,還體現在海量數據的實時處理上。大數據是通過互聯網進行傳播,所以比報紙、廣播等傳統數據載體傳播速度更快;同時,由于每時每刻都會產生海量的數據,而因為成本的關系,我們不可能將所有數據都永遠保存下來,我們通常只會保留處理和分析后那些比較重要的數據或者是最近一段時間的重要數據,因此我們需要及時對海量的實時數據進行分析和處理,從而最大限度地提高數據的利用價值,避免數據的浪費。

價值(Value):大數據的最終目標就是利用人工智能等先進技術從收集到的各種不相關的海量數據中發掘數據的規律和價值,從而幫助我們更好地對未來的趨勢和模式進行預測,為我們今后的決策提供強有力的支撐,進而幫助我們改善社會治理、提高生產效率、推進科學研究等。這也是大數據最核心的價值。

大數據的應用

目前,盡管大數據技術還處于發展的初期階段,但在我們生活和工作的各個方面或多或少都已經有了大數據的應用。相信您一定有以下的這些經歷:您最近想買一款藍牙耳機,你用手機上的購物APP對比了好幾款產品,但并未找到合您心意的產品,所以您關掉購物APP決定再考慮一下,當您再次打開購物APP時,您會發現此時您的主界面有很多藍牙耳機的推送鏈接,而且這些耳機不管是外形、價格和特點都與您之前看的那些耳機很接近,而且里面很有可能就有您最中意的藍牙耳機;再比如您是一個軍事迷,平常喜歡用手機APP看一些軍事相關的文章和新聞,所以您會發現每次您打開相同的APP,主界面里為您挑選的文章和別人APP里的不一樣,全是您喜歡的軍事題材的文章;再比如,您去銀行貸款,銀行會要求您填一張涉及個人收入、學歷等信息的表,銀行會分析并處理這張表中收集到的信息,確定您的信用值以及貸款給您的風險,從而決定是否會貸款給您。

這些都還只是大數據的簡單應用,隨著物聯網的興起,未來的世界一定是一個高度互聯的世界,大數據的使用會使得這個世界更加“善解人意”;到那時,我們要完成很多事情真的可能只需要一個眼神,余下的事情便無須操心。

猜你喜歡
海量因果關系結構化
顧麗英:小學數學結構化教學的實踐探索
借助問題情境,讓結構化教學真實發生
深度學習的單元結構化教學實踐與思考
左顧右盼 瞻前顧后 融會貫通——基于數學結構化的深度學習
原因的原因的原因不是原因
做完形填空題,需考慮的邏輯關系
探究刑法的因果關系
一個圖形所蘊含的“海量”巧題
從教材中突圍,走課內海量閱讀之路
Hadoop構建的銀行海量數據存儲系統研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合