?

基于大數據的用戶畫像系統概述

2018-10-21 09:30許多
科技信息·下旬刊 2018年9期
關鍵詞:數據分析大數據

摘要:隨著信息技術的快速發展,人們對于網絡的應用也是越來越多,與此同時用戶所產生的數據也越來越多,用戶所產生的數據之中包含著許多的信息。如今的時代是一個大數據的時代,要求我們能夠從海量的數據之中來了解用戶、分析用戶,這對計算機技術有著一定的要求,用戶畫像技術的出現正是為了解決這一問題而出現的,通過用戶畫像技術對人體建立一個數學模型,可以通過這個模型來對用戶進行行為方面內的預測,有著很高的真實性與準確性,可以幫助人們更加直觀的了解用戶。

關鍵詞:大數據;用戶畫像技術;數據分析

隨著互聯網技術的不斷發展,人們對于網絡的應用也越來越多,在生活之中也越來越離不開網絡,人們在進行各種網絡活動時會留下痕跡,也會產生大量的數據,應用用戶畫像技術就可以對這些數據進行整理分析,通過這些數據可以建立一個模型,來模擬用戶的消費習慣以及生活習慣等各方面的情況,這對于了解消費者有著極大的幫助。根據用戶畫像系統可以了解消費者的特征,包括行為特征,社交特征等多方面的特征。用戶畫像系統有著很大的發展前景,在學術界和產業界都有著很大的熱度,而且通過對大數據的應用可以更加準確真實的建立起消費者的消費模型。用戶畫像的建立主要是通過預處理、模型形成、系統評測和實際應用這幾個過程來建立的。通過大數據的應用為網絡管理,輿論控制、群體細分等方面提供支持,這對產業的發展有著非常重要的意義。

一、用戶畫像概述

用戶畫像就是對用戶信息的一種描述,對用戶信息的整理、聚集形成一個標簽,通過許多的標簽來對用戶進行定義、刻畫出用戶的特點。用戶畫像的工作目的就是描述客戶,方便人們理解和利用計算機處理。用戶畫像是通過建立一個與用戶相關的數學模型,然后通過這個模型來解釋描述預測用戶的行為特征和生活習慣。用戶畫像系統可以將用戶的需求與相關的產品進行聯系,這就達到了產品定位的功能,指導顧客心中所想,不僅是提高了服務質量還對于產業的發展有著極大的促進作用。用戶畫像系統可以通過用戶在進行網絡活動時所產生的大量的數據來進行用戶需求的預測,然后相關的公司可以通過這些需求來生產產品,滿足不同的用戶的個性化需求。通過對用戶信息的發掘可以建立起每個用戶的特征從而來達到商業目的。用戶畫像的核心工作是建立標簽,通過這些標簽來描述用戶的個性化特征,發掘出用戶的興趣愛好、習慣特點等多方面的信息。相關的企業通過應用用戶畫像系統能夠有效的對顧客需求進行定位,這對于服務行業的發展有著非常重要的意義。

二、基于大數據的用戶畫像方法

2.1樣本標注

由于樣本有著數量巨大的特點,所以在進行樣本標注的工作時,一般的是采用半自動半人工的方法來進行的,也就是人工標注與自動標注相結合。自動標注的方式也有著不同,其中一種自動標注的方法是根據樣本中的一些特征或者是關鍵詞來進行標注。而另一種標注方法則是利用半監督的方式首先對少量的樣本進行標注,然后對沒有進行標注的樣本進行分類,主要是通過self-training(自訓練算法),generative models生成模型,SVMs半監督支持向量機,graph-basedmethods圖論方法,multiview learing多視角算法等,來進行分類。

2.2數據整理

人們在進行網絡活動時會留下很多的痕跡,會產生大量的數據,我們需要對這些數據進行收集、整理、分類,這樣才能夠對這些數據進行利用,之后根據用戶畫像系統技術來建立相關的模型,數據的收集與整理也需要用到其他的軟件技術,例如通過Sqoop 導入 HDFS或者是也可以用代碼來實 現,比 如 Spark 的 JDBC 連 接 傳統數據庫進行數據的 Cache還可以通過將數據寫入本地文件,然后通過 Spark SQL的load 或者Hive的export等方式導入HDFS,之后方便于用戶畫像系統的應用。

2.3面向應用

通過數據整理以及相關的數據平臺的計算,可以生成一個有關于用戶信息標簽的表格。那么有關的前臺就可以通過對表表格進行相關的操作來進行用戶信息的收集與改變,這對于前臺的操作業務有著極大的便利性,例如前臺操作可以在一定的范圍內對相關的客戶進行篩選工作,然后與后臺的數據庫相連接這樣就可以簡單方便的得到篩選范圍內的用戶信息。這里就是通過 JDBC 的方式連接 Spark 的 Thrift Server,通過 集 群 進 行 HDFS 上 的 大 寬 表 的 運算求 COUNT。需要注意的是,很多SQL 聚合函數以及多表關聯相當于Hadoop 的 Map Reduce 的 Shuffle,很容易造成內存溢出,這樣便可以定位相應的客戶數量,從而進行客戶群、標簽的分析,產品的策略匹配從而精準營銷。

三、大數據用戶畫像的應用

隨著互聯技術的快速發展出現了很多的網上應用,這些應用軟件不僅僅有著娛樂的功能還給人們的生活帶來了極大的便利性,例如微博的出現,微博上有著大量的活躍用戶,而這些用戶的在微博上進行活動就會產生大量的數據信息,可以利用微博來進行用戶系統技術的研究。從微博的用戶畫像研究中發現,每一個微博用戶都是一個信息節點,每一個用戶都可以進行信息的產生,傳播,發布等行為。但是其中只有一小部分用戶是屬于優質節點,他們產生優質的信息,并通過微博這網絡來達到傳播的目的,他們屬于能力節點,而在微博中其他的絕大部分用戶都是屬于消費節點,他們不產生或者是產生的信息很少或者是產生的信息質量不佳,他們的主要活動就是對能力節點產生的信息進行搬運傳播。而在網絡中優質的能力節點就可以利用信息的傳播來產生影響,打造自己的品牌,這會進一步的提高自身的影響力,而這種信息的傳播方式也對于挖掘消費節點的興趣有著很大的幫助,也會進一步的提高其對這種類型的信息進行消費,提升節點的活躍性。所以通過用戶畫像的描述可以確定一些話題,通過這種話題將感興趣的人聚集到一起,這樣在對這類人有目的的進行推銷工作,可以更加的準確,達到精準銷售。

四、結束語

用戶對企業來說,是企業發展的根本,能否抓住用戶決定著企業的未來發展,所以企業要想辦法來了解并滿足用戶的需求,現在隨著網絡技術的快速發展,人們對于網絡的應用越來越多隨之產生的數據也越來越多,企業可以對這些數據進行研究來確定用戶的需求從而來促進企業自身的發展加強企業的競爭力。

參考文獻:

[1]徐璐瑤,姜增祺,黃婷婷,劉云鵬.基于大數據的用戶畫像系統概述[J].電子世界,2018(02)

[2]王憲朋.基于視頻大數據的用戶畫像構建[J].電視技術,2017,41(06)

猜你喜歡
數據分析大數據
新常態下集團公司內部審計工作研究
淺析大數據時代對企業營銷模式的影響
基于讀者到館行為數據分析的高校圖書館服務優化建議
大數據環境下基于移動客戶端的傳統媒體轉型思路
基于大數據背景下的智慧城市建設研究
數據+輿情:南方報業創新轉型提高服務能力的探索
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合