?

用戶消費行為中選擇不明確性挖掘

2017-07-05 13:27韓民琦
關鍵詞:明確性消費行為小節

韓民琦

用戶消費行為中選擇不明確性挖掘

韓民琦

以數據驅動,挖掘消費者在消費過程中的不明確性。在以數據為驅動的視角下提出自動挖掘不明確性的模型。給出每個行為小節觀測到的不明確性的定量化方式?;谶@些所觀測定量化的不明確性,通過一個概率圖模型同時習得潛在消費者的不明確性指數和商品組合中的不明確性指數。分析這類消費者行為中的選擇不明確性挖掘在很多方面的潛在應用價值,比如競爭性商品的檢測、個性化商品推薦。

消費者行為;概率圖模型;個性化推薦;概率矩陣分解

近年來,零售業信息系統的變革使得我們能收集到大量的消費者消費行為記錄。這些富含大量有用信息的消費行為日志使得我們有機會挖掘出更加個性化的消費者信息和消費者個人喜好,也因此能發展更好的個性化服務,比如個性化商品推薦。

沿著這個思路,分析并理解消費者的決策過程越發重要。然后,隨著消費者可選擇的商品數量快速增加,消費者做出決策越來越困難。越來越多的人遭受到猶豫不定的困擾——即消費者在競爭性商品中不能做出快速果斷的選擇。比如我們也許在微博、朋友圈或者其他社交網絡上見過好友在幾個類似商品中間不能做出選擇,于是發動態尋求朋友建議和幫助,最終做出選擇[1]。在日常生活中我們也可以發現商品選擇中的猶豫不定確實是一個很常見的問題。同時,每一次對消費者在消費過程中猶豫的分析都能得到這個消費者的一些特征(比如自信或者沮喪),以及消費者對商品的認知、評價。因此,無論在營銷、管理和心理學領域對個人猶豫不定的理解都是個重要的研究主題。很多研究者已經對很多相關問題投入大量研究,比如對猶豫不定的衡量、產生猶豫不定的原因以及如何緩解做出決策的困難[2-3]。

盡管以往的研究意義重大,也有很多重要的發現,但是目前科學地從字義上對猶豫不定的理解還是很有限,甚至還沒有對猶豫不定作出清晰的定義。為了調查消費者行為中猶豫不定的現象,通常由心理學研究者或者社會學研究人員設計一些問卷,包含類似“我能快速做出決策”的問題或者選項,然后由個人對這些問題的回答來衡量他們猶豫不定的程度,在本次研究中是指不明確性指數。這些基于測量視角的調查問卷通常不僅有很大程度的主觀性,對于被調查人員來說也十分繁瑣,進一步說基于調查問卷得出的結論可能包含較大的偏見,甚至是誤導性的。在沒有人工干預時,通過消費者日常的行為日志來自動挖掘不明確,結果會更加精準,即完全以數據為驅動的方式挖掘不明確。對于這個目標,有以下幾個問題需要解決。如何在沒有統一的標準或問題的情況下有效定義所觀測的不明確性程度?如何同時精準地挖掘出潛在的和個性化的每個人和商品之間的不明確性指數?如何利用挖掘出的不明確性來提供更好的服務?

為了解決以上提到的幾個問題,筆者在以數據為驅動的視角下提出自動挖掘不明確性的模型。第一,分析了消費者在網絡上的消費行為,并且提出衡量在每一個消費行為小節中所觀測到的不確定性指數的基本定義?;诂F有的其他領域對消費者行為中猶豫不定的理解和數據的有效性,本次研究中的不明確性定義主要考慮3個主要特征,比如一個行為小節中的操作長度。第二,以一個概率圖模型,能同時習得消費者和商品之間的不明確性指數[4]。以這種方式,每個消費者和每個商品之間的不確定性需要被量化。第三,說明挖掘出的不明確性有很多潛在的應用。比如,對于每個猶豫不定的消費者,為了減少其選擇成本,可以推薦給他可能購買的商品組合?;蛘?,對于零售商,可以發掘出相互具有競爭性的商品。本次研究的主要工作如下:

以數據為驅動的方式來定義人的猶豫不定,數據源于百萬網絡消費者的行為日志。

提出了一個在沒有人工干預的情況下自動量化每個行為操作小節的不明確性指數的方法和同時計算用戶和商品之間的不明確性指數的基本框架。這個框架不僅僅只限用于電子商務領域,同樣適用于其他領域的類似問題。

深入分析對于被挖掘出的不明確性可能的應用。不明確性挖掘可以應用于為零售商發現并提供競爭商品的信息,預測消費者的購買決策,為消費者提供更好的推薦服務。

一、相關論文綜述

本節回顧以往對決策和決策的制定、心理學、管理學和市場營銷的研究,總結目前對消費者行為中猶豫不定的理解。

第一階段對猶豫不定研究的主要方向在基于行為特征來衡量消費行為的不明確性。事實上,目前科學地從字義上對猶豫不定的理解還是很有限,甚至還沒有對猶豫不定的清晰定義。不過,幾個對于猶豫不定基本尺度的定義已經被討論過,這些框架可被用于研究猶豫不定的特殊特征。這些尺度包括Frost and Shows’ Indecisiveness Scale(FIS), Germeijs and De Boeck’ Indecisiveness Scale(GIS),調查問卷中的問題通常由心理學研究者或者社會學研究者設計。比如,問題可能是“我對自己做出的決定十分確定”或者 “在做出決定之前我要花很長時間去權衡利弊”,每個問題都被作為一種論證,表明受試者對相應問題的一致程度。這些不明確性的程度的特性(比如它們的準確性)由一些經驗性結論來論證,通常這些經驗性結論由心理計量表測試得到[5-6]。

在第二階段,研究的主要方向集中在產生猶豫不定的原因(比如個體的認知因素)。比如,在如今競爭越發激烈的市場下,消費者面臨越來越多的可選商品,有必要分析可供的選擇過多和消費行為猶豫不定之間的關系。通過分析以往的研究發現,由于可選商品數量的不斷增加而導致消費者選擇困難的說法并不十分靠得住。做出一個簡單決策困難與否并不依賴于選擇本身,更多地和決策制定者的心理狀態有關。有學者提出做出選擇的難易程度根據做出選擇的人的心理關注點的變化而變化,比如當為自己做決定時,人們心理狀態常常是防御性心理,而為他人出決定時,常常是促進性心理。但是,也有學者發現可選商品的數量對消費者的判斷和決策過程有影響。還有學者研究了可選商品的數量和其他因素(比如決策目標)的影響,發現這些因素可能會導致消費者的決策不明確。E.Rassin等人發現個體之間的差異(比如性別的不同)和決策帶來的風險都會對消費行為中的猶豫不定有較大影響[5]。近來,R.Dhar等人基于雙系統理論提出了一個全面理解喜好形成過程的框架[6]。

在發現消費者猶豫不定行為的原因之后,研究者在第三階段試著去研究減輕決策制定困難的方法。不同個體之間猶豫不定的程度有很大差別。對于同一個個體來說,在不同時間和地點,猶豫不定的程度相對穩定,在沒有特殊的訓練和干預下,很難使一個優柔寡斷的人變得果斷。改變決策行為是一個更為現實的嘗試。沿著這個思路,改進推薦系統對緩解信息過載的情況有很大幫助,比如改變商品分類或者提供推薦標記(比如“銷量最高”)。如果推薦的商品依然十分相似,提升商品潛在特征的多樣化能減輕決策的苦難。再充分、理性的決策的制定也是基于優先情緒加工的,改變決策制定者的決策行為十分困難。

除了不明確性之外,消費者在消費過程中仍然表現出幾種類型的心理特征。比如,對新穎事物的尋找、興趣的擴張以及一些偶然下的發現,這些都會給消費者帶來興奮和滿足感。不斷加深對這些個體行為的理解,不僅對科學研究意義重大,而且對商業的成功也十分重要。比如,引導消費者行為和提供更加準確的個性化推薦。近年來隨著信息技術的快速發展,越來越多的消費者數據能被收集到,進行更加深度的研究也變得越來越容易。

二、不明確性挖掘

提出基于消費者行為的日志數據,挖掘消費者行為中的不明確性。首先,理清消費者行為記錄的一般格式。其次,介紹量化所觀測的不明確性的方式。然后,提出得到潛在不明確性指數的模型方法。最后,分析其潛在的應用。

(一)數據的預處理

我們的目標在于基于消費者在線消費行為記錄自動地習得消費者和各商品之間的不明確性指數。消費者在線消費行為記錄格式例子如表1所示。消費者所有對商品的操作,包括購買操作以及在作決定過程中涉及(比如點擊、收藏、加入購物車等)的都被記錄在內。對這些數據進行預處理,將單個消費者對商品的操作分為不同小節,比如將在1個小時內沒有操作的部分分割為單獨的小節。表2列出一些操作小節的例子,其中的“商品束”的定義如下:

定義1:商品束。給定一個消費者和他的操作小節,其操作小節對應的商品組合由操作小節里所有商品的子集構成。即一個操作小節通常有多個商品組合,比如,在表2小節,其商品操作順序為 {a,b,c, a },對應的商品束為

由于空間限制,表2不同小節只給出最大的商品束。因此,商品束越大,表示消費者在這一小節瀏覽過的商品數量越多。如果某幾個商品常常出現在不同的操作小節里面,那么這些商品會組成頻繁商品束,這些頻繁商品束可以由頻繁模式挖掘算法得到。通常來說,在一個頻繁商品束里的商品要么為競爭關系,要么為互補關系。事實上,商品之間的互補關系在市場營銷領域有大量的研究。比如,在亞馬遜上,那些經常被一起購買的商品會被一起推薦給消費者。在消費者操作小節中的商品更有可能是競爭關系,問題是如何量化這些商品之間的競爭關系。從表2我們可以看到,消費者U1在選擇C1類的商品時有很強的不明確性,而消費者U2在做決定時更為果斷。不失一般性,我們只考慮每個操作小節中同一分類的商品,并不對消費者操作作不同類型的區分,即將點擊和收藏都視為用戶操作,不作進一步的區分。表3為論文中所涉及到的符號注釋。

表1 消費者在線消費行為記錄格式示例

表2 消費者操作小節示例

表3 符號注釋

(二)不明確性的量化

本小節給出對用戶操作小節不明確性指數量化的正式定義。

根據心理學中的定義,“猶豫不定”意味著花費更長時間作出決策以及搜尋更多的相關信息?;诂F有對“猶豫不定”的理解以及現有可獲得的在線消費者行為數據,我們主要基于下面4個假設關注每個行為小節中的4個特征值。

(1)在一個行為小節中,用戶對商品的操作次數越多,相應的不明確性指數越高。

(2)對不同商品的操作次數分布越均勻,不明確性指數越高。

(3)在不同商品之間操作的轉變越多,即用戶重復考慮得越多,不明確性指數也越高。

(4)在每個商品上面所花的時間越均勻,即花費在每個商品上的時間越多,不明確性指數越高?;ㄙM在每個商品的時間為從此次操作到下次操作的時間間隔的總和。

基于以上假設,我可以定量化每個行為小節的不明確性為其特征值的函數,具體如下。

定義2:定量化的選擇不明確性。給定一個消費者U1和這個消費者的一個操作行為小節Sj,相應的商品束為Bk。我們將每個小節中的“猶豫不定”程度定量化為:

式中:F(·)可以是任何函數;Length(Sj)表示 Sj中操作次 數 的 對 數 即 Log(操 作 次 數 );EntropyOP(Sj)為用來衡量對不同商品操作次數的分布,其中Pj(a)表示商品a在Sj小節中出現的概率;Trans(Sj)表示轉移操作在不同商品之間的次數除以總的轉移操作次數;EntropyTIME(Sj)為用來衡量對不同商品操作時間的分布,其中Ptj(a)表示花在商品a的時間的比例。 比如,表 2 中 S1的 Length(Sj),EntropyOP(Sj),Trans(Sj)分別為 lg(10),(-0.4*lg(0.4)-0.6*lg(0.6))/lg(2),5/9。 假設 EntropyTIME(Sj)中 Ptj(a)和 Ptj(b)為0.2 和 0.8,則對應值為-0.2*lg(0.2)-0.8*lg(0.8)。

如果 F(Length(Sj),EntropyOP(Sj),Trans(Sj),EntropyTIME(Sj))表示四者的相乘即 Length(Sj)*EntropyOP(Sj)*Trans(Sj)*EntropyTIME(Sj),則 S1不明確性指數大約為0.035 3。為了平衡以上4種特征值的權重,我們在使用各項特征值之前可以規范化使得它們的值在[0,1]之內。以這種方式,只要消費者作出決策的過程被記錄下來,我們就可以定量化消費者“猶豫不定”的程度,即本文中不明確性指數越高則表示“猶豫不定”的程度越高。據以上定義,不明確性指數值域可能會較大,我們可以使用最小—最大規范化使其值在[0,1]之內。

(三)不明確性挖掘

我們通過一個概率圖模型來同時獲得消費者和商品間的不明確性指數。

首先,很有必要弄明白每個行為小節中所觀測到的不明確性背后的原因。在本次研究中,主要考慮2種觀測不到的原因:消費者因素和商品因素。筆者使用“不明確性指數”來表示這些因素。即,不明確性指數越高的消費者(即難以作出決策的性格)在其操作小節所觀測到的“猶豫不定”程度越高,不明確性指數越高的商品束(即有些商品本身很難選擇,比如三星手機和蘋果手機)也同樣對導致觀測到的“猶豫不定”的程度越高。

本次研究中,我們使用Yi和來分別表示消費者Ui和操作小節Sj的不明確性指數。其中操作小節Sj的不明確性指數由Sj中的商品束決定。Sj中的商品束為比如,表2中S4對應的商品束為換句話說,在商品a,b,c中作出選擇或者對他們的對比導致我們在操作小節中所觀測到的“猶豫不定”的程度。 因此,Sj的不明確性指數取決于 SB(j)中所有商品束的不明確性指數。即:

于是,對于所觀測到的所有操作小節的不明確性指數DS的條件概率為:

圖1 不明確性指數的概率圖模型

最大化上述概率,可以通過已有的所觀測到的DS來估計出Y和ZB。為了方便計算對后驗概率取對數:

由于后驗概率中的方差都是預設好的常數,所以每1項中只有第2項與待優化的Y和ZB有關,所以最大化上述對數后驗概率,等價于最小化如下函數:

我們把對不明確性學習的概率矩陣分解模型稱為IPMF模型。的確,作為概率圖模型的1種[7],我們的模型和以往的有些模型很相似,比如RSTE模型[8]、IMF 模型和 SocialMF 模型[9]。 然而,IPMF 模型仍然和傳統的一些模型不同。比如,在IPMF模型中,有3種潛在因素,其中每個小節的影響因素Bj(pt)是由其內在小部分決定的;而RSTE模型和SocialMF模型都只有2種潛在因素。這意味著其中內在的推論過程有很大的不同,并且本模型更加適用于不同的背景和領域。

最后,為了更好地解釋,我們故意簡化了模型,比如,把不明確性指數只作為標量。事實上,不明確性指數可以作為1個向量,其中每1個實數可以作為消費者對商品的其中1個方面的不明確性指數,比如對價格方面的不明確性指數。并且,我們目前只針對2個商品以上的商品束,但我們的模型同樣適用于單一商品的商品束。

三、潛在應用

不明確性挖掘可以有很多潛在的應用,比如對于消費者“猶豫不定”的分析有助于更好地理解消費者的喜好。由于消費者的很多特征無法獲得,比如年紀和性別,我們主要針對2種應用,即競爭商品性的檢測和商品束的推薦。

(一)競爭性商品的檢測

在現有的營銷策略中,為了得到更好的銷售量,那些經常被一起購買的商品會被推薦給消費者。然而,在本次研究中,消費者同一行為小節中一起出現的商品更可能是競爭性的。換句話說,本次研究所呈現的對不明確性的挖掘能為網絡零售商提供一種檢測競爭性商品的方法。詳細來說,我們可以運用IPMF模型來獲得頻繁商品束以及這些商品束的不明確性指數。假設商品a是某零售商提供的一種商品,那么那些和商品a在同一商品束里的商品就能被定義為商品a的競爭性商品,尤其是哪些有非常大的不明確性指數的商品。這樣就能以數據驅動的方式來獲得競爭性商品的信息,其結果能幫助零售商更好地完善自己的商品和制定營銷策略。

(二)商品個性化推薦

推薦系統的目標在于在任何時候和任何地方準確地把商品推薦給需要它的消費者。然而,當消費者已經受到“猶豫不定”困擾的時候,傳統的推薦算法看起來很難起到作用。首先,如果推薦的商品類似于消費者正在瀏覽的商品,會使得消費者更難作出購買決策。其次,如果推薦的商品和當前瀏覽的商品無關,沒有任何類似,消費者將毫無興趣,因為此推薦已經超出她當前所關心的內容[10]。

盡管如此,當消費者在“猶豫不定”的時候依然需要推薦服務。假設消費者目前正在瀏覽商品如果我們能預測其最終的購買決策會在商品束} 中,即要么買a要么買b,那么我們就可以只推薦a,b給此消費者,以此來減少消費者所做的無用操作。從消費者的視角來說,他們會有更多的精力來作出最終的購買決策。從推薦服務提供者的視角來看,他們可以引導消費者作出對的選擇,即通過提供選擇過濾來減輕消費者“猶豫不定”的程度使得消費者會有更高的概率作出最終的購買決策,服務提供者可因此獲得更高的利潤。然而,傳統推薦算法并不能完成以上分析的任務。為此,本次研究提出一個鼓勵消費者消費的商品推薦概念,即當消費者在某幾個商品“猶豫不定”時,我們把消費者最可能購買的商品推薦給她。對于消費者Ui的其中一個行為小節 Sj,其所要推薦的商品束為 SB(j),而這些商品束的商品數量通常比行為小節中商品數量少得多,也因此能減少消費者的選擇成本,以此來使得消費者更容易作出購買決策。

基于以下假設,我們來解釋基于不明確性挖掘的商品推薦。

對于某一消費者的一個行為小節,此行為小節由幾個商品束組成,商品束的不明確性指數越高,消費者最終購買的商品出現在這個商品束里面的概率越大。

換言之,消費者的購買概率和不明確性指數的值有正相關關系。例如,行為小節中有商品{a,b,c,d } ,其中頻繁商品束為其不明確性指數分別為0.8、0.2、0.6和0.3,則其消費大概率在{a,b,c } 中,則我們可以把d去除而把a,b,c推薦,來緩解消費者的“猶豫不定”。

四、總結與分析

本次研究給出消費者行為中選擇不明確性的定量化方式?;谶@些所觀測到的定量化的不明確性,我們提出一種模型同時習得潛在的消費者的不明確性指數和商品組合中不明確性指數。由這些所得到的不明確性指數,我們分析這類消費者行為中的選擇不明確性挖掘在很多方面有潛在的應用價值,比如競爭性商品的檢測、個性化商品推薦。本次研究相比以往模型在消費行為中選擇不明確新的定量化方式上有所改進,使得量化后的不明確性指數和實際情況更加匹配。不明確性挖掘可以應用于為零售商發現并提供競爭商品的信息,以及預測消費者的購買決策,為消費者提供給更好的推薦服務。

[1]王升升,趙海燕,陳慶奎,曹健.基于社交標簽和社交信任的概率矩陣分解推薦算法[J].小型微型計算機系統,2016(5).

[2]曹佳丹,邵琰芳,李飛巧.猶豫不決者在決策中的風險偏好[J].現代商業,2010(27).

[3]RASSIN E,MURIS P.Indecisiveness and the interpretation of ambiguous situations[J].Personality and individual differences, 2005(7).

[4]劉維湘,鄭南寧,游屈波.非負矩陣分解及其在模式識別中的應用[J].科學通報,2006(3).

[5]RASSIN E,MURIS P.To be or not to be indecisive:Gender differences, correlations with obsessive compulsive complaints,and behavioural manifestation[J].Personality and individual differences, 2005(5).

[6]DHAR R,GORLIN M.A dual-system framework to understand preference construction processes in choice[J].Journal of consumer psychology, 2013(4).

[7]程強,陳峰,董建武,徐文立.概率圖模型中的變分近似推理方法[J].自動化學報,2012(11).

[8]MA H,KING I, LYU M R.Learning to recommend with social trust ensemble[C].Athens:Proceedings of the 32nd international ACM SIGIR conference on Research and development in information retrieval,2009.

[9]JAMALI M,ESTER M.A matrix factorization technique with trust propagation for recommendation in social networks[C].Athens:Proceedings of the fourth ACM conference on recommender systems,2010.

[10]孫光福,吳樂,劉淇,朱琛,陳恩紅.基于時序行為的協同過濾推薦算法[J].軟件學報,2013(11).

(編輯:唐龍)

F064.1

:A

:1673-1999(2017)06-0039-05

韓民琦(1993—),男,安徽財經大學管理科學與工程學院2015級在讀碩士研究生,研究方向為數據庫系統與數據處理。

2017-03-20

2016年安徽財經大學研究生科研創新基金項目“用戶消費行為中選擇不明確性分析——以天貓數據為例”(ACYC2016163)。

猜你喜歡
明確性消費行為小節
羌族薩朗舞歌巴茸的音樂分析
——以羌族舞歌《葉忍》為例
快把我哥帶走
德沃夏克
——《幽默曲》賞析
不明確的刑法明確性原則
“九零后”大學生消費行為誤區和疏導方法
淺析花卉市場中的消費行為
李斯特《匈牙利狂想曲第十一首》音樂分析
談初中歷史課堂作業的設計
淺析當代大學生消費行為
基于大學生消費行為的團購網站建設
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合