?

一種基于用戶投資偏好與產品特征的P2P網貸個性化推薦算法

2017-06-01 11:29周瓊曲曉威陳曦孫雨姚福賓翟睿峰
關鍵詞:網貸聚類個性化

周瓊,曲曉威,陳曦,孫雨,姚福賓,翟睿峰

(1.長春理工大學 計算機科學技術學院,長春 130022;2.長春市萬易科技有限公司,長春 130000)

一種基于用戶投資偏好與產品特征的P2P網貸個性化推薦算法

周瓊1,曲曉威2,陳曦1,孫雨1,姚福賓1,翟睿峰1

(1.長春理工大學 計算機科學技術學院,長春 130022;2.長春市萬易科技有限公司,長春 130000)

互聯網金融的蓬勃發展,在將普惠金融的實惠帶給投資者的同時,也因理財產品的多樣化,給投資者帶來了挑選適合自己的網貸產品的困擾。鑒于此,系統結合P2P網貸平臺投資者的個人投資偏好和平臺產品的特征,設計了一種基于用戶賬戶持續時間、活躍度及投資偏好的P2P網貸個性化推薦算法,以節約投資者決策時間,加快平臺資金籌集進度。

用戶投資偏好;產品特征;P2P網貸;個性化推薦

互聯網技術的日益成熟,帶來了其應用領域的不斷拓展,傳統金融也搭互聯網的快車產生了P2P網貸、第三方支付、眾籌等網絡金融模式,其中P2P貸在規模和交易量上都占據了突出優勢。在P2P網貸快速發展的同時,互聯網本身的信息過載問題也日益凸顯。同時,由于P2P網貸平臺與傳統電子商務的消費特性不同,用戶在選擇產品時需要綜合考慮投資收益率、風險等多方面因素,如何根據用戶的投資偏好與產品特征,為其提供高質量的、個性化的推薦產品是P2P網貸平臺需要解決的問題。

典型的推薦系統基于用戶集合、商品集合以及用戶對所購商品評價集合進行構建,推薦的目標是根據歷史數據對未來的選擇進行預測,輔助用戶在盡可能少的時間內做出決策選擇。在實際應用中,常將評價值按從高到底進行排序,把評價值高的k個商品推薦給用戶。

本文結合對產品特征、用戶基本特征與用戶投資偏好進行分類,根據用戶賬戶持續時間與活躍度,研究按照用戶分類與投資偏好的P2P網貸個性化推薦算法。

1 推薦算法概述

推薦算法是通過歷史行為,推測出未來可能的選擇傾向的一種方法。目前有基于內容、關聯規則、效用、協同過濾、知識、組合等多種互聯網主流推薦算法,這些算法都是借助大數據相關技術對用戶和項目/產品相關數據進行深入分析,挖掘用戶行為模式和喜好,進而預測其未來的可能選擇,為其提供個性化的推薦。個性化推薦算法通常包括學習和使用兩個階段,在學習過程中對原始數據進行挖掘分析并建立相應算法推薦模型,該模型可用于使用階段行為預測,為用戶提供個性化推薦。

2 產品分類

選取產品的"類型"、"年華收益率"、"期限"、"起投金額"等結構化信息進行特征提取,采用K均值聚類(K-Means Clustering)方法來對產品進行分類。

K均值聚類算法分類過程如下:

(1)從產品數據樣本集中選取K(K=8,參照目前人工分類結果設定)個數據對象,并將這K個對象初始化為簇中心;

(2)計算剩下的樣本到K個簇中心的歐式距離(見公式1),將樣本劃分到距離最小的簇;

(3)在聚類結果基礎上,重新計算每個簇的中心;

(4)將中心以外的元素重新聚類;

(5)重復執行2-4,直至聚類穩定。

3 用戶特征選取

將用戶特征分為兩類:個人基本信息和用戶投資偏好。本算法選取的基本信息包括身份特征、工作特征、風險承受能力、平臺登陸情況等注冊時填報的信息和實時獲取的動態信息,投資偏好信息包括投資產品特性、投資周期、參與活動情況等歷史交易信息。個人基本信息用于對用戶進行分類,投資偏好信息用于為老用戶和活躍度較高的用戶生產產品排序進行推薦。

4 用戶投資興趣模型構建

用戶模型也稱為用戶畫像,用戶投資興趣模型是在用戶特征數據基礎上進行構建的。

分析用戶的投資偏好主要通過動態更新用戶的投資日志記錄獲取,用戶興趣模型創建受限于日志收集時間與投資交易次數,越是交易次數多的活躍用戶,推薦成功率越高;對于新用戶或者投資次數較少的用戶,按用戶分類進行產品推薦。

分析用戶投資日志記錄,按N類產品投資次數大小進行排序,得到用戶投資興趣模型。

5 產生推薦

新產品上線,該類產品在用戶投資興趣模型中排序在前3,則將該產品推薦給用戶;如產品投資所剩時間小于24小時,則向用戶投資興趣模型中排序在前5的用戶進行推薦。

6 測試結果與分析

本文從吉林省某互聯網金融平臺2016年5-10月半年的數據中隨機抽取了1300個產品與5000個用戶的數據進行了算法推薦效果驗證測試,產品采用K均值聚類方法進行分類,經過6次迭代得到了穩定的分類結果,迭代過程與結果如圖1所示。

圖1 產品聚類分類過程與結果

推薦產品與客服中心的人工推薦產品用戶最終投資情況進行了對比分析,如表1所示。

從表1可以看出,網絡推薦范圍比線下推薦范圍大,推薦成功率低,目前數值達70%以上即可滿足算法要求,這一數值可以根據平臺的要求通過調整對應參數閾值得到提高。

7 結論

本文提出了一種基于用戶投資偏好與項目特征的互聯網金融推薦算法。首先采用K均值聚類算法對產品進行分類,然后根據用戶的投資偏好,對其投資產品類型進行排序,按照特定規則為其推薦對應產品。該算法推薦結果與平臺線下推薦結果進行了成功率對比,自動推薦成功率略低于線下推薦成功率,在下一步研究中,將分析線下成功率高的因素,整理后結合到網絡自動推薦算法中,增加算法的適用性。

表1 個性化推薦算法與人工推薦算法成功率對比

[1]趙凌云.面向服務的消費者行為分析及推薦模型研究[D].濟南:山東師范大學,2014.

[2]刑春曉,高鳳榮,戰思南,等.適應用戶興趣變化的協同過濾推薦算法[J].計算機研究與發展,2007,44(2):296-301.

[3]張雨,張霞,叢楓,等.基于P2P網絡的協同過濾推薦算法的研究與實現[J].小型微型計算機系統,2006,27(3):417-421.

[4]Bell R M,Koren Y.Improved neighborhood—based col?laborative filtering[C].KDD Cup’07,San Jose,Califor?nia,USA,August 12,2007:7-14.

[5]Adomavicius G,Tuzhilin A.Context-aware recom?mender systems[M].Recommender Systems Hand?book,US:Springer,2011:217-256.

[6]趙一瀚.基于用戶行為的電子商務推薦算法研究[D].長春:吉林大學,2016.

A Kind of Personalized Recommendations Algorithm of P2P Lending According to the Customer Invest Hobby and Product Characteristic

ZHOU Qiong1,QU Xiaowei2,CHEN Xi1,SUN Yu1,YAO Fubin1,ZHAI Ruifeng1
(1.School of Computer Science and Technology,Changchun University of Science and Technolugy,Changchun 130022;2.Engineering Research Cente of Changchun Why-e Science and Technolugy Co.,Ltd.,Changchun 130000)

The booming development of Internet finance, brought the benefit of inclusive finance to investors, at the same time,also because of finance mangaing product of diversification,brought investor to choose the harassment of suiting own net loan product.Owing to this,this recommend system combines personal investment hobby of the P2 P net loan platform investor and the characteristic of the platform product and designs a kind of recommendation calculate way to lend totally winning of the platform by carrying out investor and net.

customer invest hobby;product characteristic;P2P lending;personalized recommendation

TP391

A

1672-9870(2017)02-0132-03

2017-01-14

2017吉林省科技計劃重大科技成果轉化項目

周瓊(1993-),男,碩士研究生,E-mail:15755886S3@qq.com

猜你喜歡
網貸聚類個性化
堅持個性化的寫作
基于K-means聚類的車-地無線通信場強研究
P2P網貸中的消費者權益保護
新聞的個性化寫作
網貸平臺未來亟需轉型
網貸十年:迎來“去偽存真” 時代
基于高斯混合聚類的陣列干涉SAR三維成像
上汽大通:C2B個性化定制未來
基于Spark平臺的K-means聚類算法改進及并行化實現
基于改進的遺傳算法的模糊聚類算法
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合