?

基于銀行賬戶親密度網絡推理的團伙預測研究

2019-12-13 00:56呂芳陸海博王巍黃俊恒王佰玲
網絡與信息安全學報 2019年6期
關鍵詞:團伙賬戶密度

呂芳,陸海博,王巍,黃俊恒,王佰玲

基于銀行賬戶親密度網絡推理的團伙預測研究

呂芳,陸海博,王巍,黃俊恒,王佰玲

(哈爾濱工業大學(威海)計算機科學與技術學院,山東 威海 264209)

近年來,針對涉眾型非法金融活動在資金交易規律的研究引起了研究者的高度關注。為解決利用銀行交易數據進行異常賬戶犯罪團伙主動發現的問題,提出一種基于銀行賬戶非對稱親密度網絡的團伙預測方法。首先,建立銀行賬戶交易通用網絡模型,將時序交易數據嵌入網絡結構中。然后,利用節點的直接和間接交易關系信息,提出一種賬戶非對稱親密度計算方法。最終,利用節點在親密度網絡上的非對稱交互信息,得到節點的異常傾向性指標。在包含傳銷團伙的真實數據上的實驗結果表明,基于親密度網絡的團伙預測方法能有效發現潛在傳銷人員。

銀行賬戶交易網絡;親密度網絡;直接親密度;間接親密度;團伙預測

1 引言

涉眾型非法金融犯罪活動呈現涉案人數多、涉案資金量大的特點,嚴重影響國家經濟和人民的財產安全。在金融犯罪活動中,犯罪分子需要利用銀行等金融機構,將非法所得的資金經過一次或多次交易,匯聚到最終賬戶中。圖1為非法傳銷和非法洗錢金融犯罪活動的交易關系示例。此類犯罪活動組織中成員的角色分工呈類金字塔形或紡錘形等結構,相應賬戶的資金交易由其扮演的角色驅動產生,使犯罪關系極其隱蔽。目前,銀行部門使用的反洗錢等金融安全系統能夠根據交易規則發現存在異常交易的單個賬戶,但對上述多賬戶協作實施非法金融活動的行為束手無策。例如,非法傳銷活動,它是一種由一組人員操縱的以上線發展下線、吸納下線會員費為欺詐方式的涉眾型金融犯罪活動。如圖1(a)所示,其資金交易關系具有明顯的金字塔層級結構,底層為會員節點,中間層為初級上線節點,頂層為操縱節點。會員節點通過繳納會費加入組織,初級上線節點從下線會員的會費抽取提成獲得收益,剩余資金全部沉淀入操縱節點的賬戶中??梢?,在非法傳銷活動中,資金從受騙群眾流向底層小頭目,再匯集到重要頭目。對于線下傳銷而言,這種資金的轉移過程大部分是通過銀行賬戶交易完成的。

涉眾型非法金融活動的交易關系復雜,交易規模較大,增加了犯罪行為的隱蔽性,使偵查人員全面打擊犯罪組織的任務越來越棘手。已知部分涉案成員,利用成員之間關系的緊密程度主動發現嫌疑賬戶,能有效解決犯罪團伙成員預測問題。

圖1 涉眾型非法金融活動交易關系示例

近年來,在金融安全領域,通過構建金融網絡模型,利用社交網絡分析技術挖掘犯罪信息的研究引起了研究者的重視。陳鵬等[1]采用網絡建模的方法研究不同類型犯罪組織的結構特性,基于復雜網絡建模的方法建立具有層次特征的犯罪組織網絡,考察了層次組織結構的運行效率和安全性。在金融網絡的構建方面,為了分析資金網絡的內部拓撲結構,劉晉霞等[2]分別定義了賬戶節點和資金賬戶關系,進而提出一種有向加權的資金融通網絡構建方法。韓華等[3]基于隨機矩陣理論,改進金融網絡相關系數矩陣生成方法,構建了金融網絡模型,獲得了更加緊密的網絡結構。在反洗錢的應用研究中,為了解決需要兼顧時間、成本、流量、風險等多因素的多目標優化問題,李瓊婕等[4]提出了基于最小費用最大流的擴展模型??傮w來說,當前的研究集中在利用各種類型的歷史數據構建犯罪網絡,將組織關系嵌入網絡結構中。但是,上述網絡構建方法多針對特定應用且依賴多種信息源,可擴展性較弱。此外,量化網絡節點關系的信息粒度過粗,導致用于同伙關系預測時的準確性較低。本文研究如何利用銀行賬戶的交易日志數據量化賬戶之間的關系強度,實現同伙預測的方法。

本文使用的賬戶交易日志數據如圖2(a)所示,包含交易時間、交易對手、交易金額及交易方向等信息。因此,可據此構建賬戶的有向、加權交易網絡,其中節點的局部拓撲結構如圖2(b)所示。

圖2 銀行賬戶交易數據示例

可見,賬戶之間資金的往來是評判實體之間關系程度的重要標準。顯然,日志數據中賬戶之間交易的金額、頻率、周期性、交易網交集等信息是這種關系的具體體現。賬戶之間關系的緊密程度(本文稱作賬戶親密度)是評估賬戶所關聯實體親密程度的重要標準之一。

本文首先建立資金交易網絡模型,將時序交易數據嵌入網絡結構及網絡關系中。由上述分析可知,網絡中節點間的關系強度與節點的交易信息和局部拓撲結構緊密相關。本文首先定義了單向信任度,從資金交易的角度計算節點間的直接親密程度;然后從局部拓撲結構的角度,將節點間的間接交易關系進行分類,提出一種節點間的間接親密度計算方法。綜合上述兩種親密度指標,本文計算任意節點對的綜合親密度,構建得到一個非對稱親密度網絡。親密度網絡中的節點為銀行賬戶集合,有向邊表示節點的單向關系,邊的權重為單向關系的綜合親密度?;谏鲜鋈B通、非對稱的親密度網絡,在已知部分嫌疑節點的前提下,本文提出一種犯罪團伙預測方法。在包含傳銷團伙的銀行賬戶交易數據上的實驗結果,證明了該方法發現潛在傳銷賬戶的有效性。

2 相關工作

銀行賬戶親密度計算可以歸類為網絡中的節點相似性計算,這方面的研究基本上可以分為以下兩類。

1) 基于網絡拓撲結構的節點相似性計算。該類算法根據考慮的節點信息種類的差異可分為3種。第一種算法只考慮直接鄰居信息、同時考慮間接鄰居信息及另外考慮路徑信息。節點的直接鄰居信息主要包括共同鄰居的數量、節點度數、節點之間的連接程度[5-6],具有計算復雜度較低、適用范圍廣的特點。第二種算法同時計算了直接和間接鄰居對節點關系的影響,其中參與計算的因素包括一階鄰居信息、二階鄰居信息以及多階鄰居信息[7-8]。隨著考慮鄰居節點層數的增加,算法的計算復雜性逐次增大。第三種算法在鄰居信息的基礎上,結合了路徑強度、連通程度等信息[9]。這種方式時間復雜性高,在大規模網絡上應用時間開銷很大。

2) 網絡表示學習節點相似性計算。近年來,受自然語言中詞向量生成技術的啟發,網絡節點向量生成技術的研究引起了學者的重視。Perozzi 等[10]提出DeepWalk算法,首次將網絡表示學習技術引入網絡分析領域。隨后,針對大規模有向帶權圖的網絡表示學習問題,Tang等[11]提出一種對所有一步和二步鄰居節點進行概率建模的LINE方法。Wang等[12]提出SDNE方法使用深層神經網絡對節點間的非線性建模。為學習網絡結構的相似性,Donnat等[13]提出一種名為GraphWave的可擴展無監督網絡表示學習方法。

以上兩類節點相似性計算方法利用的僅為網絡節點的局部拓撲結構信息。不同于傳統網絡,金融網絡中,賬戶節點之間豐富的時序交互信息對量化賬戶的親密度尤其重要?;诖?,本文在局部拓撲結構信息的基礎上,融入節點交互信息,提出一種非對稱親密度網絡構建方法。

在涉眾型金融犯罪活動中,根據已知犯罪線索、犯罪嫌疑人預測犯罪團伙的研究,受到許多研究者的關注。在組織成員預測方面,Sun等[14]改進了中心節點計算方法,利用節點之間的可信度,提出了一種限制連接節點集合的搜索空間,進而識別協作伙伴的方法。在犯罪網絡應用方面,Chen等[15]針對犯罪集團的組織特點,結合共犯網絡結構分析和數據挖掘技術,對組織犯罪集團進行系統分析和挖掘研究。針對組織成員的上下級支配關系,楊莉莉等[16]提出了一種犯罪組織成員關系挖掘方法;高建強等[17]結合聚類分析與社會團伙技術,提出一種組織成員發現模型。李萬彪等人[18]提出了一種基于關系數據模型的犯罪網絡挖掘方法,該方法可以挖掘已知嫌疑人、未知嫌疑人及深層的犯罪團伙關系。在解決從歷史犯罪案宗數據中挖掘組織成員的任務中,唐德權等[19]提出一種使用層次聚類技術進行同組人員發現的方法??傮w來說,上述犯罪網絡的數據源類型多為歷史案宗數據,與本文使用的交易日志數據不同。此外,進行組織成員預測時,主要依據關聯網絡的拓撲結構信息。本文在親密度網絡的基礎上,綜合考慮節點對的非對稱親密度和局部交易關系,得到了節點的異常傾向性指標,進而實現犯罪團伙預測。

3 銀行賬戶交易網絡數學模型

銀行賬戶交易網絡是一種超大型且動態變化的復雜網絡。賬戶間的交易具有有向、有序、金額和頻度等屬性,上述交易特點導致賬戶間具有復雜的關聯關系?;谫~戶間的關系特點,本文建立了銀行賬戶交易網絡數學模型。銀行賬戶用網絡節點表示,賬戶間的交易關系用節點之間的有向邊表示,有向邊的權重表示交易時間、金額、次數等信息。銀行賬戶交易網絡數學模型見定義1。

定義1 一個銀行賬戶交易網絡可表示為= (),其中={1,2, … ,v}為賬戶集合,= {e} ?×, 1≤,≤為邊集合,vv之間存在有向邊當且僅當vv至少進行了一次交易,該有向邊記作e= <v,v>。= {w},∈(R),w= ((1),(2), … ,()), 其中,(),N分別表示節點vv間第次交易的金額和總交易次數。

4 非對稱親密度網絡

在定義1中的銀行賬戶交易網絡中,節點之間的有向邊權重W包含了賬戶之間交易信息,這些信息隱含了賬戶之間的親密程度。本文基于兩點之間的交易信息和局部拓撲結構,提出了賬戶親密度計算方法,構建了銀行賬戶的非對稱親密度網絡。

4.1 信任度

在現實生活中,甲轉給乙一筆錢,顯然甲在一定程度上信任乙,隨著甲對乙交易次數和金額的增加,表明甲對乙的信任程度逐漸增加。在資金交易中的信任度是單向的,簡單來說,甲給乙錢,表明甲信任乙,反之并不成立。甲對乙的信任程度主要隨兩個因素變化。1)交易金額:甲對乙的交易金額越大,說明甲對乙的信任度越高。2)交易次數:甲對乙的交易次數越多,說明甲對乙的信任度越高?;谶@兩點,本文提出了賬戶對賬戶的信任度計算方法。

m是賬戶對賬戶的交易資金總額,n是對的交易次數,那么對的信任度可以表示為mn的函數。本文提出式(1)用于計算對的信任度。

同理:設m是對的交易資金總額, n是對的交易次數,那么對的信任度由式(2)計算。

4.2 直接親密度計算

式(1)和式(2)分別計算了對的信任度和對的信任度,雙方互信程度的均值體現了雙方的親密程度,本文稱為直接親密度。和的直接親密度可用式(3)計算。

4.3 間接親密度計算

在資金交易網絡中,尤其在犯罪團伙之間,賬戶之間除直接交易外還可能存在多種不同的間接交易。所以,在親密度的計算中,雖然直接交易的影響占主導地位,但某些間接交易對賬戶的親密度也有較大的影響。間接交易信息反應在賬戶在交易網絡上的局部拓撲結構中?;诖?,除直接親密度外,本文考慮賬戶之間的間接親密度。

在金融網絡中,節點之間往往具有復雜的交易關系。例如,在圖3中,節點、之間不但具有直接的交易關系,同時由于各自節點局部拓撲結構的交集,產生了間接交易關系。這些復雜的間接交易關系同樣體現了和的親密性。本文將間接交易情況簡化為兩類。第一類如、、之間的交易關系,即交易給,交易給,因此可以理解為是和之間的媒介,與的親密性也因為的存在而有所增加。第二類為2個賬戶具有共同的轉賬鄰居。如圖3所示,和都有轉賬給的情況;或者,具有轉賬給和的情況,可以理解為和擁有共同的朋友。隨著共同朋友數量的增多以及二者與共同朋友的親密程度的增加,和的親密程度也在增強?;谝陨戏治?,本文提出了賬戶之間的間接親密度計算方法。

圖3 賬戶交易示意

節點與節點的間接親密度可由式(4)計算。

4.4 綜合親密度

綜合直接親密度和間接親密度,本文提出了賬戶之間的綜合親密度(以下簡稱親密度)計算方法,如式(5)。

其中,1, 11為直接親密度和間接親密度對親密度的貢獻系數。

通過計算任意兩點的親密度,本文建立了銀行賬戶親密度網絡,見定義2。

定義2 給定銀行賬戶交易網絡(),對應的非對稱親密度網絡為’(,,)。其中,={v,v, … ,v}為賬戶集合,= {o} ?×, 1≤,≤為邊集合,任意vv之間存在有向邊,該有向邊記作o= <v,v>。= {S},S∈[0,1] 是由節點到由式(5)計算的單向親密度。

5 團伙預測算法

賬戶親密度網絡反映了賬戶之間的親密程度,如果一個待測賬戶與多個犯罪賬戶親密度值很大,則有理由相信賬戶在一定程度上是涉案賬戶。針對待測賬戶是不是涉案賬戶,本文主要考慮兩個因素:1)與已知涉案賬戶的親密度值;2)鄰居節點中涉案賬戶的數量。

假設已標記涉案賬戶集合為C,()為待測節點在中的鄰居集合,則賬戶的涉案程度可由式(6)計算。

其中,𝛼,𝛽∈[0,1]為權重系數。() ∈[0,1]的大小反映了待測節點的涉案程度。

6 實驗與結果分析

6.1 實驗環境

本文實驗硬件環境為Inter(R) Core i7-7700HQ CPU@ 2.80 GHz,內存(RAM) 16 GB。軟件環境為Python語言,Ubuntu 18.04 LTS操作系統。

6.2 實驗數據

近幾年,筆者積極參與經偵部門打擊非法傳銷的工作,曾參與輔助偵查多起線下傳銷案件。本文使用的兩份數據集均為包含傳銷組織的銀行賬戶交易日志數據,每條日志數據包括交易雙方賬戶、交易方向、交易時間、交易次數和交易金額等屬性。數據經過去重、去噪、脫敏等處理后,用于對本文算法的測試。數據集1中包含交易記錄349 126條,涉及8 384個銀行賬戶。其中,傳銷賬戶883個,正常賬戶7 501個,在資金交易網絡中有向邊共14 646條。數據集2中涉及5 872個銀行賬戶,其中119個傳銷賬戶。將數據集1按照4:1的比例劃分訓練集和測試集,得到包含662個傳銷賬戶和5 626個正常賬戶的訓練集。從數據集2選擇319個節點作為測試集,其中包含200個正常賬戶和119個傳銷賬戶。

6.3 參數設定

統計發現,數據中兩個賬戶之間交易金額總和的最大值為1 836.61萬元,兩個賬戶之間的交易次數總和最大值為1 008次。通過數據分析,發現金額小于100元的交易,基本為水電費等噪聲數據,因此本實驗將小于100元的數據進行了過濾。經過多次實驗驗證,標準化處理函數(),()和式(1)~式(5)的各項系數采用如下設置時,取得較好的實驗結果。

表1 節點對的親密度指標示例

6.4 親密度算法分析

為了驗證親密度算法的準確性,本文選取了9組具有親密度值的賬戶對信息(交易金額、交易次數、共同對手、間接路徑的數目)來分析間接親密度和直接親密度是否與賬戶對之間真實的緊密程度一致。實驗結果如表1所示。

在現實交易場景中,交易金額、交易頻次、共同交易對手、間接交易方式都會影響交易雙方的親密關系。由表1的第1、2條記錄可知,在間接屬性相近的情況下,賬戶對的交易金額、交易頻次越高,兩節點越親密;同理,由第6、7條記錄可知,在直接屬性相近的情況下,賬戶對的共同交易對手數量、間接路徑條數越多,兩節點越親密。上述親密度結果分別證實該指標的取值與真實交易場景下的親密關系一致。如第2、4條記錄所示,在間接屬性相近的情況下,交易頻次的差異引起了親密度指標的較大變化。這種變化與現實場景中直接屬性比間接屬性更能反映節點對親密度的情況一致。因此,本文的綜合親密度計算方法能夠相對準確地反應賬戶之間的親密關系。

6.5 團伙預測結果分析

在數據集1進行訓練得到()(見式(6))的最優參數取值。經過50次實驗的平均結果發現,當()的系數采用=1,=0.018 7時,算法在測試集上取得最好的團伙預測效果。測試集上的實驗結果如圖4~7所示。

如圖4所示,算法的準確率隨取值的增加呈增大趨勢,且當()的取值大于0.4時,準確率趨于穩定,最高達到95.3%。反之,算法的召回率(如圖3所示)隨著值的增大呈逐漸降低的趨勢??梢姕蚀_率和召回率呈負相關,兩者的關系如圖6所示。隨著值的增加,算法的1值呈先急劇增大后平穩下降的趨勢,且當值取0.1附近值時,1值達到最優。

圖4 準確率隨H值變化

圖5 召回率隨H值變化

圖6 準確率和召回率的關系

圖7 F1值隨H值變化

當()的參數選擇最優的情況下,在數據集2上進行算法準確性測試。實驗結果如混淆矩陣所示。隨機選擇119個傳銷賬戶中的69個作為已知標記數據,對剩余賬戶的標簽進行預測。在該數據集上的準確率達到85.6%,此時的混淆矩陣如圖8所示。

6.6 團伙預測對比分析

本文分別選取交易金額、交易頻次、直接親密度的預測算法作為同伙預測的單因素依據,與本文提出的基于綜合親密度的同伙預測方法進行對比分析。在數據集1上的團伙預測性能實驗結果如表2所示。

表2 預測算法對比分析

如表2所示,本文基于綜合親密度的團伙預測方法取得了最優的準確率、召回率和1值?;谥苯佑H密度的算法同時包含交易金額、頻次信息,取得了優于單因素的預測性能,證明了兩種交易信息存在互補關系。本文算法在直接親密度基礎上結合節點的局部拓撲信息,進一步提高了預測性能,證明了交易關系信息對預測傳銷團伙的必要性。上述4種算法的ROC曲線如圖9所示。

圖9 4種算法的ROC曲線

可見,本文方法持續優于另外3種方法。該實驗結果,再一次驗證了共同使用直接親密度和間接親密度進行同伙預測算法的有效性。

7 結束語

本文利用銀行賬戶交易數據,在犯罪團伙預測方面進行了嘗試。在建立了銀行賬戶交易網絡模型的基礎上,提出一種非對稱親密度網絡構建方法。本文同時考慮了賬戶節點的直接交易信息和局部拓撲關系信息,量化生成任意節點對的單向綜合親密度。進而,利用節點在銀行賬戶交易網絡中的關系子圖和親密度網絡與異常節點的親密程度,進行節點的同伙預測。在包含傳銷異常賬戶的真實資金交易數據上的實驗結果,驗證了本文定義的親密度指標能夠準確描述團伙資金交易的特點,提出的團伙預測方法能有效發現潛在犯罪嫌疑人。

在實驗中發現,由于交易環境復雜,賬戶對之間的交易信息浮動較大,如交易次數從0到1 000,交易金額從100元到1000多萬元。因此,如何平衡交易次數和交易金額對親密度的影響、如何平衡各種鄰居節點對親密度的貢獻、如何平衡直接親密度和間接親密度的權重,需要大量數據的支撐。由于本實驗數據的局限性,實驗獲得的平衡系數可能存在偏差。這是下一步本團隊需要改進和繼續研究的工作。

另外,采用網絡表示學習方法,把節點進行量化處理,然后度量節點關系和拓撲結構挖掘的研究逐漸引起研究者的重視。利用這種機器學習的方法進行親密度計算和犯罪團伙預測的研究也是下一步工作的重點之一。

[1] 陳鵬, 袁宏永. 犯罪組織結構的社會網絡分析[J]. 清華大學學報(自然科學版),2011, 51(8): 1097-1101.

CHEN P, YUAN H Y. Social network analysis of crime organization structures[J]. Journal of Tsinghua University (Science and Technology), 2011, 51(8): 1097-1101.

[2] LIU J X. The research on detecting community structure of complex networks and its application in financial Networks[D]. Lanzhou: Lanzhou University of Technology, 2013.

[3] 韓華, 吳翎燕, 宋寧寧. 基于隨機矩陣的金融網絡模型[J]. 物理學報,2014, 63(13): 431-440.

HAN H, WU L Y, SONG N N. Financial networks model based on random matrix[J]. Acta Physica Sinica, 2014, 63(13): 431-440, 2014.

[4] 李瓊婕, 薛耀文. 最小費用最大流維度拓展及其在反洗錢中的應用研究[J]. 山西師范大學學報(自然科學版), 2014, 28(1): 28-32.

LI Q J, XUE Y W. Dimension-expansion of minimum cost and maximum flow theory and its application research in anti-money laundering[J]. Journal of Shanxi Normal University (Science and Technology), 2014, 28(1): 28-32.

[5] ADAMIC L A, ADAR E. Friends and neighbors on the Web[J]. Social Networks, 2003, 25(3): 211-230.

[6] WU Z H, LIN Y F. Link prediction with node clustering coefficient[J]. Physica A: Statistical Mechanics and Its Applications, 2016, 452: 1-8.

[7] ZHOUT, LYU LY, ZHANG YC. Predicting missing links via local information[J]. The European Physical Journal B, 2009, 71(4): 623-630.

[8] LEICHT E A, HOLME P, NEWMAN M E J. Vertex similarity in networks[J]. Physical Review E Statistical Nonlinear and Soft Matter Physics, 2006, 73(2): 1-10.

[9] ZHU X Z, TIAN H, CAI S M. Predicting missing links via effective paths[J]. Physica A: Statistical Mechanics and Its Applications, 2014, 413(11): 515-522.

[10] PEROZZI B, RAMI A R, SKIENA S. DeepWalk: anline learning of social representations[C]//ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (SIGKDD’14). 2014, 701-710.

[11] TANG J, QU M, WANG M, et al. LINE: large-scale information network embedding[C]//International Conference on World Wide Web (WWW’15).2015:1067-1077.

[12] WANG D X, CUI P, ZHU W W. Structural deep network embedding[C]//ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (SIGKDD’16).2016:1225-1234.

[13] DONNAT C, MARINKA Z, HALLAC D, et al. Learning structural node embeddings via diffusion wavelets[C]//ACM SIGKDD InternationalConference on Knowledge Discovery and Data Mining (SIGKDD’18). 2018.

[14] SUN Y, TAN W N, LI L X, et al. A new method to identify collaborative partners in social service provider networks[J]. Information Systems Frontiers, 2016, 18(3).

[15] CHEN H, CHUNG W, XU J J, et al. Crime data mining: a general framework and some examples[J]. Computer, 2004, 37(4): 50-56.

[16] 楊莉莉, 楊永川. 基于社會網絡的犯罪組織關系挖掘[J].計算機工程, 2009, 35(15): 91-93.

YANG L L, YANG Y C. Crime organization relation mining based on social network[J]. Computer Engineering, 2009, 35(15): 91-93.

[17] 高建強, 譚劍, 崔永發. 一種基于通訊痕跡的社會網絡團伙分析模型[J]. 計算機應用與軟件, 2012, 29(3): 206-208.

GAO J Q, TAN J, CUI Y F. One social network clique analysis model based on communication trace[J]. Computer Applications and Software, 2012, 29(3): 206-208.

[18] 李萬彪, 余志, 龔峻峰, 等. 基于關系數據模型的犯罪網絡挖掘研究[J]. 中山大學學報(自然科學版). 2014, 53(5): 1-7.

LI W B,YU Z, GONG J F, et al. An approach of crime network analysis based on association data model[J]. Acta Scientiarum Anturalium Universitatis Sunyatseni, 2014, 53(5): 1-7.

[19] 唐德權, 史偉奇, 凌志剛. 有組織犯罪集團挖掘算法[J]. 計算機系統應用, 2015, 24(9): 196-200.

TANG D Q, SHI W Q, LING Z G. Algorithm for mining organized crime[J]. Computer Systems & Applications, 2015, 24(9): 196-200.

Reasoning method for predicting crime partner by using intimacy network of bank accounts

LYU Fang, LU Haibo, WANG Wei, HUANG Junheng, WANG Bailing

(School of Computer Science and Technology, Harbin Institute of Technology, Weihai 264209, China)

In recent years, research on the law of capital transactions in the case of stakeholder-type illegal financial activities has attracted the attention of researchers. In order to solve the problem of using the bank transaction data to actively discover the abnormal account criminal crime partners, a crime partner prediction method based on the asymmetric intimacy network of the bank accounts was proposed. Firstly, a general network model for bank account transactions was established to embed time-series transaction data into the network structure. Then, using the direct and indirect transaction relationship information of the node, an account asymmetric intimacy calculation method was proposed. Finally, using the asymmetric interaction information of the nodes on the intimate network, the abnormal tendency index of the nodes is obtained. The experimental results on the actual data of the multi-level marketing group show that the crime partner prediction method based on the intimacy network can effectively find potential pyramid shelling members.

transaction network of bank accounts, intimacy network, direct intimacy, indirect intimacy, crime partner prediction

s:The National Key Research and Development Program of China (No.2018YFB2004201, No.2017YFB0801804), Frontier Science and Technology in Notation of China (No.2016QY05X1002-2),National Regional Innovation Center Science and Technology Special Project of China (No.2017QYCX14), Key Research and Development Program of Shandong Province (No.2017CXGC0706), the Fundamental Research Funds for the Central Universities (No.HIT.NSRIF.2020098), 2017 University Co-construction Project in Weihai City

TP391.4

A

10.11959/j.issn.2096?109x.2019062

呂芳(1990? ),女,山東陽谷人,哈爾濱工業大學(威海)博士生,主要研究方向為復雜網絡、信息內容安全、數據掘。

陸海博(1998? ),男,甘肅酒泉人,主要研究方向為金融安全。

王?。?975? ),女,黑龍江齊齊哈爾人,博士,哈爾濱工業大學(威海)講師、碩士生導師,主要研究方向為金融安全、數據挖掘、自然語言處理。

黃俊恒(1966? ),男,河南新鄉人,哈爾濱工業大學(威海)副教授,主要研究方向為數據挖掘、人工智能。

王佰玲(1978?),男,黑龍江哈爾濱人,哈爾濱工業大學(威海)教授、博士生導師,主要研究方向為信息對抗、信息安全、信息搜索、移動網絡、金融安全。

2019?02?19;

2019?05?14

王佰玲,wbl@hit.edu.cn

國家重點研發計劃基金資助項目(No.2018YFB2004201,No.2017YFB0801804);國家前沿科技創新專項(No. 2016QY05X1002-2);國家區域創新中心科技專項(No.2017QYCX14);山東省重點研發計劃基金資助項目(No.2017CXGC0706);中央高?;究蒲袠I務費專項資金資助 (No.HIT.NSRIF.2020098);2017威海市大學共建基金資助項目

論文引用格式:呂芳, 陸海博, 王巍, 等. 基于銀行賬戶親密度網絡推理的團伙預測研究[J]. 網絡與信息安全學報, 2019, 5(6): 95-104.

LYU F, LU H B, WANG W, et al. Reasoning method for predicting crime partner by using intimacy network of bank accounts[J]. Chinese Journal of Network and Information Security, 2019, 5(6): 95-104.

猜你喜歡
團伙賬戶密度
大尺寸高相對密度鎢管的制備
警惕團伙作案 遠離非法薦股圈套
如何切換Windows 10本地賬戶與微軟賬戶
探索自由貿易賬戶體系創新應用
Windows10賬戶的刪除、禁用與啟用
外匯賬戶相關業務
找出8名盜賊
“團伙”威力強過“團隊”
“密度”練習
密度的不變性與可變性
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合