?

數據挖掘技術及其在刑偵工作中的應用分析

2016-03-15 03:27趙華珍
科學中國人 2016年26期
關鍵詞:犯罪行為權值數據挖掘

趙華珍

河南警察學院

數據挖掘技術及其在刑偵工作中的應用分析

趙華珍

河南警察學院

本文首先對數據挖掘技術和刑偵工作中關聯規則的應用問題進行了簡要介紹,從而探討了數據挖掘技術在刑偵工作中應用存在的問題,并在新犯罪敏感性和權重參數基礎上對Apriori算法進行了優化,希望對提升數據挖掘技術在刑偵工作中的應用效率起到促進作用。

數據挖掘技術;刑偵工作;應用

前言

近年來,信息技術以日新月異的速度飛快發展,給人們的工作及生活帶來了極大的轉變,現階段,相關領域也加大了對信息技術的研發力度,在人工智能以及數據庫的研發過程中,數據挖掘技術受到了廣泛關注,現階段將這一技術同刑偵工作進行緊密的結合,從而有效提升刑偵工作效率至關重要。然而,目前我國刑偵工作中對數據挖掘技術的應用還處于初級階段,因此還存在一定缺陷,在這種情況下,有針對性的采取有效措施彌補數據挖掘技術在刑偵工作中應用的不足具有重要意義。

一、數據挖掘技術在刑偵工作中應用存在的問題

(一)數據挖掘技術

Data Mining即數據挖掘,通常也被稱之為KnowledgeDiscovery in Database,指的是在對知識以及內容進行研究的過程中,從數據庫中進行提取,而這些知識實際上是具有一定潛在可利用功能的,同時也具有隱含的性質,在知識提取過程中,可以通過多種形式,如模式、規律以及概念等[1]。在對數據進行儲存的過程中,主要應用的是數據庫管理系統,而數據分析是以機器學習法為主的,從而對海量數據背后所隱藏的知識進行挖掘,以上兩者充分的融合就是數據挖掘技術產生的基礎。

(二)刑偵工作中關聯規則的應用問題

首先,傳統的Apriori算法,敏感性在新項目中的體現相對較低。由于在記錄犯罪行為的過程中,是一個不斷更新的過程,在傳統犯罪行為消失而新的犯罪行為產生的過程中,數據庫中的內容產生不間斷更新,這一過程很容易造成一定的變化產生于項目之間的關聯中,而關聯規則不斷創新。在傳統Apriori算法中,這一現象被忽視,即新的項目增加基礎上,在對支持度在不同項目集中的體現進行求解的過程中,基數總是以整個數據庫中的犯罪行為記錄為主,這種現象同關聯規則挖掘具有明顯的沖突,也就是說在對其進行應用的過程中,無法對新產生的頻繁項目集進行及時的發現,因此也就無法對關聯規則進行有效的更新。

其次,傳統的Apriori算法應用中對不同項的重要性產生了忽略。該算法對數據庫中被分析的對象產生的規律進行了分析,而完全忽略了不同項應用過程中重要性具有差別這一特點,因此在對這些項展開研究的過程中,它們被一致視為擁有相同的價值。這一現象的產生,經常性造成部分出現率低、價值較高的項被忽略。在對傳統的Apriori算法進行應用的過程中,分析公安犯罪行為常常導致對重要情節的忽視,而這些重要的情節通常會對社會產生嚴重的危害,也是惡性犯罪行為的代表。

二、數據挖掘技術在刑偵工作中有效應用的改進模型

(一)新犯罪敏感性基礎上的Apriori優化算法

權重參數基礎上優化Apriori算法,主要意圖是促使敏感性在新犯罪行為中得以提升。對頻發項目集算法的改進是優化Apriori算法的主要途徑。

當1≤α≤∞時,將參數α引入舊數據集當中,有助于對頻繁項目集的發現,如果頻繁項目集擁有不小于最小支持度同α的比值,則應當得到保留,當心的數據集在數據庫中產生,此時對最小支持度同α的比值小于支持度的頻繁項目集進行充分的考慮,同時還包含現階段所增加的數據集,在不斷增大的數據庫規模的背景下,相對穩定狀態將產生于項目增加的狀態當中,如果最小支持度同α的比值小于部分頻繁項目集的支持度,那么對這一頻繁項目集進行掃描過程中所需的時間一定小于對整個數據集的掃描時間,從而能夠有效提升頻繁項目集發現的效率[2]。

(二)權重參數基礎上的Apriori優化算法

權重參數基礎上優化Apriori算法,主要意圖是在對權重參數應用以后,從而促使不同犯罪行為性質的衡量可以對不同的權值進行利用,從而對支持度函數進行設定,并從中將重大犯罪行為之間的關聯規則進行深入挖掘。

假設集合X取值范圍為[x1,x2,……xr],它屬于21,并且,xi屬于I,i的取值為1至r;在對項集X的權值進行表示的過程中,應用Wx,其取值屬于[0,1][3]。此時,當X為單個的項,那么可以在基集產生以后對其權展開賦值,反之,它的權值應當在各項中進行獲得。由此可見,在對某個函數進行利用的基礎上,可以對項的權值在項集X權值中的體現進行計算,相關函數關系如下:Wx=F(Wx1,Wx2……,Wxr),在權值定義以后,變可以定義支持度函數:f(X)= Wx。numTids(x)/numTids(φ)。

結論

綜上所述,刑偵工作方法隨著時代的發展也發生了重大變化,現階段,信息網絡偵查成為刑偵工作中的關鍵。隨著信息技術同刑偵工作融合的程度越來越深,人們意識到數據挖掘技術在這一工作中的重要功能,然而,我國在這一方面的研究還處于初級階段,現有的刑偵工作在對數據挖掘技術進行應用的過程中還存在一定缺陷,鑒于此,本文在對數據挖掘技術和Apriori算法中的缺陷展開了探討,并有針對性的提出了優化Apriori算法的途徑,希望對我國刑偵工作效率和質量的提升起到促進作用。

[1]張震.數據挖掘技術分析及其在高校管理決策中的應用[J].遠程教育雜志,2015,06:32-35+62.

[2]張乾.數據挖掘技術分析及其在高等學校教務管理中的應用[J].經濟師,2014,07:103-104.

[3]高燕飛,陳俊杰.試析計算機數據挖掘技術在檔案信息管理系統中的運用[J].內蒙古師范大學學報(哲學社會科學版),2015,04:44-46.

猜你喜歡
犯罪行為權值數據挖掘
一種融合時間權值和用戶行為序列的電影推薦模型
改進支持向量機在特征數據挖掘中的智能應用
探討人工智能與數據挖掘發展趨勢
基于事故數據挖掘的AEB路口測試場景
網絡傳播失范行為概念與具體情境適用
軟件工程領域中的異常數據挖掘算法
財務風險跟蹤評價方法初探
基于洪泛查詢的最短路徑算法在智能交通系統中的應用
貪污罪的心理誘因之探究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合