?

動態性數據鏈路預測情報偵查方法研究

2021-02-05 11:00薛亞龍劉如意
山西警察學院學報 2021年1期
關鍵詞:動態性數據鏈偵查人員

□薛亞龍,劉如意

(寧夏警官職業學院,銀川 750021)

虛擬空間網絡科學技術的高速發展,促使動態性數據鏈路預測成為網絡科學學科內的一個重要研究范疇,且不斷地被應用于社會生產、生活的各個領域。網絡科學中動態性數據鏈路預測的本質,是將動態性數據源中各個數據節點采取相互融合等作用形成數據節點的數據連邊,從而能夠挖掘與獲得該動態性數據源中具有關聯性的銜接數據。顯然,利用動態性數據鏈路預測的屬性能夠讓人們及時發現和獲取在該動態性數據源中具有拓撲結構和拓撲特征的靜態或動態數據節點,進而有利于人們能夠對該動態性數據源的數據化生存規律及變化發展態勢展開評估和預測。[1]同時,虛擬空間網絡科學技術在給社會發展帶來優質惠利的同時,還給犯罪情勢的數據化生存態勢提供了必要的“土壤”條件,造成在傳統的動態性數據情報偵查應用過程中出現數據節點指標差異性大、數據情報銜接缺失、預測算法準確度低等突出問題,導致偵查人員對其研判與應用的結果往往出現偵查偏差或偵查失真,甚至陷入偵查錯誤和偵查僵局?;诖?,引入動態性數據鏈路預測情報偵查方法研究的范式,將動態性數據鏈路預測與情報偵查互相融合共同發展,這不僅是網絡科學范疇中動態性數據鏈路預測產生與發展的應然趨勢,而且還是數據驅動創新時代現代情報偵查方法變革和創新的實然需求。

一、動態性數據鏈路預測情報偵查的內涵與屬性

在虛擬空間網絡的研究范疇中,動態性數據的結構屬性與發展模式越來越受到人們的重視和研究。鏈路預測通過高度抽象的拓撲結構再現虛擬網絡空間中各種復雜海量的相關性數理關系,以數據節點與數據連邊結構屬性對各動態性數據展開結構化的數據建模,從而對其進行深入全面的挖掘與預測。[2]鏈路預測作為虛擬空間網絡中對動態性數據進行挖掘與預測的關鍵性算法,通過對其結構屬性中的數據集合、數據節點、數據連邊和指向以及數據權重系數等采取時間序列性的演化運算,然后尋找和獲取具有關聯性質的特殊數據節點和數據連邊,進而實現對動態性數據產生和發展的生存規律態勢給予挖掘與分析。顯然,將動態性數據鏈路預測引入現代情報偵查工作之中,不僅是動態性數據鏈路預測自身的運算價值優勢和傳統情報偵查模式轉型的必然性所決定,而且還是預防和打擊犯罪行為呈現數據化生存情勢發展的應對措施實然需求。因此,在數據驅動創新發展虛擬空間網絡的新時代,應該賦予動態性數據鏈路預測情報偵查新的內涵和屬性。

(一)動態性數據鏈路預測情報偵查的內涵

早期進行動態性數據鏈路預測的運算方法主要包括馬爾科夫鏈和機器學習,即先研究動態性數據的數據路徑與數據節點,然后拓展到對其數據之間的結構特征屬性研究,進而通過動態性數據模型構建來實現其鏈路預測的應用價值和目的。因此,動態性數據鏈路預測就成為在虛擬空間網絡中的一個最為重要的主流研究算法。在動態性數據鏈路預測的運算過程中,核心規則就是通過歸納分析數據節點之間的相似度從而獲取其具備鏈路銜接的概率加權系數。顯而易見。動態性數據鏈路預測的本質就是從動態性數據鏈路的微觀層面挖掘與分析其數據集合、數據節點等結構形態所形成的原因和相互關系,主要的任務就是解決動態性數據中缺失數據集合和數據節點的預測與還原問題。[3]所謂還原是指在動態性數據中確實存在但還沒有被發現和獲取的數據鏈路,這種動態性數據的鏈路又被稱為未知鏈路;而所謂預測是指在動態性數據中現在不存在但在未來卻可能被發現所存在的數據鏈路,此種動態性數據的預測亦被稱為未來鏈路。顯然,動態性數據鏈路預測的核心技術即在預設搜集和構建的動態性數據源倉庫中,準確挖掘與預測其包含的數據集合和數據節點在該動態性數據源中的鏈路銜接概率和差錯率。一方面,該技術為提高對海量復雜動態性數據源的系統級鏈路銜接、自動化鏈路預測以及智能鏈路決策等提供運算的高性能指標體系;另一方面,還可以幫助實現對上述運算操作的簡單化技術處理,從而提升動態性數據源的鏈路預測銜接概率和降低其運算的差錯率。[4]誠然,結合動態性數據鏈路預測的運算屬性與情報偵查的特殊應用價值和實踐導向需求,我們認為,動態性數據鏈路預測情報偵查的內涵為:偵查人員采取GNRA算法、EESM算法、RBIR算法等動態性數據鏈路預測算法,通過對已知各數據集合、數據節點、數據路徑等動態性數據源的運算與挖掘,幫助在虛擬數據化犯罪情勢中挖掘與分析不相鄰兩個數據節點等之間產生數據連邊的概率性和差錯率,從而實現動態性數據鏈路預測引導和指導情報偵查的一種新型情報偵查方法。

依據動態性數據鏈路預測情報偵查中各數據集合、數據節點以及數據路徑等運算的相似銜接加權系數不同,即如果上述兩兩之間的相似銜接加權系數越來越相近,那么其被鏈路預測銜接的概率性也就越大,可將動態性數據鏈路預測情報偵查分為三個方面類型,即全局動態性數據鏈路預測情報偵查、局部動態性數據鏈路預測情報偵查以及準局部動態性數據鏈路預測情報偵查。各類型動態性數據鏈路預測情報偵查的區別如下:全局動態性數據鏈路預測情報偵查主要考慮了全部動態性數據源中各個數據集合、數據節點等整體結構特性和鏈路預測算法的精確性,其顯著的優點是能夠挖掘與獲得比較精確性的動態性數據鏈路預測情報偵查效果,然突出的缺點為其鏈路預測算法的數據收斂速度較慢,造成難以對各種數量特別大的動態性數據源開展鏈路預測的情報偵查應用。局部動態性數據鏈路預測情報偵查僅局限于對動態性數據源中各個數據節點的挖掘與分析,具體包括AA算法、CN算法以及PA算法等。其對數據收斂速度的要求不高,鏈路預測情報偵查的效果主要取決于涉案動態性數據源的數量范圍。而準局部動態性數據鏈路預測情報偵查則無需過多考慮和關注全部動態性數據源中數據集合、數據節點以及數據路徑等數據拓撲結構屬性,而主要考慮的是比局部動態性數據鏈路預測情報偵查所使用的更多評價指標體系和系數,主要的算法包括LP算法、SRW算法以及LRW算法等。因此,偵查人員在動態性數據鏈路預測情報偵查應用的過程中應該根據各動態性數據源的不同內涵屬性范圍和涉案虛擬數據化犯罪情勢的發展變化趨勢,選擇和采取不同類型的動態性數據鏈路預測情報偵查方法,從而促使其能夠作出和制定及時準確的偵查預測與偵查對策。

(二)動態性數據鏈路預測情報偵查的屬性

1.動態性數據鏈路預測情報偵查的度相關性。在動態性數據鏈路預測情報偵查的應用過程中,可以將度分布和平均度分別看作動態性數據源中的0階和1階關聯特性。雖然在動態性數據源中可能存在相同或相似的度分布與平均度,但是往往會呈現出不同的鏈路預測行為和性質。數據節點的度相關性作為動態性數據鏈路預測情報偵查中高階度分布屬性的一種不同數據節點之間的鏈路模式,如果動態性數據源中某數據節點接近于其預設數據度相同或相近的閾值,那么該動態性數據的度相關性即表現為同配特征的正屬性;反之,則表現為異配特征的負屬性。在度不相同的動態性數據源中,任意兩個數據連邊中數據節點的閾值都是隨機且不完全相同的。在動態性數據鏈路預測情報偵查的度相關性屬性中,挖掘與判定其度相關性的方法主要包括兩個方面:一方面,通過運算分析所有涉案動態性數據源中數據節點與其相鄰節點之間平均度的相關性閾值,如果兩者之間數據節點的度相關性為正屬性,那么從數據節點接近于度相關閾值的角度而言,其必然具備動態性數據同配特征的正屬性范疇;反之,則具備動態性數據異配特征的負屬性范疇。另一方面,利用皮爾森相關的鏈路預測算法進而提出動態性數據同配的加權指標系數,從而實現對動態性數據同配或異配閾值的定量挖掘與分析。因此,在動態性數據鏈路預測情報偵查的度相關性屬性中,各個數據節點往往相鄰與其度相關性閾值相同或相近所呈數據簇而聚類,促使大部分的動態性數據源具有同配特征的正屬性關系。而在度相關性閾值呈現較小數據節點的動態性數據源中,其具有突出異配特征的負屬性關系。然而,各個動態性數據源的度相關性同配或異配屬性并不是屬于絕對不變狀態,會隨虛擬空間網絡情勢的變化規則而互相轉化。

2.動態性數據鏈路預測情報偵查的小世界性。小世界(Small world)的內涵范疇來源于Milgram對虛擬空間網絡連鎖郵件的實驗研究,要求實驗員把郵件通過熟人的傳遞方式將其快速有效地郵寄到距離位置遙遠的收件人,大部分的郵件都會經過五六次的傳遞后即可被收件人所獲取。[5]小世界的理念與特性最早被應用于驗證“六度分離現象”,即在數據化的社會生活中人們平均經過五個人便能夠產生關聯。近年來,尤其隨著結構化數據、半結構化數據、非結構化數據以及異構化數據等海量復雜動態性數據源的迅猛產生與發展,更加驗證和揭示了動態性數據鏈路預測具有小世界的特殊屬性。誠然,動態性數據鏈路預測情報偵查的小世界屬性主要包含兩個方面含義:第一、數據平均距離較小。在動態性數據鏈路預測情報偵查應用的過程中,各數據節點之間的平均距離〈d〉與動態性數據鏈路預測情報偵查的應用價值和實踐需求〈N〉呈突出的對數關系即〈d〉∝lnN。盡管該對數關系的函數具有不斷增長的發展態勢,但是其海量復雜動態性數據源的數據平均距離仍然比較??;第二、數據聚類加權系數較大。與傳統實體物理空間的小數據相比較而言,虛擬空間網絡時代動態性數據鏈路預測情報偵查的數據聚類加權系數較大,促使偵查人員在對其進行挖掘與分析過程中具有顯著的鏈路預測局部特性和數據簇的聚類效果。顯然,小世界屬性促使偵查人員在動態性數據鏈路預測情報偵查應用過程中具有重要的偵查啟發價值作用,這種價值作用的差異性主要由偵查人員對各種海量復雜動態性數據源的挖掘與分析能力所決定。所以,偵查人員利用小世界屬性來對各種數據節點距離進行及時有效的運算和數據聚類,能夠全面提升動態性數據鏈路預測情報偵查應用的高效性。

3.動態性數據鏈路預測情報偵查的冪律度分布性。度分布P(k)表示在動態性數據鏈路預測情報偵查中所有k屬性數據節點占據所有數據節點的比例系數,比較常見的度分布包括指數分布、泊松分布、二項分布等。動態性數據鏈路預測情報偵查中數據節點生成機制的不同范式,造成其產生度分布的比例系數具有差異性。尤其在泊松隨機動態性數據鏈路預測情報偵查過程中,任意兩個數據節點之間由于以固定不變的概率產生數據連邊,促使其任意一個數據節點度分布系數的預設閾值都是相同的。在動態性數據源規模較大與固定平均度互相結合和互相影響的鏈路預測情報偵查情勢運算下,該二項分布可以幫助偵查人員實現數據節點的度分布無限接近泊松分布的閾值。顯然,不管是數據節點的指數分布還是泊松分布以及二項分布等,都促使在動態性數據鏈路預測情報偵查的應用過程中具有典型的冪律度分布屬性即P(k)∝k-y。而其真實冪律度分布的系數y往往閾值介于2與3之間,且該系數具有明顯的曲線長尾特性和不明顯的特性標度。同時,動態性數據鏈路預測情報偵查的冪律度分布屬性又被稱為無標度數據節點屬性。所以,在虛擬空間網絡的動態性數據坐標運算情勢中,動態性數據鏈路預測情報偵查的冪律度分布屬性系數呈現出曲線且向線性分布發展的態勢。

二、動態性數據鏈路預測情報偵查的流程模型構建

動態性數據鏈路預測情報偵查活動是偵查人員根據偵查情勢的發展態勢而按照情報偵查工作的特殊流程而展開,動態性數據鏈路預測情報偵查的流程主要包括其基本環節等。動態性數據鏈路預測情報偵查的流程雖然具有相對的穩定性,但也并非一成不變。當新的數據化生存犯罪情勢的出現、新的情報偵查價值需求導向的迫切需要以及新的生活生產和生活方式的變革等都會必然地引起動態性數據鏈路預測情報偵查流程的嬗變。因此,結合動態性數據鏈路預測的算法優勢和數據化犯罪情勢的發展態勢,將動態性數據鏈路預測情報偵查的流程構建分為情報偵查的價值需求、動態性數據情報的生成、情報偵查決策的支持等三個流程。

(一)情報偵查的價值需求流程

在虛擬空間網絡的運行情勢下,動態性數據源不僅包括結構化數據、非結構化數據而且還包括半結構化數據、異構化數據等。動態性數據源來源的廣泛性和豐富性,給動態性數據鏈路預測情報偵查的應用帶來了巨大的機遇。這不僅有利于偵查人員憑借動態性數據鏈路預測的算法優勢讓情報偵查的價值需求更加顯性化,而且還進一步有利于促使情報偵查的價值需求更加精確化和主動化,從而促使偵查人員在動態性數據鏈路預測情報偵查應用過程中實現其應然價值。

情報偵查的價值需求流程是開展其他動態性數據鏈路預測情報偵查流程環節的基礎,而動態性數據鏈路預測情報偵查的流程環節則是情報偵查價值需求服務的措施與方法。根據動態性數據鏈路預測情報偵查的實踐應用需求,可以將情報偵查的價值需求分為顯性情報偵查價值需求和隱性情報偵查價值需求。顯性的情報偵查價值需求是指偵查人員自己挖掘發現并據此請求情報偵查的價值請求服務,而該部分情報偵查的價值請求相對而言比較簡單。隱性的情報偵查價值需求是指偵查人員在案件偵查的初始并未有挖掘和發現,但根據后期犯罪情勢的變化發展而具有潛在需要的價值需求。顯然,隱性的情報偵查價值需求首先需要偵查人員根據案件偵查的實際需求導向進行情報偵查的價值預設,然后搜集和獲取與涉案有關的各種動態性數據源并進行數據清洗、數據倉庫構建等處理。其次,對所獲取的各種動態性數據源采取鏈路預測算法和建立關聯規則構建模型,從而獲取情報偵查價值的隱性需求。最后,將情報偵查價值的顯性需求和隱性需求互相結合,從而確定動態性數據鏈路預測情報偵查的整體情報偵查價值需求方向和范圍。

在獲取到整體情報偵查價值的需求方向和范圍之后,具體主要從價值需求內容和價值需求形式兩個方面展開。其中,情報偵查價值的需求內容具體包括動態性數據源中各數據集合、數據節點、數據路徑的類型、格式、閾值等,這決定了后續動態性數據源的來源獲取途徑、鏈路預測算法的選擇、相關性數理關系挖掘的深度以及情報偵查預測和決策的層次度等。而情報偵查價值的需求形式是指動態性數據鏈路預測情報偵查的服務模式,主要受偵查人員對情報偵查的挖掘能力水平與動態性數據鏈路預測的算法選取所影響和制約,從而決定了動態性數據鏈路預測情報偵查活動在滿足情報偵查價值需求流程中的參與度和支持度。在同等條件下,如果偵查人員具備很強的情報偵查挖掘能力和選取準確高效的動態性數據鏈路預測算法,那么其在滿足情報偵查價值需求流程中則具有很高的參與度和支持度。同時,還有利于偵查人員激發和獲取更多的情報偵查需求。(如圖1)

2.2.1 千粒重。施用磷肥能增加小麥的千粒重詳見表4,分析可知施用磷肥的小麥千粒重平均為40.3 g,比未施用磷肥的小麥千粒重38.0 g重2.3 g。

圖1 情報偵查的價值需求過程

所以,在情報偵查的價值需求流程中,一方面,偵查人員通過對動態性數據源的挖掘與分析促使其能夠主動地發現和確定整體情報偵查的價值需求并給予滿足;另一方面,情報偵查的價值需求活動又是一把雙刃劍,其既能夠幫助偵查人員對情報偵查的價值需求展開更加準確的預測分析,又由于預測分析結果的靜態僵硬化而導致情報偵查的價值需求受到局限性,從而出現部分的隱性情報偵查價值需求被忽略,以及限定了隱性情報偵查價值需求和顯性情報偵查價值需求之間的互相融合和互相轉換等現象問題。

(二)動態性數據情報的生成流程

在虛擬空間網絡動態性數據鏈路預測情報偵查的應用情勢下,動態性數據源不僅具有開放性、動態性、群智能性等突出特點,而且各種結構化數據、非結構化數據、半結構化數據以及異構化數據等動態性數據源還呈現出互相融合和互相交互的并存現象,促使動態性數據鏈路預測情報偵查的數據處理技術具有很強的時效性。偵查人員對動態性數據源進行及時有效的搜集、清洗、倉庫構建以及數據集成等環節,是實現動態性數據鏈路預測情報偵查應用價值和實踐效果的關鍵性步驟。顯然,在情報偵查的價值需求流程完成之后就必然需要進入動態性數據情報的生成流程。所以,動態性數據情報的生成流程不僅是將動態性數據源轉換為偵查情報的必經途徑,而且還是銜接情報偵查的價值需求流程與情報偵查決策的支持流程的重要橋梁。

根據動態性數據鏈路預測情報偵查應用的實踐價值導向需求和結合虛擬空間的發展特點、動態性數據的內涵屬性、鏈路預測的算法優勢等,可以將動態性數據情報的生成流程自下而上分為動態性數據的物理層、候選相關的動態性數據情報、相關的動態性數據情報、規范的動態性數據情報以及偵查知識和偵查方法經驗五個方面,與其相對應的分別是情報采集、情報處理、情報加工、情報組織、情報分析等環節。其中:第一環節為情報采集。在虛擬空間網絡環境運行情勢下,海量數據構成對社會生活全面、系統的記錄,因而數據可以完整、實時地反映事物的過去和現狀。[6]雖然動態性數據源的來源種類比較復雜和多樣化,但是總體可以分為虛擬網絡空間的動態性數據和現實實體的動態性數據兩部分。這些動態性數據源經過選擇和采取采集方法、采集工具、采集程度等系列的措施之后,篩選和提煉形成動態性數據的物理層,從而為動態性數據情報的生成流程提供重要的數據支撐和保障。第二環節為情報處理。盡管所獲取的動態性數據源數量呈TB、PB等趨勢迅猛發展,但是也存在諸如無效數據多、數據更加冗余等突出問題。這就必然需要對情報采集后的各種動態性數據源進行數據清洗,采取劃定有效數據范圍、數據價值判斷、確定合理數據采集度等技術,促使形成候選相關的動態性數據情報。第三環節為情報加工。經過情報處理環節之后,偵查人員對候選相關的動態性數據情報需要按照特定的形式進行存儲才能夠使其變成有情報偵查價值的有關動態性數據情報。例如,偵查人員可以采取將無規則數據轉換成格式規范的數據、建立數據索引規則、預設數據的讀取權限等技術方法,從而實現將這些被情報加工后的規范數據統一存儲到構建的數據倉庫之中。第四環節為情報組織。在動態性數據情報的生成過程中,只有將規范處理后有價值的相關動態性數據經過數據集成后并理解掌握才能夠發揮最大的情報價值。誠然,動態性數據源不僅包括數值型數據、文字型數值以及圖片型等多種數據種類,而且還呈現出結構化數據、非結構化數據、半結構化數據以及異構化數據等多種數據表示格式。顯而易見,迫切需要對各種動態性數據源進行數據集成。偵查人員可以通過采取統一數據結構、客觀重現數據內容以及準確有效理解數據語義等具體措施,從而幫助偵查人員實現規范的動態性數據情報。第五環節為情報分析。首先,該環節通過數據聚類、數據智能合約等方法對動態性數據源中數據集合、數據節點、數據路徑等數據特征和屬性進行歸納與分析,主要目的是實現對動態性數據源的情報分類;然后,采取LP算法、SRW算法以及LRW算法等鏈路預測算法對情報分類后動態性數據源的關聯數理關系進行挖掘與分析;最后,偵查人員利用偵查知識和偵查經驗方法等邏輯推理方法,將上述動態性數據情報轉化和提煉為動態性數據鏈路預測情報偵查的決策數據。(如圖2)

圖2 動態性數據情報的生成流程

(三)情報偵查決策的支持流程

動態性鏈路預測情報偵查應用的主要目標是實現“情報偵查目標-解決方案”的高度匹配,促使偵查人員能夠獲取海量跨領域多、精確性高、關聯性強等有效的偵查情報,從而為偵查人員作出的偵查決策提供支持和幫助。就動態性數據鏈路預測情報偵查的應用流程而言,經過情報偵查的價值需求和動態性數據情報的生成流程之后,必然需要進入其最終目標即情報偵查決策的支持流程。各種動態性數據情報只有經過情報偵查決策的支持流程之后,才能最終實現動態性數據鏈路預測情報偵查的應用價值和實踐目標。

在情報偵查決策的支持流程過程中,首先,偵查人員需要確定動態性數據鏈路預測情報偵查的決策目標,通過采取動態性數據鏈路預測算法進而確定動態性數據鏈路預測情報偵查決策目標的需求導向和需求維度;再根據動態性數據鏈路預測情報偵查決策的目標需求確定情報偵查決策的運行情勢,并將情報偵查決策的運行情勢和情報偵查決策的目標互相融合和分解,通過采取各種動態性數據鏈路預測算法而構建情報偵查決策的目標模型;在確定情報偵查決策的目標任務之后,綜合情報偵查決策的目標模型和數據模型,從而幫助偵查人員完成對情報偵查決策目標任務的解讀。其次,根據情報偵查決策的目標任務,偵查人員采取動態性數據鏈路預測算法通過偵查邏輯推理等方法進而獲取和提煉與涉案犯罪情勢具有內在關聯性的各種數理關系。最后,針對動態性數據鏈路預測情報偵查決策中每個實際需要解決的維度問題,結合情報偵查決策所運行的環境情勢和動態性數據鏈路預測的算法優勢,建立動態性數據鏈路預測情報偵查的偵查決策模型。同時,在該偵查決策模型預設數個子策略的關聯規則,通過采取策略優化、策略組合等措施促使尋找出解決偵查決策的最佳路徑。(如圖3)誠然,情報偵查決策的支持流程更多是強調對規范后的動態性數據情報源進行客觀和準確的解讀,不斷優化關聯規則并構建情報偵查決策的模型,利用動態性數據鏈路預測算法優勢提升情報偵查決策支持流程的收斂速度和挖掘效能,盡量避免或減少傳統人工的干預參與度。因此,情報偵查決策的支持流程對實現動態性數據鏈路預測情報偵查決策目標具有決定性的重要作用。

圖3 情報偵查決策的支持流程過程

三、動態性數據鏈路預測情報偵查的指標體系與評價方法

動態性數據鏈路預測情報偵查能夠將動態性數據、鏈路預測以及情報偵查三者有效地互相銜接和互相融合,不僅是打擊在虛擬空間網絡情勢中犯罪情勢呈現數據化生存態勢發展的應然選擇,而且還是數據驅動創新時代情報偵查工作創新和改革的內在實然需求。然而,在動態性數據鏈路預測情報偵查應用的過程中,由于存在動態性數據源的海量復雜性、鏈路預測算法的層次性以及情報偵查的特殊性等偵查情勢的影響和制約,迫切需要構建動態性數據鏈路預測情報偵查的指標體系和評價方法。這不僅能夠對動態性數據鏈路預測情報偵查的流程構建起到檢驗和修正的作用,而且還能夠對后續動態性數據鏈路預測情報偵查的具體應用方法起到驗證和評價的反饋價值。

(一)動態性數據鏈路預測情報偵查的指標體系

1.共同鄰居指標及其衍生指標。在動態性數據鏈路預測情報偵查指標體系中,共同相鄰CN指標是最基礎的指標。共同相鄰CN指標在動態性數據鏈路預測情報偵查中的價值為:如果任意兩個數據節點共同連接的鄰居數據節點指數越多,那么這兩個數據節點產生與發展為數據連邊關系的概率就越高;反之,則概率越低。[7]若在共同相鄰CN指標中再引入若干具有度信息屬性的數據節點,則能夠促使其衍生其他動態性數據鏈路預測情報偵查的相似性指標。偵查人員通過對各數據節點之間的數據距離、數據路徑等數據結構的局部采取鏈路預測算法,就能夠獲取到與其相對應的動態性數據鏈路預測情報偵查關聯相似性指標指數,然后再將其由局部應用于整體即可。而在通過共同相鄰CN指標衍生的其他相似性指標中,具有代表性的有Salton指標、Jaccard指標以及Sorensen指標等。[8]其中,Salton指標是指在動態性數據鏈路預測情報偵查共同相鄰CN指標的基礎上,結合被引入數據節點度信息的運算結果閾值而形成相似性的新指標系數,又被稱為余弦相似性指標。Jaccard指標是指在動態性數據鏈路預測情報偵查共同相鄰CN指標的基礎上,分別計算新加入數據節點之間相鄰并集和交集的勢,從而獲得動態性數據鏈路預測情報偵查新相似性的衍生指標。Sorensen指標也是建立在動態性數據鏈路預測情報偵查共同相鄰CN指標的基礎上,但是該指標系數主要取決于共同相鄰CN的勢和數據節點度分布閾值之和。

2.數據節點度分配權重指標。就動態性數據鏈路預測情報偵查指標體系的應然價值而言,數據節點度分配權重指標是其必然選擇,而AA指標和RA指標就屬于典型的數據節點度分配權重指標。AA指標和RA指標的主要原理為:度數較小的數據節點對一個與其相鄰作用影響力往往大于度數較大的數據節點。[9]在數據節點度分配權重AA指標中,任意兩個數據節點所計算出來的相似性指標系數都是通過與其全部共同相鄰數據節點度的對數分之一并累加求和所獲得。而數據節點度分配權重RA指標系數的運算思路更多是對各種動態性數據源的分配過程,而其指標系數主要為全部共同相鄰數據節點度的倒數并累加求和。顯然,數據節點度分配權重RA指標和RA指標都是通過對動態性數據源中數據節點度的運算,二者能夠充分利用和發揮數據節點度分配的數據閾值。[10]因此,數據節點度分配權重AA指標和RA指標能夠幫助偵查人員全面提升動態性數據鏈路預測情報偵查應用的關聯性和準確性。

4.數據節點間緊密相似性指標。在動態性數據鏈路預測情報偵查指標體系的構建過程中,偵查人員有時可能會面對部分無權無向的動態性數據源,而該類動態性數據源往往會嚴重影響或制約動態性數據鏈路預測情報偵查應用的收斂速度和質量?;诖?,引入數據節點間緊密相似性指標的應用技術方法。在數據節點間緊密相似性指標中,若該無權無向的動態性數據源表示為G(A,B),則A和B分別表示為動態性數據源中數據節點與數據連邊的集合。[12]偵查人員在動態性數據鏈路預測情報偵查應用的過程中會給任何一對數據節點a和b都分配一個數據閾值sab,其主要目的是用來測量與計算數據節點a和數據節點b之間的相似性,即數據節點a與b之間能否實現數據連邊的概率性。顯然,在數據節點間緊密相似性指標挖掘與分析中,偵查人員通過指標系數sab的分數值即可預測和判斷數據節點之間能否實現數據連邊的概率。因此,就數據節點間緊密相似性指標系數關系而言,數據節點之間緊密性的指標系數,往往與其存在間接聯系的數據節點數目息息相關,而共同鄰居數據節點也是大部分動態性數據鏈路預測相似性指標體系挖掘與分析的最主要系數根源。

(二)動態性數據鏈路預測情報偵查的評價方法

動態性數據鏈路預測情報偵查核心內容就是對不同動態性數據源進行相似性的鏈路預測,從而能夠促使偵查人員作出及時有效的偵查預測和偵查對策。各種動態性數據源的數據節點之間相似性指標系數越大,則其數據節點之間形成數據連邊的概率性也就越大,也就更加有利于動態性鏈路預測情報偵查應然價值和實踐效果的實現。然而,在動態性數據鏈路預測情報偵查的應用過程中,不同動態性數據情報偵查的指標體系構建也會形成不同鏈路預測的情報偵查結果。因此,偵查人員應該根據各種動態性數據鏈路預測的算法優勢、數據節點之間相似性指標的系數屬性以及案件情報偵查的實際價值導向需求等要素,對動態性數據鏈路預測情報偵查的應用過程和實踐效果及時進行評價,從而促使偵查人員實現對動態性數據鏈路預測情報偵查應用能夠及時進行修正和反饋的價值作用。

3.數據節點中心性計算評價方法。在動態性數據鏈路預測情報偵查的應用過程中,數據節點中心性的計算對動態性數據鏈路預測情報偵查的準確性具有重要的決定性作用。數據節點中心性的重要性是指數據節點在動態性數據鏈路預測中的地位,也可以將其當作動態性數據中的影響力和制約力。[14]依據動態性數據鏈路預測情報偵查應用中數據節點距離的不同范圍,可將數據節點中心性計算評價方法具體分為數據節點度中心性、數據節點接近中心性以及數據節點介數中心性三個評價方法。第一,數據節點度中心性評價方法。數據節點度中心性是指預設數據節點目標與其他數據節點存在數據連邊的鄰居數量,即一個數據節點的數據連邊鄰居數量越多則其價值和作用也就越大。顯然,數據節點度中心性評價是動態性數據鏈路預測情報偵查應用最為直接和簡單的評價方法,具有收斂數據速度快、運算成本低、直觀可視化等顯著特點。第二,數據節點接近中心性評價方法。數據節點接近中心性主要是通過動態性數據源中任意數據節點與其他數據節點之間的平均數據路徑距離閾值而獲得,如果一個數據節點與其他動態性數據源中任意數據節點的平均數據路徑距離閾值越小,那么該數據節點接近中心性的概率就越大??梢?,在動態性數據鏈路預測情報偵查應用的過程中,數據節點接近中心性評價方法不僅具有提高評價運算的高效性,而且還能夠進一步避免或減少離散數據的影響和制約。第三,數據節點介數中心性評價方法。數據節點介數中心性評價方法主要作用是衡量一個數據節點與其他數據節點之間存在最短數據路徑距離的相似性指標系數的次數,即動態性數據源中所有其他數據節點之間的最短數據路徑距離中經過該數據節點的相似性指標系數的次數,代表該數據節點控制和制約其他數據節點的鏈路預測收斂速度和效能。因此,在對動態性數據鏈路預測情報偵查應用的檢驗與修正的過程中,數據節點的介數中心性評價指標系數越高,說明其在動態性數據鏈路預測情報偵查應用中的重要性就越強,那么該數據節點控制與制約其他數據節點的作用也就更強,而對其他數據節點的影響力和依賴性也越大。

四、動態性數據鏈路預測情報偵查的應用方法

將動態性數據應用到社會生產生活等各個行業領域之中,是虛擬網絡空間動態性數據產生和發展的必然趨勢。尤其隨著各種結構化數據、非結構化數據、半結構化數據以及異構化數據等動態性數據源的高速增長,造成時態數據空間分析、時空風險探測分析、空間錨點預測分析等傳統動態性數據挖掘與分析算法呈現出數據節點指標差異性大、數據情報銜接缺失、預測算法準確度低等突出問題,導致各種復雜海量的動態性數據源難以被及時高效的挖掘和利用。因此,在虛擬網絡空間新時代應該賦予動態性數據鏈路預測情報偵查應用的新方法,這不僅是將動態性數據、鏈路預測與情報偵查工作互相銜接進行創新和變革的應然要求,而且還是預防和打擊涉嫌犯罪行為數據化生存態勢發展的實然需求。

(一)局部差異融合鏈路算法

在動態性數據鏈路預測情報偵查應用的過程中,數據節點之間的共同鄰居數量是常用的相似性指標系數,往往用F(X)和F(Y)來表示兩個數據節點之間存在共同鄰居數量的集合,而這兩個數據節點的共同鄰居數據集合則表示為:F(C)={C1,C2,C3,…,Cn}。局部差異融合鏈路算法的指標系數主要被集中在封閉式動態性數據源的共同鄰居數據節點之中,對共同鄰居任意的數據節點而言其地位都是相同的。[15]共同鄰居數據節點集合不但屬于是動態性數據源中的被包含內容,而且其還具有數據節點之間差異性等獨特的屬性?;诖?,在局部差異融合鏈路算法中引入Adamic-Adar指標系數和數據節點分配指標系數的數據節點差異性建模模型。即在全部動態性數據源的數據節點鏈路預測過程中,偵查人員對共同鄰居不同數據節點的相似性指標系數運算之后,按照Adamic-Adar指標系數和數據節點分配指標系數的差異性屬性將與其對應的指標設置為倒數或指數倒數的運算范式,從而運算不同數據節點在動態性數據鏈路預測情報偵查中的價值效果。顯然,在動態性數據鏈路預測情報偵查的局部差異融合鏈路算法應用中,偵查人員依據數據節點引力算法在尋找和挖掘其在共同鄰居數據節點集合中的數據節點度分布運算時,還可以考慮加入數據節點的正相關因子,即Ee。偵查人員利用局部差異融合鏈路算法在分析和研判涉案犯罪情勢數據化生存態勢的發展變化過程中,可以采取數據節點Z與其他共同鄰居數據節點X和Y的鏈路預測指標的數據連邊加權系數,進而形成一個對動態性數據鏈路預測情報偵查具有全局性指導價值的數據節點集合度,即F(X)∩F(Y)∪{X,Y}。從動態性數據源中數據節點的同質性屬性而言,具有相似性指標系數的數據節點往往會產生和形成具有數據連邊的一個局部涉案犯罪情勢結構,這在包括犯罪時間數據、犯罪空間數據、犯罪過程數據等很多實體落地情報偵查中能夠得到有效的檢驗和證實。同時,偵查人員還可以利用局部差異融合鏈路算法對不同動態性數據源中的數據節點融合展開運算和分析,從而幫助其計算和確定共同鄰居數據節點集合到任意一個具有相似性指標數據節點的最短數據路徑和數據距離。因此,局部差異融合鏈路算法不僅能夠幫助偵查人員及時有效地確定不同數據節點構成共同鄰居數據集合的同質性程度與加權系數,而且還能夠幫助其快速準確地計算和分析最佳數據節點的數據路徑和數據距離,從而實現提高動態性數據鏈路預測情報偵查應用的收斂速度。

(二)數據協同鏈路預測算法

在動態性數據源中往往存在多種類型的鏈路預測范式,而不同的鏈路預測中還存在已知鏈路預測、未知鏈路預測等鏈路預測的稀疏問題,并且未知鏈路預測還進一步多于已知鏈路預測的數量。[16]由于不同動態性數據鏈路預測運算范式之間可能也會存在互相影響或互相制約的情況,這就必然要求偵查人員在動態性數據鏈路預測情報偵查應用過程中采取數據協同的鏈路預測算法。即偵查人員在采取一種動態性數據鏈路預測范式的同時,還可以利用其目前的動態性數據源采取另外一種鏈路預測范式進行運算,進而提高動態性數據鏈路預測情報偵查應用的預測效能。同時,在一種動態性數據鏈路預測結束之后,其預測情報數據繼續可以被用于其他鏈路預測范式繼續進行,這是一個數據協同互補式的鏈路預測運算循環過程。鑒于此,偵查人員可以先將結構化數據、非結構化數據、半結構化數據以及異構化數據等各種不同動態性數據源中的帶標數據和無帶標數據互相融合起來,然后將當前動態性數據鏈路預測的目標對象限定為有限的帶標數據,而其他鏈路預測的目標對象則為無標數據。顯然,在數據協同鏈路預測算法的應用過程中,每種不同動態性數據鏈路預測算法的價值效果優勢決定了利用不同的帶標數據或無標數據。另外,不同的動態性數據鏈路預測范式在數據協同互補的鏈路預測時候還存在利用相同或相似的動態性數據源現象,進而有利于偵查人員能夠快速有效地挖掘與分析其內在具有相關性的各種數理關系。數據協同鏈路預測算法的本質是屬于一種典型的動態性數據迭代算法,主要根據數據節點相似性指標系數來計算和挖掘每條動態性數據鏈路預測的價值與作用。誠然,數據協同鏈路預測算法具有對不同動態性數據源進行多種鏈路算法協同預測的情報偵查價值作用。每次在迭代推理過程中都可以同時預測出多種可能并存的鏈路預測算法,進而幫助偵查人員實現對準確度比較高的鏈路預測算法給予數據鄰居矩陣進行加權系數更新和選擇。因此,在動態性數據鏈路預測情報偵查應用的過程中,數據協同鏈路預測算法不僅具有提升動態性數據鏈路預測情報偵查應用準確高效的價值,而且還具有能夠為其他不同鏈路預測算法提供互相補充、互相協同的印證作用。

(三)AdaBoost鏈路預測優化算法

Polikar R等學者經過對集成學習(ensenmble learning)研究后得出結論:人們在對各種相關問題進行最后決策時,往往會在做出決策前不斷尋找出多種不同可能存在的決策方法與決策結果。只有對可能存在不同決策方法與決策結果進行互相權衡利弊之后,才能夠促使人們從而選取出最佳的決策方法與決策結果。[17]與單一的決策方法系統相比較而言,多種不同決策方法系統的決策集成會形成更加利益最大化的決策結果。同樣的選擇決策方法原理也適用于統計機器學習研究范疇,即單一的數據分類器在不同的數據挖掘與分析結果上可能存在不同的運算結果,而依據特定原則對多種不同數據分類器進行數據集成后,則可能實現某種數據算法效能的全面提升,從而起到降低數據收斂時間和運算結果風險等的實然效果。而Boosting方法就是一種對數據集成學習非常有效的運算方法,其具有典型的提升任意給定學習算法高效性和準確性的突出作用。[18]

在Boosting方法研究的基礎之上,學者Schapire和Freund等人于1995年提出Boosting方法的典型代表算法,即AdaBoost鏈路預測優化算法。AdaBoost鏈路預測優化算法顯著的價值優勢在于人們在動態性數據鏈路預測的過程中,不需要任何關于數據清洗、數據預處理以及數據倉庫構建等前置性的專業運算知識和經驗,其基本的運算原理是賦予人們對動態性數據源進行數據分類預設閾值正確的較低加權指標系數,同時提高數據分類預設閾值失真和偏差的最高加權指標系數,從而促使人們能夠得到加權指標組合系數精確度很高的動態性數據分類器。而在動態性數據鏈路預測情報偵查應用的過程中,偵查人員可以全面采取和引入AdaBoost鏈路預測優化算法。首先,偵查人員可以將動態性數據鏈路預測情報偵查的應用當作一個涉及動態性數據二分類的相關問題,并將動態性數據源中可能存在數據連邊關系的數據節點分為兩大類即存在數據連邊和不存在數據連邊。然后,采取AdaBoost鏈路預測優化算法通過挖掘與分析將與涉案犯罪情勢具有弱相關性數理關系的數據節點轉換為具有強相關性數理關系的數據節點。最后,根據涉案犯罪行為與非犯罪行為關聯規則模型而采取AdaBoost鏈路預測優化算法作為動態性數據源的重要數據分類器,從而幫助偵查人員能夠及時有效地挖掘與分析出隱藏在不同動態性數據源背后且與涉案犯罪情勢具有內在的各種相關性數理關系。在動態性數據鏈路預測情報偵查的應用過程中,AdaBoost鏈路預測優化算法不僅能夠降低情報偵查預測的誤報率和提高動態性數據鏈路預測的靈敏度,而且還能夠進一步提高動態性數據鏈路預測算法的召回率,從而實現提高動態性數據鏈路預測情報偵查應用的關聯性和準確性。

(四)粒子群鏈路預測優化算法

在動態性數據鏈路預測情報偵查應用的過程中,偵查人員在發現和獲取到各種動態性數據源的數據節點特征、數據節點標簽等數據結構后便可以直接將其應用到情報偵查中。然而,偵查人員在面對非結構化數據、異構化數據等復雜特殊的動態性數據源時如果將其挖掘與分析結果直接應用于動態性數據鏈路預測情報偵查之中,那么實際應用效果就會造成出現情報偵查預測和情報偵查決策的失真或偏差,部分甚至還會導致案件出現情報偵查錯誤或情報偵查僵局等現象。造成產生的原因主要包括兩個方面:一方面,動態性數據源中有數據連邊的數據節點數目往往小于沒有數據連邊的數據節點數目,造成偵查人員不能及時有效地發現和確定與涉案犯罪情勢具有內在相關性的各種數理關系;另一方面,傳統動態性數據鏈路預測算法是在有監督的情勢下進行,就必然會導致數據節點、數據路徑以及數據距離等出現數據維度冗余等現象,嚴重地影響和制約了動態性數據鏈路預測情報偵查應用的客觀性和效能性。

(五)數據節點親密度鏈路預測算法

(六)文本增強鏈路預測算法

盡管在目前已有部分鏈路預測算法中引入文本數據增強相關因素,但是也僅局限于將文本數據增強作為一項特殊的數據節點考慮。文本增強鏈路預測算法屬于一種異構動態性數據源的鏈路預測算法。我們認為,在動態性數據鏈路預測情報偵查應用的過程中,可以將文本數據轉換為文本矩陣特征,然后采取數據矩陣相似性算法將文本矩陣特征融入到對動態性數據源中數據節點的鏈路預測算法之中。文本增強鏈路預測算法的本質就是在利于神經矩陣分解模型運算與挖掘數據節點、數據路徑以及數據距離等數據結構之后,再對被挖掘與分析出來的矩陣特征進行鏈路預測運算。[21]顯而易見,文本增強鏈路預測算法與傳統引入文本數據增強的鏈路預測算法有著本質性的區別。偵查人員在采取文本增強鏈路預測算法的過程中,首先將TADW算法與動態性數據鏈路預測情報偵查目標互相結合,然后將結合后所形成的文本數據矩陣T分解為偵查預測和偵查對策目標的矩陣M,其次利用余弦數據節點相似性算法對動態性數據源中各個數據節點進行鏈路預測,最后尋找和確定不同數據節點之間的相似性指標系數和數據節點度。顯然,文本增強鏈路預測算法主要是利用TADW算法模型來對動態性數據源中各個數據節點的相似性指標系數展開挖掘與分析。依據TADW算法模型的數據節點運算復雜性和案件偵查情勢的發展變化態勢不同,偵查人員可以將動態性數據鏈路預測情報偵查應用中數據節點相似性表示為:Sij=sim(i·j)/(‖i‖·‖j‖),同時將動態性數據源中的數據節點文本矩陣設為T,原始的數據節點為G,基于文本增強鏈路預測運算公式之一F(X)=(A+A2)/2,將獲取后數據節點的矩陣特征表示為M。至此,偵查人員利用文本增強鏈路預測算法對所獲取的數據節點矩陣特征M進行分解,得到分解后新的數據節點矩陣W、H、T,而新數據節點矩陣W、H、T都包含原數據節點矩陣M的分解因子。因為文本增強鏈路預測算法流程主要包括數據節點特征運算、數據表示學習、數據節點相似性矩陣以及數據節點鏈路預測等運算流程。所以,從實現動態性數據鏈路預測情報偵查的應然價值效果而言,文本增強鏈路預測算法不僅具有避免或減少數據節點相似性指標差異性的突出作用,而且還促使不同數據節點所形成的數據情報能夠及時有效的銜接,從而實現全面提高動態性數據鏈路預測情報偵查的運算準確性和高效性。

綜上所述,動態性數據鏈路預測情報偵查方法是現代虛擬空間網絡內對不同動態性數據源進行運算與挖掘的一種新型情報偵查方法,并且還包括局部差異融合鏈路算法、數據協同鏈路預測算法、AdaBoost鏈路預測優化算法、粒子群鏈路預測優化算法以及數據節點親密度鏈路預測算法、文本增強鏈路預測算法等多種的動態性數據鏈路預測情報偵查方法,且不同的動態性數據鏈路預測情報偵查方法都有著不同的鏈路預測算法優勢?;诖?,引入動態性數據鏈路預測情報偵查方法研究范式。以動態性數據鏈路預測情報偵查的內涵與屬性為研究邏輯起點,構建動態性數據鏈路預測情報偵查的流程模型,提出動態性數據鏈路預測情報偵查的指標體系與評價方法,并對動態性數據鏈路預測情報偵查的應用方法展開研究。這不僅促使偵查人員能夠提高對不同動態性數據源中數據節點指標鏈路預測的互補性和異常數據節點識別與分析的精確度,而且還能夠幫助其強化各動態性數據源中數據節點的內部相關性和結構關聯性以及提升挖掘與利用算法預測的準確度,從而實現動態性數據鏈路預測情報偵查的應然價值和實然效果。

猜你喜歡
動態性數據鏈偵查人員
自組織多主體系統動態性的推理研究
動態性對簡筆畫動物審美的影響及其神經機制*
管理者認知視角的環境動態性與組織戰略變革關系研究
偵查人員出庭問題實證研究
多平臺通用數據鏈助力未來戰場
高速公路工程項目實施中數據鏈應用探析
基于深度學習的無人機數據鏈信噪比估計算法
偵查人員出庭作證問題研究
國土資源績效管理指標體系的動態性探討
一種無人機數據鏈信道選擇和功率控制方法
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合