?

指紋鑒定結論概率化表達方式初探

2023-02-21 13:16馬榮梁吳春生
刑事技術 2023年1期
關鍵詞:鑒定結論扇區穩定度

馬榮梁,劉 寰,吳春生

(1.公安部鑒定中心,北京 100038;2.北京警察學院,北京 102202)

指紋是最傳統和最重要的物證之一,是少數可以認定人身的證據之一[1-5]。隨著計算機指紋自動識別系統的廣泛應用以及我國全國指紋大庫的建立及完善,指紋技術在偵查破案及法庭訴訟中發揮重要作用。但隨著社會經濟的發展及犯罪形態的變化,指紋技術也面臨以下的基礎性難題,阻礙了指紋技術的進一步發展和應用:

1)現場指紋提取率低,疑難指紋顯現方法少[6-23]。指紋受DNA、視頻等新型法庭科學技術沖擊較大,指紋提取率日益降低,且很多疑難指紋顯現仍無很好辦法,不可否認的是,指紋等傳統物證在刑事技術中的作用逐漸萎縮,甚至絕對破案數量也開始下降。據公安部刑偵局等有關單位統計,原來我國未破現場指紋數據庫約有500萬枚左右,但經過多年的排查使用,現有的現場指紋數據下降到100萬枚左右,且經過多次查詢,價值逐漸降低,耗費巨資建立的指紋大庫面臨著資源枯竭困境。

2)指紋鑒定標準模糊不清。指紋鑒定是以二級特征的數量作為標準的,世界各國指紋認定標準各不相同,如德國8~12個,法國12個,英國長久以來以16個二級特征作為標準,后因標準過于嚴苛,降到12個二級特征,而后又改為沒有最低數量標準[23-27]。其他世界主要國家如中國、美國、加拿大、澳大利亞等都無指紋鑒定的最低數量標準。這樣導致指紋鑒定的主觀性較強,受鑒定人員的認知影響較大。國際法庭科學鑒定協會(IAI)經過調研認為:指紋鑒定需要最小特征數量是沒有必要的。盡管如此,在我國和其他許多國家一般習慣上認為指紋認定需要8個左右的二級特征。但隨著大庫應用,指紋在億人以上數據庫中比對,很多專家認為8個二級特征也存在著一定風險。當然,如果結合案情及其他證據判斷,指紋鑒定8個左右的特征數量標準的傳統習慣仍然沒有改變。

3)現有指紋鑒定結論不適應法庭科學發展需要。長久以來指紋只有三種鑒定結論:認定、否定、不夠鑒定條件[28]。如果認定和否定保持絕對準確,則認定和否定的閾值必然上升到不合理的程度,中間模糊部分必然擴大,導致指紋鑒定效率下降。指紋鑒定的科學性也一直為人們所質疑,上世紀九十年代美國的杜伯特聽證會上對指紋的質疑以及2009年美國科學院發表的報告關于指紋的討論是現代對指紋鑒定影響最大的兩次事件,盡管并未動搖指紋作為個體識別證據的地位,但引發了人們對于指紋鑒定科學性的探索。

針對傳統的指紋鑒定結論,美國國家標準研究院(NIST)下屬的法庭科學研究委員會在現有的三種方式之上增加了兩種傾向性的結論表達,提出了“認定、否定、傾向于認定、傾向于否定、不夠鑒定條件”的指紋鑒定結論表達方式。同時也有學者開始探索指紋鑒定結論的概率化表達方式:瑞士Champod[29-32]采用似然比方式對指紋鑒定結論進行表達,但其并未得到廣泛應用,且其數據是基于數據量在100萬人左右的瑞士指紋數據庫,數據量較少,是否具有普適意義仍存在爭議。國內有專家[33]也對此進行了研究,但指紋統計數據較少,且統計特征不是最為常見的起點、終點、分歧、結合、溝、眼、點、橋、棒等九種特征;此外因在數學模型方法建立上較簡單、沒有考慮指紋面積等因素,其結論未能得到廣泛應用。國際法庭科學鑒定協會也認為,盡管沒有實際案例應用,但應該支持關于指紋鑒定結論概率化表述的研究。

鑒于上述問題,本文對海量指紋圖像數據進行了統計分析,研究了指紋鑒定結論概率化表達的方式,有望推動指紋鑒定從定性走向定量,也希冀為指紋鑒定提供新的思路與方法。

1 指紋鑒定結論概率化數學擬合模型的建立

1.1 數據集的構建及特征點的定義

1.1.1 指紋圖片的篩選

通過國家指紋數據庫獲取2 000萬枚指紋樣本(FPT格式),并將指紋信息進行脫密。因為計算機與人眼對指紋圖像質量的定義不同,為了更全面地統計指紋各個區域的特征點情況撰寫了指紋圖像質量篩選專門程序,對指紋數據進行圖像質量評判,篩選并去除模糊、殘缺以及計算機認為難以識別的指紋,共篩選了1 500萬張指紋圖片并構建指紋特征點信息數據集。

1.1.2 特征點的定義

在統計指紋特征點分布之前,需要解決的問題是如何對指紋的各種紋型、亞型、指紋的分區以及指紋的各種細節特征進行定義和提取[34]。傳統的指紋學知識對于指紋分區和指紋細節特征的定義較為籠統,難以給出清晰、明確的分類標準,例如在指紋細節特征中,點和棒的區別就在于其長度,然而由于指紋捺印時按壓的力度不同會使點和棒發生形變,難以設定一個確定的閾值徹底區分點和棒,因此無法通過計算機技術統計指紋的細節特征分布規律,故最終不對指紋特征點進行區分,統一稱為指紋特征點。

1.1.3 指紋特征點的提取

對篩選后的1 500萬枚指紋樣本進行相應特征點信息的提取工作,提取指紋的圖像數據和指紋圖像數據對應的中心點、副中心、左三角、右三角和細節特征點信息,并對應每一個指紋特征點在指紋圖像上的位置。

1.2 基于扇形分區的指紋特征統計方法

1.2.1 指紋紋線區域定位、方向校準及正向提取方法

進行指紋正向提?。ㄈ鐖D1a所示,黃線為所需求解的指紋正向),首先需要確定指紋的輪廓。本文采用灰度化處理圖像,將圖像進行二值化處理及膨脹腐蝕提取指紋邊緣輪廓[35]等步驟處理后,建立了一種指紋正向提取方法,其計算步驟如下:

1)先畫出中心點距頂點和底點1/2和3/4間距平行線,共四條水平線(分別對應圖1b中的兩條黃線,兩條藍線)。

2)取兩條黃線的中點并連線,得到兩個中點連線后的角度A。

3)取兩條藍線的中點并連線,得到中點連線的角度B。

4)計算A與B的均值,作為指紋正向。

5)圖1b指紋由于底部有空白指紋輪廓(紅色箭頭示意處)無法封閉,所以導致無法提取指紋正向(紫色線示意此種情況下計算機確定指紋正向不準確),此指紋就被篩選去除。其他下方沒有較大面積空白的指紋,則可以使用并確定指紋正向。

圖1 指紋正向(a)及指紋輪廓示意圖(b)Fig.1 Schematic for a fingerprint to mark with the forward direction (a) and outline (b)

1.2.2 三參量扇區特征統計方法

統計指紋各個區域特征點分布情況的方案,主要有方形分區和扇形分區兩種思路。由于指紋捺印位置差異和指紋捺印經常存在一定角度傾斜的實際情況,最終選擇了以指紋中心點為圓心,以固定步長為半徑對指紋進行扇形分區的方案。由扇區的半徑步長、角度分度值和扇區內部的特征組成的三參量扇區特征統計方法如下:

1)以指紋的中心點為圓心,以r像素為起始半徑,r×n像素為終止半徑(n為圈數),r像素為半徑步長畫圓。

2)以指紋的中心點為端點,沿指紋正向作射線。

3)以指紋的中心點為端點,以步驟2)所得射線為起始,每隔θ度作射線。由射線和圓圍成的每一個區域,即為一個分區。

4)統計每一個分區中特征點數量作為表征該枚指紋的特征。

通過大量的分析和比較,綜合考慮指紋形狀、指紋特征點分布、紋線流向等方面,以及扇區面積和計算量等因素,最終確立了步長為25像素,角度偏置為30°的扇區劃分方案,以中心為起始點,按逆時針方向由里向外編號逐漸升高,將每幅指紋圖像編為264個扇區(一般外側幾圈扇區指紋紋線已經很少甚至沒有紋線,在實際工作上幾乎用不到),該扇區特征統計方法效果圖見圖2。

圖2 扇區特征點的可視化結果Fig.2 Visualization of fingerprint features in the fan-shaped sectors

1.2.3 各扇區的指紋特征統計方法

統計各個扇區的特征點數量,后期進行特征擬合,步驟如圖3所示。

圖3 統計扇區特征點數量的步驟Fig.3 Steps to calculate the quantity of fingerprint features in the fan-shaped areas

1.2.4 扇區內部的特征數量統計結果

利用直方圖統計方法,初步獲取各個扇區內部的特征分布情況,圖4展示的是四種紋型在第105扇區(隨機選?。﹥炔刻卣鼽c數量的直方圖統計結果,其中橫坐標表示具體的特征點數量,縱坐標表示該特征點數量所占的比例??梢钥闯?,四種紋型在第105扇區內部的特征點數量情況有著一定的區別。

圖4 第105扇區內部特征點數量分布情況(a:弓型紋右拇指;b:左箕型右拇指;c:右箕型右拇指;d:斗型紋右拇指)Fig.4 Quantity and distribution of the fingerprint features in the No. 105 fan-shaped area of a right thumb (a: arch; b/c: left-/right-lopsided loop; d: whorls)

1.2.5 扇區內部的特征角度統計結果

將統計的所有紋型按其特征點角度的不同分成八個區間,區間寬度為45°,分別統計4種紋型位于這八個45°角度區間的特征點數量,并繪制直方圖,統計特征點的角度特征,如圖5所示。

圖5 四種紋型在八個角度區間的特征點數量分布情況(a:弓型紋;b:左箕型紋;c:右箕型紋;d:斗型紋)Fig.5 Quantity and distribution of the fingerprint features in eight angular areas about four types of fingerprint (a: arch; b/c: left-/rightlopsided loop; d: whorls)

1.3 特征分布的擬合

完成數據庫中指紋特征情況的統計后需要擬合各個扇區內部的特征分布情況,因考慮到所統計的樣本指紋數據集的有限性(如弓形紋較少等),可能會導致一些特征未被統計到,并且為了更精確地表述扇區內部特征的出現概率,決定使用非參數估計的方法[36]——高斯混合模型[37-39],即根據已有的觀測數據擬合出各個扇區內部特征的概率密度函數,擬合模型建立的流程如圖6所示。

圖6 建立擬合模型流程圖Fig.6 Flow chart for the Mathematic model to establish

為更加精確地擬合各個扇區內部的特征點數量情況,將離散型的特征點數量分布擬合成連續性的特征點數量分布,最終選擇使用較為典型的高斯混合模型擬合扇區內部特征的分布,同時針對高斯混合模型的不足,如數據過于分散或過于集中的情形,引入貝葉斯信息準則和添加高斯噪聲來進行修正。

首先針對機器學習中經常出現的過擬合現象,通過加入模型復雜度作為懲罰項來減輕模型的過擬合程度,這里選擇使用貝葉斯信息準則(Bayesian information criterion,BIC)[40]:

其中,k為模型參數個數,n為樣本數量,L為似然函數。kln(n)懲罰項在維數過大且訓練樣本數據相對較少的情況下,可以有效避免出現維度災難現象。

其次在統計的特征數據中引入相應的噪聲,填補整數之間的空白,使得特征數據“連續”起來。這里試驗了兩種類型的噪聲,均勻分布的噪聲和高斯分布的噪聲,通過對比認為高斯噪聲更加適合高斯混合模型的擬合。

1.4 特征點穩定度的相似概率計算方法的研究

1.4.1 指紋特征點穩定度介紹

考慮到現場指紋特征與十指樣本指紋特征之間特征點匹配的穩定性,引入每一對標注的匹配特征點的穩定度,其中,特征點穩定度的值可由標注匹配特征點的專家通過判斷現場指紋與樣本指紋之間匹配特征點的清晰程度、指紋變形程度等因素量化給出具體數值,設定特征點穩定度取[0, 3]之間的整數值,其含義如表1所示。

表1 指紋特征穩定度及其含義Table 1 Fingerprint feature stability and implication

1.4.2 現場指紋中心點、參考方向及特征點位置的確定方法

在比對現場指紋與十指樣本指紋的特征時,理想的情況是需要確定現場指紋的中心點和參考方向,以此為基礎對現場指紋進行扇形區域劃分,但現場指紋的紋線區域往往殘缺不全,不能確定其中心點和參考方向,為此本文提出了將現場指紋紋線區域“移植”至對應的樣本指紋紋線區域中的方法,該方法基于以下假設:在指紋鑒定專家標注現場指紋與對應的十指樣本指紋特征時,假定現場指紋的特征與十指指紋特征匹配,否則不會標注指紋特征。在此假設基礎上專家標注現場指紋與十指樣本指紋的匹配特征點和差異特征點,并以此判斷指紋的鑒定結果?;诖?,該方法不再對現場指紋劃分扇區。

1.4.3 不存在指紋差異特征點的指紋相似概率的計算方法

1)首先對需要比對的現場指紋和樣本指紋進行特征點標注,并在十指指紋上進行扇區的繪制,將現場指紋的特征點“移植”到十指指紋相應的位置,生成相應的特征點信息文件。

2)統計現場指紋與十指指紋各個扇區內部的特征情況。

3)計算將要對比的指紋各個扇區內部特征出現的概率。

4)綜合考慮扇區內部特征點數量以及特征點穩定度,對3)中得到的各個扇區內部特征出現概率進行修正。

5)將各個扇區的概率相乘,得到該指紋出現的概率:

其中,i是指紋扇區的編號,表示存在特征點的第i個扇區,num為存在特征點的扇區個數,Pi為3)中計算出來的第i個扇區內部特征出現的概率,ni為第i個扇區內部的特征點個數,Si為專家標注的第i個扇區內特征點穩定度的均值。

6)最后得到該指紋出現的概率P0,而指紋同一的概率應該與其出現的概率成反比,故設置指紋同一的概率為:P1=1-P0。

上述5)中計算第j個扇區內部特征點數量出現概率的步驟為:

a)利用之前所擬合的各個扇區的特征分布以及其特征統計情況,得到目標指紋(即實際工作中的現場指紋)中第j個扇區內部的特征點數量在其第i個相鄰扇區內出現的概率Pi:

式中ρi表示第i個扇區內部特征的概率密度函數,使用的積分區間是[N-0.5,N+0,5],其中N為第j個扇區的特征點數量,而hi表示第j個扇區內部特征點數量在第i個扇區中出現的頻率。

b)得到第j個扇區內部特征點的重心,計算這個重心與其相鄰扇區(包含所需計算的第j個扇區)中心點的距離,根據這個距離對相應扇區進行權重計算(權重的大小與其距離成反比),所有權重的和為1。

c)根據b)中設置的相鄰扇區(包含所要計算的第j個扇區)的權重,對該特征點數量出現在其他扇區的概率進行一個加權求和:

其中,nnum指相鄰扇區的個數,wi為第i個相鄰扇區的權重(包含所要計算的第j個扇區),Qj為調整后第j個扇區內部特征點數量出現的概率。

1.4.4 存在指紋差異特征點的指紋相似概率計算方法

1)首先根據目標指紋識別不存在差異點的扇區,利用不存在差異點情況下的方法計算這些扇區的相似概率P1。

2)差異點是存在于某個(或某些)扇區中的,假設為扇區A中,通過計算存在差異點的兩個扇區內部特征相似概率的方法去計算這對指紋在扇區A的相似概率。

3)綜合考慮穩定度、特征點數量等信息,根據公式計算后生成十指指紋與現場指紋之間的相似度。計算公式為:

式中dnum為含有差異點的扇區數,P1為匹配的扇區計算出來的相似概率,λi表示第j個扇區內部的差異點穩定度集合,P為考慮差異點后的指紋相似概率。

上述2)中計算存在差異點的兩個扇區的特征相似概率方法步驟如下:

a)在需要比對的兩個指紋的所有扇區中,得到存在差異點的相應扇區的特征點數量A和B。

b)根據相似度統計高斯混合模型擬合文件的概率密度函數,在區間[A, B]進行積分,得到相應的概率Pv。

c)同樣,使用相似度統計高斯混合模型擬合文件和利用直方圖形式存儲的統計分布文件中的概率分布計算特征點數量A與特征點數量B出現的概率,并計算它們的均值p。

d)將步驟b)和c)中得到的1-Pv和p相乘,然后接收專家輸入的穩定度,根據穩定度對相乘后的相似概率進行微調,從而得到了調整后的相似概率,便得到了同一分布下兩個數值之間的相似性。

2 結果及討論

2.1 模型驗證

采用上述數學擬合模型對多個指紋對進行計算,圖7為其中三個指紋對。

圖7 指紋對(上:現場指紋;下:捺印指紋)Fig.7 Fingerprint pairs for matching (Above: the latent fingerprints; Below: the impressed one)

圖7a中指紋一共有9對匹配點,穩定度均為3,根據算法得出這對指紋的匹配特征的相似概率為99.998 698 846 39%,表示有100%-99.998 698 846 39%≈0.0013%的概率找到與其特征點分布相同的指紋,也就是說在一百萬枚指紋中可能會找到約13枚指紋與這對指紋的特征點分布相同;圖7b中指紋共有4對匹配點,穩定度均為3,匹配特征的相似概率為99.025 299 187 212 667 106 91%;圖7c中指紋共有5對匹配點,穩定度均為3,匹配特征的相似概率為99.573 488 126 617 775 151 32%。

2.2 結果討論

算法通過利用高斯混合模型擬合1 500萬個指紋扇區內部特征的分布,并充分考慮擬合出的特征分布、扇區內部特征點數量情況、特征點的穩定度以及其相鄰扇區內部特征分布情況計算指紋特征匹配的相似概率。其所計算出的相似概率與指紋匹配特征點的數量、特征點的穩定度成正相關,與扇區內部特征出現的概率成負相關。

值得注意的是,指紋匹配特征點的穩定度仍然是由人工審視確定,理論上存在著一定的誤差,但此劃分方法避免了將不穩定的匹配指紋特征點認定為穩定匹配特征點的弊端,實際上減小了計算誤差。且此誤差可以通過由經驗豐富的專家決定或多人討論來控制,將來也可通過改進軟件進一步細分穩定度來減小。

由上述例子可以看出,本算法建立的數學擬合模型能夠在一定程度上從統計學的角度去表征指紋匹配特征相似的概率。在此研究基礎上已開發出“指紋鑒定結論概率化表達應用平臺”,在公安網上線,供全國公安機關指紋鑒定人員免費使用。

2.3 指紋鑒定結論概率化表述方式的重要意義

據不完全統計,近年來我國每年案件現場為400多萬起,其中非接觸案件(即新型電信詐騙案件)占到1半左右。根據經驗估計,案件現場采集的指紋可能有一半左右不足8個二級特征,其中大量的具有5~7個特征點的指紋,甚至僅有3、4個特征點但特征具有較高的價值的指紋,都具有很高的偵查及鑒定價值。這些指紋初步測算每年在數萬枚以上,但在現有的條件下一般難以認定。在這種情況下,如能采用概率化的表達方式出具鑒定意見,就可盤活大量“無用”的指紋,使其更好地發揮本應具有的作用。同時,指紋工作者可以避免對條件不足指紋必須給出“是或否”的簡單結論,而在統計學意義對指紋證據進行價值評估與科學判斷。

3 發展前景與展望

3.1 繼續完善數學擬合模型

自指紋應用到法庭科學領域以來,指紋鑒定結論概率化表達方式的探索一直是世界性的難題。在這個擬合模型的建立過程中,目前主要考慮到特征數量、在不同紋型及指紋不同部位的分布以及特殊特征組合等因素,在后續的研究中,應考慮到其他更多因素(如紋線流向等),進一步完善數學擬合模型,并在實際辦案工作中應用。

3.2 推動指紋鑒定結論概率化表達方式進入標準及立法

隨著技術及法治的進一步發展,鑒定結論的概率化表述方式有可能進入指紋鑒定標準,特別是對某些具有很高的鑒定價值、但習慣上又不足以鑒定的指紋;或對某些疑難和具有爭議的指紋,概率化的結論表達方式是一種可能的解決方式;隨著人們認識的提高以及技術和模型的發展,指紋鑒定概率化表達方式有可能通過建立標準甚至法律法規進一步完善。

3.3 結合其他法庭科學證據對犯罪嫌疑人進行認定

犯罪現場證據并不僅僅是指紋存在不足以認定的情況,其他證據也存在類似情形。如犯罪現場的DNA的不完全分型,人體微生物、蛋白質組證據、手印中遺留的特殊物質(如藥物代謝產物、毒品、爆炸殘留物)、微量物證等,這些物證在某種程度上都可以概率形勢表現出來。單個證據不能認定犯罪嫌疑人,但多個證據可以達到極高概率的認定,這也是法庭科學從定性走向定量發展的大趨勢。

猜你喜歡
鑒定結論扇區穩定度
分階段調整增加扇區通行能力策略
高穩晶振短期頻率穩定度的仿真分析
當事人如何申請鑒定?
U盤故障排除經驗談
基于貝葉斯估計的短時空域扇區交通流量預測
多MOSFET并聯均流的高穩定度恒流源研究
對復查鑒定結論不服提出再申請工傷醫療補助金的計發標準如何確定
重建分區表與FAT32_DBR研究與實現
工藝參數對橡膠球鉸徑向剛度穩定度的影響
旱澇不穩定度的定量化研究及應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合