?

基于光照自適應調節和模糊分類的人臉圖像質量提升算法研究

2023-03-12 09:52戴琳琳候亞偉朱宇豪隨玉騰
鐵路計算機應用 2023年2期
關鍵詞:人臉亮度光照

景 輝,戴琳琳,候亞偉,朱宇豪,隨玉騰

(1. 中國鐵道科學研究院集團有限公司 電子計算技術研究所,北京 100081;2. 北京經緯信息技術有限公司,北京 100081)

人臉識別技術在鐵路人臉核驗閘機中得到了廣泛的應用[1-3]。受限于鐵路的復雜場景,采集到的人臉會受到光照條件和人臉圖像模糊等因素的影響。為提高人臉識別的準確率,提升旅客的進站體驗,亟需解決鐵路場景中采集人臉圖像光照條件不理想和模糊的問題。

非理想的光照條件下采集的圖像可能存在大面積的高響應區域或缺失紋理細節的低響應區域,這種光照異常的圖像會降低人臉識別算法的準確率。同時,旅客的個人習慣會導致閘機采集到部分模糊圖像。通常,模糊類別主要包括失焦模糊[4]和運動模糊[5]。失焦模糊由相機和物體間聚焦失準導致,運動模糊由相機和物體的相對位移造成。由于采用了自動對焦等技術,運動模糊是當前鐵路場景人臉圖像模糊的主要因素。運動模糊的人臉圖像在人臉識別算法處理的過程中,會降低人臉的可分辨性,增加人臉識別算法的誤識率。

針對上述問題,現有的研究多聚焦于基于光照補償和去模糊的圖像增強算法。針對非理想光照問題,文獻[6]提出基于方向濾波和自商圖像的人臉光照補償;文獻[7]提出基于改進Gamma校正的人臉圖像光照補償算法;文獻[8]提出基于小波商圖像的人臉光照補償;文獻[9]提出基于線性子空間和商圖像理論的人臉光照補償。本文在分析了多種人臉光照補償方法后,提出一種人臉光照自適應調節算法。該算法能根據人臉亮度對人臉的光照強度進行自適應調節,減小光照對人臉圖像的影響。

針對人臉模糊問題,文獻[10—11]將人臉模糊歸到人臉質量問題中,結合人臉識別完成人臉質量評估;文獻[12—13]通過對模糊人臉進行去模糊,來消除人臉模糊問題;文獻[14]通過對運動模糊圖像的模糊核進行估計,來解決圖像模糊。然而,通過去模糊技術消除模糊人臉的方法很難保證其泛化性。為更好的解決人臉運動模糊問題,本文發現將人臉運動模糊問題當作分類問題進行解決效果顯著。因此,本文設計了一個分類模型,以解決人臉運動模糊問題。

1 人臉光照自適應調節算法

鐵路站房設計的不統一和車站閘機擺放位置的差異,導致閘機采集到的面部圖像亮度差異較大,本文使用AFLW2000數據集的圖片模擬鐵路場景光照對人臉的影響,如圖1所示。為消除人臉圖像亮度差異對人臉識別算法造成的影響,本文設計了人臉光照自適應調節算法,算法步驟如圖2所示。

圖1 模擬鐵路場景光照對人臉影響

圖2 人臉光照自適應調節算法流程

本文通過HSV顏色空間的亮度值來判斷圖像的亮度值,對亮度值不在閾值范圍內的圖像,先進行去霧處理,對去霧后的圖像,再次進行亮度值判斷,若亮度值仍不在閾值范圍,對圖像進行Gamma矯正后輸出。

1.1 顏色空間轉換

攝像頭采集到的圖像多為RGB顏色空間,RGB顏色空間不能表示圖像的亮度信息。為了能夠根據圖像的亮度對人臉圖像進行光照自適應調節,需要進行圖像的顏色空間轉換,即將圖像由RGB空間轉換到HSV空間。HSV空間中的明度(V,Value)表示顏色明亮的程度,通過計算圖像明度的均值,能夠較好的體現圖像的亮度信息。本文的顏色空間轉換僅用于圖像亮度值的判斷,在暗通道去霧和圖像Gamma矯正中,均使用RGB圖像作為輸入。

1.2 基于暗通道的圖像去霧

暗通道先驗理論[15]是基于對大量戶外無霧圖像的觀察所得到的統計規律,即在大多數不包含天空區域的圖像中,存在一些像素點至少有一個通道的像素值接近于0。用J表示沒有霧的圖像,則圖像的暗通道像素值可表示為

其中,J dark表示圖像的暗通道像素值;J c表示圖像的r、g、b 3個通道的像素值,通過遍歷處理J c的像素值生成J dark;x為圖像遍歷過程中的錨點;Ω(x)表示以x為中心的方形窗口;y表示本窗口內所有的像素值。

根據暗通道先驗理論優化有霧圖像,需分析有霧圖像的形成模型,一般采用的公式為

其中,I(x)表示有霧圖像;x指圖像中每個像素點;J(x)表示無霧圖像;t(x)是光線在散射作用下的傳輸函數;A表示全局大氣光成分;1 -t(x)表示光照散射作用的系數。該模型認為有霧圖像由兩部分組成:(1)J(x)t(x)為有霧圖像中成像物體反射光的部分,成像物體反射光受大氣中懸浮粒子的吸收和散射作用,造成目標反射光能量的衰減;(2)A·(1-t(x))表示有霧圖像中大氣光部分,太陽光等環境光受大氣散射介質的散射作用形成背景光。

采用暗通道去除的方法進行圖像去霧,處理公式為

其中,t0表示預設的傳輸函數的最小值,通常取0.1??蓪Σ杉降牟粷M足光照約束的人臉圖像進行去霧,并對去霧后的圖像依據圖像亮度值判斷當前圖像是否需要進行光照調節,若需要,則進行圖像Gamma矯正。

1.3 圖像Gamma矯正

由于人眼對光照的感受是呈非線性變化的,對暗區的變化較敏感,對亮區的變化較遲鈍。為使圖像在展示時符合人眼的習慣,在圖像采集的過程中,會進行非線性編碼。但由于圖像編碼位寬的限制,圖像在編碼過程中會丟失部分數據,造成圖像質量的降低,通常采用Gamma矯正[16]的方法進行圖像質量的提升。Gamma矯正采用冪函數的形式

其中,N(x)是圖像像素值歸一化到[0,1]后的像素值;f(x)是圖像經過Gamma矯正后的輸出值;gamma是常量,根據任務的不同設置不同的值,如對過亮、對比度過大的圖像,設置gamma>1,對亮度值過暗、對比度過小的圖像,設置gamma<1。

為實現人臉光照自適應調節,本文提出自適應Gamma調節算法,公式為

其中,f(x)表示經過自適應Gamma矯正后的輸出值;K(x)表 示原始圖像的像素值; mean(K(x))表示圖像的亮度均值,代表圖像的整體亮度值;std(K(x))表示圖像的亮度標準差,代表圖像的對比度。本方法可根據圖像的亮度和對比度情況,自適應設置gamma值,實現圖像亮度和對比對度的自適應調節。

2 模糊識別模型

本文提出一種人臉模糊識別數據集的制作方法,基于MobileNetV2的深度可分離模塊設計了特征值注意力模塊,構建了最基礎的模糊識別模型,在此基礎上,設計了局部賦權模塊,對模糊識別模型中人臉圖像上不同的圖塊賦予不同的權值,并提出使用Arcface loss[4]作為人模糊識別模型的損失函數。

2.1 數據集的制作

在模糊識別領域,公開數據集主要集中在通用模糊識別方向,由于人臉模糊識別的特殊性,如面部區域平滑,缺少有效的邊緣信息等特點,缺少充足的公開數據進行算法訓練。本文在研究過程中發現,鐵路領域人臉圖像的模糊主要由旅客在過閘機時的瞬間移動造成,由運動方向和運動程度2個因素決定[17]。因此,本文基于高斯濾波理論,設計了人臉模糊圖像生成算法,使用高斯核尺寸模擬運動模糊程度,使用高斯核方向模擬運動方向。將人臉運動方向劃分為18個區間,每個區間表示20度。將運動程度分為7個級別,分別使用高斯核尺寸3、4、5、6、7、8、9表示。在角度為20的情況下,不同運動程度生成的模糊圖像如圖3所示。

圖3 清晰圖像與不同運動程度生成的運動模糊圖像

本文把人臉模糊識別算法定義為二分類任務,即模糊、非模糊兩類。按不同的運動程度,把原圖、1級、2級、3級4類圖像歸為清晰圖像,把4級、5級、6級、7級4類圖像歸為模糊圖像。

2.2 網絡模型設計

為提升人臉模糊圖像識別準確率,解決圖像局部模糊識別,增加模糊識別的可控性,設計了特征圖注意力模塊和局部賦權模糊識別算法。

2.2.1 特征圖注意力模塊

疫情期間,旅客乘坐列車需佩戴口罩,由于口罩缺少皮膚紋理和邊緣信息,會影響模糊識別算法的準確率。因此,本文設計了特征圖注意力模塊,以提升網絡對口罩部分的過濾和非口罩區域的關注。本模塊基于MobileNetV2的深度可分離模塊,在輸入和輸出間增加了一個1×1的卷積,該卷積把圖像從多通道映射為單通道的特征圖,本特征層可有效提升模型對不同區域的注意力分布,以提升在佩戴口罩情況下的模糊人臉圖像識別準確率。針對卷積步長為1和卷積步長為2,設計了2種模塊,模塊的結構如圖4所示。

圖4 特征圖注意力模塊結構

2.2.2 局部賦權模塊

為避免背景模糊和局部模糊對人臉模糊識別準確率的影響,本文設計了局部賦權模塊,輸入是經過人臉檢測算法后的面部圖像,在輸入網絡前會經過尺度變換,尺寸統一變換為3×112×112,如圖5所示。

本文設計的主干網絡包含7個注意力模塊,把3×112×112的圖像映射為1 024×4×4的特征圖,特征圖中的每個位置對應圖5(b)中相應位置的特征值。最后通過1×1卷積,把1 024個通道映射為2個通道,對應清晰與模糊兩個類別,再通過softmax計算清晰和模糊的概率值,作為神經網絡的輸出,網絡結構如圖6所示。

圖5 圖像分塊示意

圖6 局部賦權模塊網絡結構

圖像在經過模型的計算后,輸出2×4×4的介于[0,1]之間的2個通道的數組,其中第1個通道表示清晰程度的概率值,第2個通道表示模糊程度的概率值。

本文根據不同的面部塊包含人臉信息的重要程度,對數據進行了進一步的處理,對每塊賦予不同的權值,網絡輸出的第1個通道(圖像塊清晰概率值)與權重數組的點乘結果即為最終的得分,計算過程如圖7所示。

圖7 圖像清晰度計算過程

本文設0.3為是否清晰的判斷閾值,即最終得分大于0.3為清晰圖像,最終得分小于0.3為模糊圖像。

2.2.3 損失函數設計

在分類問題中一般采用softmax損失函數,公式為

其中,N為批尺寸;n為類別數;xi為第i個樣本的輸出;yi為第i個樣本所屬類別的輸出;Wj為第j個類別的權重;bj為第j個類別的偏置。

softmax損失函數雖然可實現分類的目的,但在分類時不能同時增大類內相似性與類間差異性,降低了模型的分類性能。為此,本文采用ArcFace[18]損失函數,公式為

其中,s為縮放比例; θyi為本類樣本與本類樣本特征值中心的特征值間的夾角;θj為非本類樣本與本類中心的特征值間的夾角。

為增大類內相似性與類間差異性,對本類樣本與本類中心的特征值間加上一個決策邊界m,則損失函數為

3 算法實驗

3.1 圖像預處理

為提高模型的識別準確率,需對輸入的圖像進行預處理,圖8展示了人臉光照自適應調節算法處理前后部分圖像的對比情況。

圖8 光照自適應調節前后圖像對比

由圖8可看出,本文設計的人臉光照自適應調節算法能較好地解決鐵路場景下人臉光照問題,經過人臉光照自適應調節算法處理后的圖像中的人臉更加清晰。

3.2 實驗與結果分析

本文的測試數據集采用自建的鐵路人臉模糊數據集,圖像均經過光照自適應調節算法處理。測試數據集中清晰圖像15 436張,模糊圖像794張。實驗環境:Win10操作系統、PyTorch1.8.1(CPU版)、Intel i7-8565U CPU、8 G內存,使用Python進行測試。

模糊識別作為一個分類任務,可與主流的分類任務模型MobileNetV2進行對比實驗,本文使用準確率和召回率作為評價指標,對MobileNetV2模型、僅包含特征圖注意力模塊的基礎模糊識別模型(模糊識別模型-A)、使用了局部賦權模塊的模糊識別模型(模糊識別模型-B)和使用了局部賦權模塊與Arcface損失函數的模糊識別模型(模糊識別模型-C)進行對比測試。準確率的公式為

其中,TP表示正確的正例;FN表示錯誤的反例;FP表示錯誤的正例;TN表示正確的反例。

本實驗對使用不同的組件進行了對比實驗。判斷是否清晰的閾值確定方式為:以0.01為步長,遍歷所有的0到1之間的數,計算不同閾值情況下的模型準確率,取準確率最高的閾值作為模型的閾值。由表1可知,模糊識別模型-C的圖像識別準確率提升到97.21%。

表1 不同模型的性能參數及準確率

4 結束語

本文設計了人臉光照自適應調節算法,該算法能夠較好地解決鐵路場景中的人臉光照問題,使人臉圖像亮度更適合進行人臉識別。通過對人臉模糊情況進行分析,設計了人臉模糊圖像制作的方法,構建了鐵路人臉模糊數據集。設計并改進了模糊識別算法模型,有效提升人臉模糊圖像的識別準確率。

猜你喜歡
人臉亮度光照
節能環保 光照萬家(公益宣傳)
有特點的人臉
一起學畫人臉
節能環保光照萬家(公益宣傳)
春光照瑤鄉
亮度調色多面手
三國漫——人臉解鎖
亮度一樣嗎?
基于斬波調制的LED亮度控制
人生的亮度
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合