?

基于目標檢測模型的人臉識別技術

2019-09-10 05:45孫彥丁學文雷雨婷
計算機與網絡 2019年22期
關鍵詞:卷積人臉神經網絡

孫彥 丁學文 雷雨婷

摘要:為了改善當前人臉識別技術存在準確率低、算法運行速度慢和無法識別多個目標的問題,提出一種基于目標檢測模型SSD_MobileNetv1的人臉識別方法,搭建Tensorflow Object Detection API框架,對人臉圖像進行數據清洗和過濾來減少噪聲對識別的影響,用MobileNetv1網絡對圖像進行特征提取,輸入至SSD網絡進行訓練,使用梯度下降法優化訓練網絡中的權重。實驗結果表明,多人臉識別目標定位準確、識別準確率高及模型訓練的收斂速度加快,具有魯棒性。

關鍵詞:人臉識別;SSD_MobileNetv1神經網絡;數據清洗;梯度下降

中圖分類號:TP391文獻標志碼:A文章編號:1008-1739(2019)22-68-4

0引言

人臉識別是基于對人的臉部特征信息來識別身份。在當今這個處于大數據和云計算的社會,人臉識別在現實社會中的應用相當廣泛,例如在火車站安檢、公安系統、視頻會議及醫療等方面,人臉識別技術正逐步成為智能化領域的研究課題[1]。

傳統的人臉識別算法包括PCA[2],LDA[3],LBP[4]等,在提取特征和準確度方面均存在一定不足。杜翠鳳采用深度卷積對抗神經網絡對多狀態自適應的人臉識別,準確率達75.87%[5];胡少聰將卷積神經網絡和SIAMESE網絡進行了組合,對不同部位及尺度的人臉圖像訓練從而實現人臉識別,達到81%的準確率[6];利用yolo_v2對多個人臉進行識別,發現對人臉目標的定位不準確,且識別的準確率不夠高。

雖然現在人臉識別技術在準確度方面有所提升,但對于內存資源占用量大、運行效率慢以及多人臉圖像的識別仍然存在欠缺。針對上述問題,提出一種在Tensorflow Object Detection API框架下,利用目標檢測模型SSD_MobileNetv1生成先驗框判斷不同尺度目標識別多個目標的特點,以及深度分離可卷積網絡減少網絡參數的特點,識別在不同表情、裝扮、光照等常見場景下的多人臉目標,該方法提升了識別準確率,加快了模型訓練時的收斂速度。

1 SSD_MobileNetv1網絡模型

SSD_MobileNe tv1網絡模型以SSD為基礎,在MobileNetv1骨干網絡的conv13層后添加8個卷積層,抽取6層用作檢測層[7]。SSD_MobileNetv1結合SSD和MobileNetv1網絡,用3伊3大卷積核對各個通道輸出進行卷積和分解來提取特征學習,在深度卷積層和點卷積層后連接批規范層和relu函數來保證良好的精確度,再由點卷積執行特征融合進入卷積網絡,對特征進行篩選和映射,將特征輸入到網絡進行訓練以更新權重值,減少參數運算量,實現模型運行的加速。

1.1 SSD卷積神經網絡

SSD卷積神經網絡模型是利用單個深度神經網絡進行對象檢測的框架[8]。SSD變VGG原結構的2個全連接層為卷積層,刪除Dropout層,增加3層卷積和1層池化,在各個卷積層的feature map上構造不同的Bounding Boxes(BB)進行檢測,生成多個BB,利用NMS得到最終BB集合,提升模型精度和檢測能力。

SSD利用生成錨框的思想來生成先驗框,采用多尺度訓練方式,將不同大小默認框應用在特征圖上以離散化輸出框形狀,來滿足真實目標形狀多變的情況,SSD先驗框生成圖如圖1所示。

將其翻轉后得到另一個寬和高互換、面積相同的長方形。先驗框大小隨不同的特征圖和長寬比不斷變化,預測多個先驗框有效判斷目標的多種形狀,兼顧各個尺度的目標,實現在多個尺度的特征圖上執行檢測目標工作。

1.2 MobileNetv1網絡

MobileNetv1網絡模型是Google提出的使用深度可分離卷積來構建輕量級的深層神經網絡。優點在于分解卷積核,將標準卷積分解成深度卷積和點卷積,深度卷積將每個卷積核應用到每個通道,用單個卷積核對單個通道進行卷積,得到輸入通道數的深度,再利用點卷積對深度卷積的輸出線性結合從而產生新的特征[7]。這種分解可有效降低模型規模,減少網絡參數。深度分離卷積示意圖如圖2所示。

SSD_MobileNetv1網絡利用深度分離可卷積的特性將原有的冗余參數用小規模參數來替代,降低計算量和硬件內存資源消耗,收斂速度加快,有效控制過擬合。

2系統設計與實現

2.1人臉識別系統設計

本文設計的人臉圖像識別系統分為3個模塊,系統的實現框圖如圖3所示。第1個模塊是數據集構建模塊;第2個模塊是網絡訓練模塊,利用SSD_MobileNetv1網絡提取圖像特征,進行特征融合,完成網絡模型的訓練;第3個模塊是人臉識別模塊,將測試圖像輸入到已經完成訓練的網絡中進行計算,得到識別結果。

2.2人臉圖像預處理

本次實驗圖像數據來自Wider face數據集,圖片高達3萬張,包含了40萬張人臉,囊括了各個尺度、裝扮、光照及表情等常見的場景。

實驗之前,考慮到圖像具有隨機性,圖片尺寸大小不一,重復率較高等問題,需要對圖像進行預處理。首先,利用數據清洗處理缺失值、平滑噪聲、識別和刪除離散值[9],采用過濾和銳化操作增強圖像邊緣細節,可以有效提高圖像質量和圖像利用率。

Wider face數據集自帶含原始圖片的名稱與路徑以及人臉框坐標大小的txt文件,將含有圖像標注信息的txt文件轉換為XML文件以提供交換和描述獨立于應用程序的結構化數據。

此外,還需將XML文件轉換為tfrecord格式,可以把圖片數據信息和標簽一同存儲,可以快速在TensorFlow中實現復制、讀取和存儲等操作,達到加速模型讀取和訓練的效果。

3實驗仿真

3.1系統實驗

3.2實驗結果與分析

利用可視化工具Tensorboard查看網絡的性能,有效顯示網絡訓練期間各種指標隨時間的變化趨勢信息。隨著訓練次數的增加,訓練的損失呈現下降趨勢,網絡的良好性能優勢得以體現,圖像的失真率在減小,圖片識別的效果逐步提高。

選取了含有多個目標的人臉圖像對訓練好的人臉識別模型進行測試,來驗證模型的識別率,識別效果如圖4所示。

從識別效果圖發現,盡管測試圖像存在干擾背景,但SSD_MobileNetv1網絡模型依然能準確識別圖像中的多個人臉目標,并且識別率較高。

圖5是2種模型識別結果對比,圖5(a)是在yolov2模型下的識別效果圖5(b)是SSD_MobileNetv1網絡下的識別效果。為了提升對訓練圖像的分辨率,人臉識別一般會采用yolov2模型進行實驗,yolov2模型對人臉識別存在召回率以及定位能力提高的優勢,但圖5(a)中人臉沒有全部檢測出來,且識別的準確率也是低于5(b)的。

比較在SSD_MobileNetv1網絡和yolov2模型的識別率,結果如表1所示。

以上測試結果表明,SSD_MobileNetv1網絡對多個人臉共存圖片具有較好的目標定位效果,符合現實場景中多個個體出現,定位準確且識別精確度比較高。

4結束語

本文給出了一種基于目標檢測模型SSD_MobileNetv1的人臉識別,介紹了圖像數據清洗等預處理操作和SSD_MobileNetv1神經網絡的基本概念,介紹網絡訓練以及運用梯度下降法更新網絡訓練的權重,最后介紹了對人臉識別模型的測試和分析。實驗結果表明,本文方法對多人臉圖像中的人臉目標定位準確,且模型訓練收斂速度較快。后續的工作是繼續優化模型的性能,以求獲得更高的魯棒性,并將模型移植到手機等設備上,充分發揮其實用價值。

參考文獻

[1]安大海,蔣硯軍.基于BP神經網絡的人臉識別系統[J].軟件, 2015,36(12):76-79.

[2]曾建凡.多角度人臉檢測與識別方法研究[J].電子設計工程, 2017,25(11):41-44.

[3] Chen L F, Liao H YM, Ko M T, et al. A New LDA-based Face Recognition System Which Can Solve the Small Sample Size Problem[J]. Pattern Recognition,2000,33(10): 1713-1726.

[4] Ahonen T, Hadid A, Pietikinen M. Face Description with Local Binary Patterns: Application to Face Recognition[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 2006, 28(12):2037-2041.

[5]杜翠鳳,溫云龍,李建中.基于深度卷積對抗神經網絡的多狀態自適應人臉識別方法[J].移動通信,2019,43(9):75-78,85.

[6]胡少聰.基于深度學習的人臉識別方法研究[J].電子科技, 2019,32(06):82-86.

[7] Howard A G, Zhu M, Chen B, et al. MobileNetsV1: Efficient Convolutional Neural Networks for Mobile Vision Applications[J]. Computer Science -computer Vision and Pattern Recognition,2017:1704-1712.

[8] Liu W, Anguelov D, Erhan D, et al. SSD: Single Shot Multi Box Detector[C]// European Conference on Computer Vision, Springer,2016:21-37.

[9] Meisler Steven L, Kahana Michael J, Ezzyat Youssef. Does Data Cleaning Improve Brain State Classification?[J]. Journal of neuroscience methods,2019:328.

猜你喜歡
卷積人臉神經網絡
基于人工智能LSTM循環神經網絡的學習成績預測
基于圖像處理與卷積神經網絡的零件識別
玻璃窗上的人臉
基于全卷積神經網絡的變壓器故障診斷
基于深度卷積網絡與空洞卷積融合的人群計數
基于自適應神經網絡的電網穩定性預測
智力考場:有趣的圖片測試
三次樣條和二次刪除相輔助的WASD神經網絡與日本人口預測
卷積神經網絡概述
“領家系”可愛臉VS“高冷系”美人臉
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合