?

基于CNN模型的裝甲目標的提取與實現

2019-04-22 06:53阮軼磊張雷李剛
科技與創新 2019年7期
關鍵詞:訓練樣本步長濾波器

阮軼磊,張雷,李剛

?

基于CNN模型的裝甲目標的提取與實現

阮軼磊,張雷,李剛

(陸軍裝甲兵學院兵器與控制系,北京 100072)

基于卷積理論,從無人機拍攝視頻、圖片中提取裝甲車輛目標,為指揮員決策提供依據。主要研究卷積模型的訓練策略與過程,包括訓練樣本的選擇、組織與預處理、卷積模型的改進與超參數設置,防止過擬合采取的策略,有效提高模型對裝甲圖片的識別效果。

卷積網絡CNN;卷積理論;裝甲車輛目標;訓練樣本

1 引言

隨著部署于戰場的傳感器數量增加,指揮官們能輕易獲得巨量的視頻、圖片數據,但對數據的分析、處理、應用依然缺乏有效手段。如何快速高效地在這些數據中找到感興趣的目標并施以打擊,對戰爭勝負將會有至關重要的影響。人工智能技術的快速發展,給目標篩選辨別帶來了更為優化的選擇。以察打一體無人機為例,如果機器能依據目標的圖像特征、紅外特征等自動做出判斷,并主動發起攻擊,其效率與毀傷效果將會成倍增長,真正做到發現即摧毀,戰爭模式將會發生根本改變。本課題力圖以前沿的深度學習技術實現對視頻圖片中裝甲目標的檢測,努力將最有可能的作戰對象呈現在指揮員面前,幫助他們刪除干擾信息,抓住戰機。指揮員一旦確定目標,就可以根據圖片拍攝信息倒溯出目標出現的位置與時間,并由此推斷出敵方行動計劃,做出更為合適的應對(打擊或回避)。

2 卷積網絡CNN

卷積神經網絡(CNN)是一種為了計算二維輸入數據而經過特別設計的多層人工神經網絡。網絡中的每個層面都由多個二維面構成,而且每個平面之間互相由多個獨立的神經元組成。CNN廣泛應用于計算機視覺問題的處理上,采用多層卷積網絡實現裝甲圖片分類的測試過程如圖1所示。

圖1 多層卷積網絡圖片分類示意圖

一個典型的卷積網絡分類器由多種不同功能層疊加而成,除了輸入輸出層,還應該包括卷積CONV層、池化Pooling層、全連接層,進而通過相關的得分函數輸出分類概率,例如圖片包含戰場辨別敵軍坦克的概率為96.35%.卷積神經網絡作為一個媒介,一層一層把提供的原始圖像數據轉換成為最后的類別得分。其中,卷積層和全連接層包含權重和偏置,而RELU和POOLing層作為一個固定的函數運算。卷積層參數可看作一種有能力通過訓練/學習進而達到目的的濾波器,在前向計算過程中,上層網絡一定區域的數據和濾波器點乘后得到新的二維數據作為卷積層的神經元,濾波器按照一定的步長在原始數據上滑動,經過計算得出所有的新神經元,進而組成我們所需要的卷積層,如圖2所示。

圖2 卷積過程示意圖

通過這種方式,卷積層的神經元只會和上一層的一些局部區域進行互相連接,如圖3所示。每個所屬的濾波器僅僅關注數據小平面內出現的部分特征,當出現它學習到的特征的時候,就會自動激活態,進行報警。

圖3 卷積過程示意圖

3 裝甲圖像訓練集的獲取與預處理

3.1 數據獲取

訓練樣本的選取必須考慮客觀性與代表性,努力與真實的應用場景相一致。本文中,除了包含各類裝甲照片的正例樣本,負例樣本也必須是裝甲車輛可能出現的道路、荒漠、草原、灘涂或丘陵。除了場景地域,樣本還應體現季節變換、天氣變化帶來的植被改變與背景明暗差異,以及由于拍攝角度、障礙遮擋、目標運動等導致的形變問題。

基于裝甲目標的圖片樣本獲取,如果調用裝備,采用無人機實地拍攝,可能會因審批困難、成本高昂、目標單一而中途夭折,并且得到的訓練樣本呈現高度一致化,將會導致過擬合現象出現。獲取過程如下。

3.1.1 網頁分析

在百度輸入“裝甲”進入圖片搜索,如圖4所示。任意選中一張圖片,查看源代碼,找到圖片對應地址objURL。

圖4 圖片搜索結果

3.1.2 編寫爬蟲

需要下載的圖片很多,因而外部使用一個循環,由于可能存在網址錯誤,再加一個超時控制,當搜索時間超過3 s,跳出循環;將上述網址傳入requests,編寫出正則表達式;最后將下載的圖片命名、保存。完整代碼如圖5所示。

圖5 圖片爬蟲源代碼

3.2 數據預處理

數據預處理的常用方法包括去均值、PCA(主成分分析)。深度學習實踐中,樣本均值較大會導致權值更新過大,各層之間相互影響,整個學習過程低劣而緩慢。為了解決這一困難,通常做法是在不改變數據相對位置的前提下,對數據進行集中,先期將樣本數據進行去均值、歸一化處理,改善數據分布。其做法是將數據從普通分布,變成0均值、單位方差分布,讓訓練易于收斂,如圖6所示。

圖6 0均值與歸一化處理

0均值的具體實現方法:首先計算所有圖片樣本均值,然后每一幅圖片都減去該均值,如此,將數據從標準坐標系下的一個個向量組成的矩陣,變成以上述這些求解的向量均值為原點構建的坐標系。

PCA實現過程:將原始圖片轉換成一個列向量,整個訓練集即可組成一個原始矩陣,對歸一化后,對的協方差矩陣進行求解;而后對奇異值分解(矩陣),排列的特征值與對應的特征向量;然后依據特征值大小,判別所有的特征現象,從而對所有特征向量進行降序排列,得到矩陣.按照規定的信息提取規則提取的前列得到投影矩陣;最后將所有系統訓練圖片向投影即可得到降維后的所需數據。

4 基于Alexnet模型的裝甲分類設計與實現

本文的目標是檢測出圖片中是否包含裝甲圖像,屬于一個二分類問題,輸入為圖片,輸出為類別,包含地方目標裝甲圖像輸出標簽1,否則設置系統輸出標簽0.采用的Alexnet模型如表1所示。

Alexnet的第一層結構是由卷積層組成的。第一層的輸入為目標提供數據,由于深度學習的框架規則限制,系統對輸入圖片問卷大小有要求,因此統一將圖片歸一化為227×227大小的彩色圖像,經過上述操作后第一次卷積操作和為11×11×3的大小,共用了96個濾波器,步長為4,那么該操作的神經個數就應該等于224×224×3=150 528.

通過卷積計算后的圖片稱為特征圖,則卷積后的大小變為(224)/4-1=55,減一表示對于圖片邊緣需要刪除,將處理后的55×55大小的特征圖經過ReLu激活函數、Norm歸一化,其輸出數據的大小不會發生變化,之后再將卷積層連接池化層,給數據降維。最終輸出特征圖大小為27×27×96.兩個卷積層之間的基本操作及結構類似于對第一層卷積層的計算,本次卷積操作中對新輸入的特征圖會進行一項填充操作,從而擴大小為5×5的卷積變為27×27,同時卷積核變為256個。池化操作降低維度為13×13,最終特征圖大小13×13×256.第三個卷積層卷積核減小為3×3,同時也填充邊長為1,濾波器的格式改為384個。ReLu的激活函數在第三層不連接池化層,因此最終輸出的特征圖大小13×13×384.第四個卷積層卷積核大小為3×3,因層數越深特征越抽象,也越重要,繼續填充操作,之后進行ReLu,該層的卷積核不變。

表1 AlexNet各層結構的參數設置

輸入圖像大?。ù笮?27×227×3) 卷積層1卷積核11×11,數量94,步長4,激活函數Relu輸出特征圖像大?。海?25-11)/4+1=55即55×55×96 池化層1Kernelsize=3,stride=2輸出特征圖像大?。海?25-11)/4+1=55即55×55×96 卷積層2卷積核5×5,數量256,步長1,激活函數Relu輸入圖像擴展2像素,輸出27×27×256 池化層2Kernelsize=3,stride=2輸出13×13×256 卷積層3卷積核3×3,數量384,步長1,激活函數Relu輸入圖像擴展2像素,輸出13×13×384 卷積層4卷積核3×3,數量384,步長1,激活函數Relu輸入圖像擴展2像素,輸出13×13×384 卷積層5卷積核3×3,數量256,步長1,激活函數Relu輸入圖像擴展2像素,輸出13×13×256 池化層3Kernelsize=3,stride=2輸出特征圖像大?。?6×66×256 全連接層14 096個神經元,dropout抽取4 096×1的特征向量 全連接層24 096個神經元,dropout抽取4 096×1的特征向量

第五個卷積層的卷積核為256,大小為3×3,填充大小為1,連接ReLu激活函數,之后連接池化層降維,設置步長為2,濾波器大小3×3,最終輸出特征圖為6×6×256.第六層網絡結構為全連接層。將第五層的特征圖作為輸入,該層的神經節點個數為4 096,然后進行dropout,隨機丟掉一些神經元或權重防止過擬合。本層最終輸出節點為4 096個。第二個全連接層(fc7)是進ReLU(relu6)上一個全連接層(fc6)后進行隨機丟棄操作全連接的所得到的結果。本層節點數目為4 096個。最后一層全連接層目的時對最終任務進行分類,本層輸出節點2,二分類任務為2類對象。

特征提取是將訓練樣本映射到某個特征空間,縮小同類的特征距離,增大不同類間的特征距離,從而通過簡單的分類器進行分類。特征提取后可以用監督學習的方法,學習得到兩類問題的分類器,以判斷目標出現在某一位置的概率。

5 結束語

本文基于卷積理論,研究如何從無人機拍攝視頻、圖片中提取裝甲車輛目標,為指揮員決策提供依據。主要研究卷積模型的訓練策略與過程,包括訓練樣本的選擇、組織與預處理,卷積模型的改進與超參數設置,防止過擬合采取的策略,有效提高模型對裝甲圖片的識別效果。

[1]劉增良.模糊技術與神經網絡技術選編[M].北京:北京航空航天大學出版社,2001.

[2]于功敬,厚澤,王振華.裝備測試性設計與診斷策略優化技術研究[J].電子測量技術,2012,35(7).

[3]胡曉輝,張建國.基于改進卷積神經網絡的圖像超分辨率算法研究[J].計算機應用研究,2018(4).

[4]楊明,王冰,王春香,等.基于環視相機的無人駕駛汽車實例分割方法[J].華中科技大學自然報,2018(12).

[5]王瀟天.基于深度學習的目標檢測研究與應用[J].電子制作,2018(22).

2095-6835(2019)07-0049-03

TJ810.1

A

10.15913/j.cnki.kjycx.2019.07.049

阮軼磊。

〔編輯:嚴麗琴〕

猜你喜歡
訓練樣本步長濾波器
淺談有源濾波器分析及仿真
基于多模諧振器的超寬帶濾波器設計
基于變步長梯形求積法的Volterra積分方程數值解
一款用于無線通信系統的小型濾波器天線
人工智能
董事長發開脫聲明,無助消除步長困境
起底步長制藥
步長制藥
——中國制藥企業十佳品牌
基于小波神經網絡的網絡流量預測研究
FFT、PFT和多相位DFT濾波器組瞬態響應的比較
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合