?

基于自適應動量因子的BP神經網絡優化方法研究

2019-09-10 07:22王錦趙德群鄧錢華宋瑞祥
現代信息科技 2019年7期
關鍵詞:自適應圖像識別神經網絡

王錦 趙德群 鄧錢華 宋瑞祥

摘? 要:人工神經網絡是模仿動物神經網絡行為并執行分布式并行信息處理的數學模型。網絡依賴于系統的復雜性,調整大量節點之間的連接,達到處理信息的目的。因BP神經網絡具有自適應性、自組織性和實時性等特點。目前,它廣泛應用于模式識別、預測估計、信號處理等領域;因BP網絡是基于梯度下降法實現算法學習的,所以不可避免地存在算法收斂效率較低的情況,非常容易??吭诰植孔钚↑c上導致在預測問題上效果一般。如何優化改進BP網絡一直是一個備受關注的焦點。本文從兩方面著手改進BP神經網絡,并以在出版物中的圖像識別為應用進行研究,以求提高網絡收斂性和預測精度。

關鍵詞:神經網絡;自適應;圖像識別

中圖分類號:TH165.3;TP183? ? ? 文獻標識碼:A 文章編號:2096-4706(2019)07-0011-03

Abstract:Artificial neural network (ANN) is a mathematical model that imitates the behavior of ANN and performs distributed parallel information processing. The network relies on the complexity of the system,adjusting the connection between a large number of nodes to achieve the purpose of processing information. Because BP neural network has the characteristics of self-adaptability,self-organization and real-time. At present,it is widely used in pattern recognition,prediction and estimation,signal processing and other fields. Because BP network is based on gradient descent method to realize algorithm learning,inevitably,the convergence efficiency of the algorithm is low,and it is very easy to stop at the local minimum point,which leads to the general effect on prediction problem. How to optimize and improve BP network has always been a focus of attention. In this paper,BP neural network is improved from two aspects,and the application of image recognition in publications is studied in order to improve the convergence and prediction accuracy of the network.

Keywords:neural network;adaptive;image recognition

0? 引? 言

BP神經網絡具有自適應性等特點,廣泛應用于模式識別領域。但是由于自身的一些局限性,諸如易陷于局部極小、網絡收斂速度慢、訓練時間長等。如何優化改進BP網絡一直是一個備受關注的焦點。本文提出一種改進BP神經網絡的研究方案,通過引入自適應動量因子來進行網絡優化。

1? BP神經網絡算法優化——以圖像識別應用為例

1.1? 傳統的神經網絡算法

1.1.1? 圖像灰度化

圖像灰度化有多種算法,加權平均數算法是其中主要的幾種算法之一,主要機理是給一個彩色圖像的各個RGB分量進行加權的計算,然后轉換成灰度數值并進行平均。式(1)所示,是該方法的常見加權均值公式:

本文采用的灰度化處理方法,只是一個圖像存儲格式的轉換,對整理的算法識別沒有太大的優化作用,但是這種加權平均的灰度化計算方法,已經能滿足本文平面圖像圖文分割的圖像處理要求了。

1.1.2? 二值化處理

所謂二值化處理,即將灰度化的圖像轉成只有黑色和白色的圖像,這個過程是本文算法處理的必經步驟,而且二值化處理的效果會直接影響到后續算法的效果。通常,需要選取一個合適的閾值Threshold(0到255之間)來將黑色和白色分開,即大于該閾值的背景像素設為白色(255),小于該閾值的設為黑色(0),其具體計算公式為:

其中T(x,y)是輸入圖像(x,y)的灰度值m(x,y)進行處理后的輸出灰度值,由式(2)可以看出,選取合適的Threshold閾值是二值化處理的關鍵,不同的Threshold閾值二值化后的圖像效果也不一樣。

本文選取了只適用于局部圖像特征的閾值進行二值化的算法,這個算法在對圖像進行局部小塊的分割時,重點將環境光的背景影響因素作為參數考慮了進去,然后通過一個變化的連續矩形窗口來進行最佳閾值的尋找,并利用此閾值進行圖像的二值化,這是一個不間斷的連續過程,由于對于環境背景光線的考慮,所以圖像在處理后效果較好。

其中,m(x,y)為掩模區域的灰度平均值,s(x,y)為掩模區域的標準方差,k和掩模窗口的大小為經驗參數,通過式(2)不同閾值處理的效果試驗,本文中取掩模窗口大小為8×8,k為0.5,R選取0到255的中間值128,作為s的標準化參數。

1.1.3? 圖像去噪

圖像去噪的主要機制是在圖像中選擇一個目標像素,然后對于此像素以坐標為中心給定一個固定值的窗口,然后采用窗口滑行計算的方式,將每個窗口內的目標像素四周的像素的灰度值進行全部的平均,然后用求得的平均值代替中心目標像素的灰度值。

1.1.4? 版面校正

采用移動智能終端來采集圖像信息,由于采集圖像信息時移動終端所處的空間位置的不同,這使得采集的圖像或多或少存在形變。本次設計中對于形變問題也采取了相應的預處理措施,具體過程如下:

(1)圖像膨脹化,該種處理方式采用窗口大小為3×3的結構窗口,用這樣大小的窗口去覆蓋二值化圖像中的像素點,當覆蓋的窗口中的所有像素點的值為0時,則對應的像素點值為0,否則像素值設置為1;

(2)基準點獲取,圖像經過膨脹處理之后,再對圖像的數據進行處理,查看在垂直向的像素一致區域長度是否滿足設定的閾值,滿足則將該區域的中心點作為基準點;

(3)左右鄰近點獲取,定位完成基準點之后,需要對基準點的左右側進行處理尋找鄰近點,尋找公式為:

式(4)和式(5)中D指代需要得到的鄰近點,S指代的是對應的基準點,k為加權系數,一般取值為10。通過式(4)和式(5)計算得到最小正整數的WL和WR,其對應的D即為需要計算得到的近鄰點,通過對所有鄰近點的連接就能夠得到文字行的初始連線。

(4)位置校正,完成鄰近點的連線之后,還要計算校正斜率,根據這個計算得到的數值,然后對于采集到的平面圖像數據進行一步步的移位和旋轉操作,就可以逐漸得到科學的校正之后的圖像效果,整個流程如下:1)讀入二值化圖像;2)圖像膨脹化處理;3)尋找基準點;4)對基準點尋找其左右方向的鄰近點;5)連接基準點和臨近點;6)定位的基本文字行;7)計算校正斜率;8)復原文檔圖像。

1.2? 基于自適應動量因子的算法優化

上一節介紹了傳統神經網絡用于圖像識別的基本算法,這些算法由于設計缺陷,在針對本文研究的平面圖像識別適用性上都有一定的限制。所以,如何能夠把兩種不同的算法進行有機的整合,從而有效的結合當前兩種算法各自的優點,并發揮相應的適應性,是當前各個高校以及工業界進行研究的重點。本文即根據這一思路,設計整合了一種綜合算法,流程如下:(1)讀取文檔圖像;(2)圖像預處理;(3)單字黑體擴充;(4)輪廓投影;(5)分割線及連通閾值獲取;(6)同質區域合并;(7)文檔版面分割。

1.2.1? 基于連通域的文字提取

通過對出版物中的文字進行分析,研究其主要組成的漢字的特征,可以得出以下結論,大多數字體的點,即像素點在八連通的鄰域內需要一行或者一列全是白色的行列點,邊緣點除外,另外需要考慮到每一個漢字都是接近于方塊形狀,需要將這個鄰域的分析方法在這個基礎上進行一定的擴充。

本文對于出版物中出現的漢字用連通鄰域的方法進行相應的黑體擴充,然后可以在水平或者豎直方向上進行投影。

對于單個字進行黑體擴充的具體算法實現步驟如下:

(1)進行文檔圖像的掃描,特別是需要采用八連通域的方法對于圖像內的全部像素點都進行掃描和分析;

(2)對于圖像中的像素點都進行以下的判斷,看是否存在空白的列或者空白的行在其八連通域的范圍內,如果存在,就不進行處理;如果不存在,則說明這個像素點周圍是有一些黑色像素點的,這些點是分布比較均勻的,就需要把其八連通域的周邊的像素點全用黑色進行填充。

1.2.2? 輪廓投影

本文在后續的步驟中將單個漢字填充后的出版物文檔進行整個的輪廓投影,并對于投影后的像素進行水平一行或者豎直一列的像素點個數統計,將這個總和進行對比之后,可以計算出整個出版物文本圖像里的所有的行列投影值。

把原始的二值化的投影輪廓與投影圖進行對比之后,按照上述的方法進行投影,可以發現整個的直方圖的波谷和波峰都具有明顯的周期性,并且規律性和區分度都是非常高的,如圖1所示。

1.2.3? 分割線及連通閾值獲取

在平面圖像提取的數據中,對單個漢字的黑體進行擴充之后,相比于未進行處理之前的二值化圖像而言,其直方圖和投影信息會更加的充裕,里面含有多個不同的信息,也可以提取出一定的規律。因此,按照以上分析可以對于文本中的圖像進行尋找識別,定位圖像所在的具體坐標位置。

(1)提取出版物的版塊分割線。具體采用的分割線的提取方式如下:

平面圖像中的版面分布比較復雜,首先需要按照單個黑體字體進行擴充之后的圖像,然后采用1.2.2段落的自頂向下的方法即輪廓投影法,最后進行后續的處理,根據波谷的位置切分出版物文檔中的圖像并劃分區域。

(2)獲取并分析不同連通閾值。獲取連通閾值的流程如下:

1)出版物中的文本正文這一塊的內容由于直方圖投影呈現出的是比較明顯的波狀圖形,而且周期性是非常明顯的。通過這一系列識別和分析可以將各個行或者列之間的連通間距計算出來。

文本行或者列的連通間距th1計算公式為:

2)如果是平面圖像數據中的標題區域,這塊內容在直方圖中的投影也是呈現出一定的周期性的,不過標題的特點是較大,所以投影結果中波峰的寬度是非常大的,另外標題字體之間的距離通常是比正文字間距要大很多,因此這一部分間距也可以作為區分是不是標題的重要依據,同時可以根據波形的連通區域對于正文和標題進行區分,合并相應的域值。

文本標題字符之間的連通間距th2計算公式為:

其中M為該區域內的波谷個數,di為第i個波谷的寬度,就是該區域樣本中第i個標題字符間的連通間距;

3)在按照上述方法對出版物采集到的圖像數據中每一個像素的單字體進行擴充后,黑色的像素可以更加密集的出現,對于圖像區域的識別也會更加顯。

2? 結? 論

本文采用的連通域的分割算法是基于輪廓投影的,實現比較簡單,與傳統的基于連通域的分割算法相比,速度有了一定的提升,而且可以解決一些傳統算法中的不準確等問題,大大地提高了算法的準確率。

參考文獻:

[1] 柴毅,尹宏鵬,李大杰,等.基于改進遺傳算法的BP神經網絡自適應優化設計 [J].重慶大學學報(自然科學版),2007(4):91-96.

[2] 王燕妮,樊養余.改進BP神經網絡的自適應預測算法 [J].計算機工程與應用,2010,46(17):23-26.

[3] Meng X,Han X,Xu Q. BP Network Optimized with Genetic Algorithm and Apply on The Fault Diagnose of Complex Equipment [J]. IEEE,2007:1630-1633.

[4] Zheng B H . Material procedure quality forecast based on genetic BP neural network [J]. Modern Physics Letters B,2017,31(19-21):1.

作者簡介:王錦(1991-),男,漢族,山東濟寧人,碩士研究生,研究方向:電子科學與技術;趙德群(1974-),男,漢族,湖南邵陽人,碩士生導師,副教授,博士,研究方向:圖像處理與模式識別、智能多媒體信息處理等;鄧錢華(1978-),男,漢族,山西大同人,高級工程師,博士,研究方向:通信技術;宋瑞祥(1992-),男,漢族,山西大同人,碩士研究生,研究方向:信息與通信工程。

猜你喜歡
自適應圖像識別神經網絡
基于人工智能LSTM循環神經網絡的學習成績預測
基于計算機視覺的圖像識別技術研究
基于圖像處理與卷積神經網絡的零件識別
基于自適應神經網絡的電網穩定性預測
人工智能背景下圖像識別技術淺析
三次樣條和二次刪除相輔助的WASD神經網絡與日本人口預測
基于字典學習的正則化魯棒稀疏表示腫瘤細胞圖像識別
自適應的智能搬運路徑規劃算法
圖像識別交互系統
Ka頻段衛星通信自適應抗雨衰控制系統設計
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合