于得寶 何笑笑 王璇 河南師范大學 河南新鄉 453000
模式識別是人類的一項基本智力。人們一直在進行模式識別。隨著計算機技術的普及和發展,計算機的識別能力越來越受到人們的重視。這也是人工智能和機器人技術發展的前提。
模式識別是處理和分析各種事物或現象(數字、文字和邏輯關系)來描述、識別、分類和解釋事物或現象的過程。它是信息科學和人工智能的重要組成部分。生活中最簡單的事物無過于簡單的數字0-9,同時,數字被廣泛應用于車牌識別、郵政編碼識別等多個方向,因此數字字符識別是一個很有實用價值的課題。
通過將識別的數字圖像的特征值讀入定義的識別算法并輸出識別結果來識別數字識別。識別步驟主要有:數據提取、預處理、特征值提取與選擇、分類器設計與分類決策。
本文對0~9灰度圖像進行處理。有400組圖片。分為十組,每組0~9個數字,每組40個。他們被分成30個訓練樣本和10個測試樣本。本文借助MATLAB軟件的讀寫功能和DIR函數讀取“數字”文件夾下的所有圖片,并得到包含36×20×40×10的圖片數據的四維數組。每張圖片的數據是36×20的數據矩陣。
圖像預處理應根據實際圖像進行操作,將處理時間和正確率結合起來。一般來說,預處理的目的是去除圖像中包含的干擾噪聲,增強有用的信息,恢復退化的信息。圖像預處理包括圖像去噪、圖像二值化處理、分割處理和歸一化處理等一系列操作。
提取和選擇特征值的主要目的是對分割的矩陣塊的特征值進行統計。其主要目的是從數字的拓撲結構中提取一些結構特征,并減少數字的干涉相位,例如位移、尺寸變化和形狀失真,以及數字特征的關鍵。信息被提供給分類器。特征的選擇一般有以下原則:一是充分性原則,即提取的特征應該能夠充分保持原始圖案中的信息量;其次,在充分的SU的基礎上最小化特征的維數;此外,提取特征時所花費的計算量也不太大,否則會影響識別速度。本文將分割后的每個矩陣塊中的黑像素數作為矩陣塊的特征值,作為圖像的特征值。
從模式識別開始作為一門學科,研究人員提出了多種識別方法。本文主要研究了最小距離法、最近鄰法、K近鄰法和BP神經網絡理論,并通過MATLAB進行了實驗分析。
最小距離法是一種簡單的模式識別方法,它是基于模式的采樣來估計各種類型的統計參數,并且完全由各種類型的均值和方差來確定。當兩種均值之間的距離大于該類中相應均值的距離時,最小距離分類器可以很好地工作。
最小距離法可以直接計算待測樣本之間的距離和樣本中的平均值,并將樣本分類為最小距離。
最小距離法是一種簡單直觀的模式識別方法。然而,當每個模式樣本的均值(“代表”)不能很好地表示每個模式時,結果將是所設計的分類器出現較大的錯誤率。
針對這個問題,利用覆蓋和HART提出最近鄰方法。為了更好地表示每一個模式類別,一個極端的方法是使用模式類別中的所有樣本作為“代表點”,并將被測試的樣本分類為一類最小距離。
K近鄰法是上鄰近鄰法的推廣,因此神經網絡中輸入神經元的數目是36。為了識別0-9的10個數,本文使用8421個碼來識別輸出“0”,使用(0,0,0,0)主目標向量表示輸入“1”,使用輸出向量,如(0,0,0,1)等,輸入“9”,并使用輸出向量,如(1,0,0,1)。因此,我們可以確定輸出層中神經元的數量是4,也就是輸出向量的維數。
本文中所識別的數字為0~9。訓練樣本從每個班的前30名中選出,共300個,而測試樣本則是后者100。在訓練樣本經過預處理和四種方法識別后,識別率如表1所示。
表1 識別率比較
結果表明,矩陣的分段數可以在一定程度上提高識別率,但增加分割塊的數目將大大增加計算量并延長識別時間。同時,在四種方法中,最近鄰法可以獲得最高的識別率,達到100%。BP神經網絡作為一種智能算法,在理論上的識別效果應該更好,但并沒有達到預期的效果。這與BP神經網絡在實驗中的學習和訓練功能的選擇以及其各種參數的調試有關。這也是進一步研究的一種方式。