?

基于視覺詞袋模型的茶機智能化控制方法

2014-03-07 02:24譚和平徐海衛胡常安湯江文徐傳娣

中國測試 2014年6期

關鍵詞：向量茶葉神經網絡

譚和平，徐海衛，胡常安，湯江文，徐傳娣

（中國測試技術研究院，四川成都 610021）

基于視覺詞袋模型的茶機智能化控制方法

譚和平，徐海衛，胡常安，湯江文，徐傳娣

（中國測試技術研究院，四川成都 610021）

因3類名優茶在顏色上并無太大區分，紋理特征也不明顯，所以在茶機智能化控制方法中主要依靠人為的主觀判斷進行名優茶分類，準確度較低。針對這個問題，提出一種基于視覺詞袋模型的分類方法，首先對采集的茶葉圖片通過數字圖像處理的方法調整對比度，然后利用視覺詞袋模型提取每一張圖像的SIFT特征并生成視覺單詞，最后將每一張圖像表示成一個包含視覺單詞的向量，輸入到BP神經網絡中進行訓練并分類。實驗結果表明：該方法合理有效，可以被廣泛應用到茶葉分類問題中。

茶機；數字圖像處理；視覺詞袋模型；SIFT特征；BP神經網絡

0 引言

我國是茶葉的發源地，也是茶葉生產和出口的大國[1-2]。近年來，隨著茶文化在世界上的廣泛流行，茶葉的出口量呈現逐年增長的趨勢；但是，我國的茶葉分類技術落后于日本等國。為了保持我國茶葉的出口地位，提出準確合理的茶葉分類模型十分重要[3]。

茶葉檢測中比較重要的是名優茶的外觀分類，因為它包含難以準確區分的3個本質類別：芽茶、一芽一葉和一芽兩葉[4]。實際應用中只能靠人眼去辨別，非常耗時且不能大規模的推廣；另外，3種茶葉顏色上并沒有明顯區別，電子設備也很難進行準確的分類，所以，我國的茶葉分類技術還有待提高[5-6]?；谶@個問題，國內學者提出了基于視覺詞袋模型[7]和BP神經網絡模型[8]的名優茶外觀分類方法，在茶葉分類領域有較好的應用前景。

1 視覺詞袋模型

近年來，隨著信息技術以及計算機網絡的迅速發展，數字圖像的質量以及信息量日益增加，從圖像中得到的信息也越來越多。如何準確合理地挖掘圖像的信息，并對圖像進行識別、分類已然成為一個新興的研究領域。從20世紀70年代起，逐漸興起了圖像檢索的相關研究[9]。

基于視覺詞袋模型（bag of visual word，BOVW）的圖像表示近年來受到了強烈關注，該模型簡單有效地將一個圖像表示成為一個由多種視覺單詞組成的視覺向量；因為往往一張清晰的圖像有近3MB，而一個1000維的向量只占用8000bits，這無論是在存儲圖像還是計算中都是一個重要的模型，對于圖像檢索的效果和效率非常重要，尤其是應用在大量的圖像數據集中。

視覺詞袋模型主要可以分為3部分：

1）提取特征。在數字圖像中，我們關心的往往是一些擁有局部特征的像素點，比如圖像的邊緣、顏色。常用的圖像特征有紋理特征、顏色直方圖、灰度直方圖等，將圖像表示成向量，基于這些特征的信息量較少，特征也不穩定，所以圖像識別、分類等模型的效果并不理想。在視覺詞袋模型中，最常用的是尺度不變特征轉換（scale-invariant feature transform，SIFT），由于其具有尺度不變、旋轉不變、光照不變等多種穩定的優良特性，近幾年成為應用最廣泛的局部特征。

2）生成視覺單詞。由于SIFT特征個數太多，并且很多特征是相似的，所以需要通過聚類算法將特征量化生成視覺單詞。首先抽取所有茶葉圖片的SIFT特征，然后利用K-means算法對這些特征進行聚類，生成視覺單詞。

3）用詞頻向量表示圖像。在生成視覺單詞之后，每一個圖像便可以用一個向量表示，向量中每一個元素表示視覺單詞在這張圖像里面出現的個數；顯然，這個向量中的元素都是正整數。經過這種表示方法，每一個圖像都從很高的維度降低為一個向量，既保存了圖像間的區分性又降低了計算量。

2 人工神經網絡

人工神經網絡興起于20世紀60年代，最初通過電阻、放大器等電路原件進行仿真，其主要思想是通過將一系列功能與人腦中細胞類似的神經元按照一定的規則和權值連接起來，構成含有輸入層和輸出層的網絡。

根據不同的網絡假設，人工神經網絡有很多種類型：Hopfield神經網絡、RBF神經網絡、SOM神經網絡等，其中最為著名的是BP神經網絡[10]。由于BP神經網絡具有非常優秀的非線性擬合能力，所以被廣泛應用于識別、預測等領域。常見的BP神經網絡由3層結構組成，輸入層、輸出層還有介于這兩層結構之間的隱含層。神經網絡結構圖如圖1所示。

圖1 BP神經網絡的基本結構

BP神經網絡的目標函數為輸出層的數據與訓練數據的均方差MSE，每次迭代將當前的誤差反饋給網絡，通過不斷調整權值調整來達到網絡的訓練目標。

3 實驗設計與仿真結果

實驗的流程圖如圖2所示。實驗設計主要分為4個步驟：1）對圖像進行采集和初步處理；2）對圖像的SIFT特征進行提取并生成視覺單詞；3）將圖像表示為詞頻向量；4）將一部分圖像輸入到BP神經網絡中進行訓練，并對剩余的圖像進行分類。

圖2 名優茶分類模型流程圖

3.1 圖像采集和預處理

為保證圖像的采集環境盡可能一致，實驗中所用到的圖像均在同一組設備和儀器參數下進行采集（相機鏡頭為Navitar DO-2595，分辨率500萬像素，采集軟件為Baumer，鏡頭到白色紙板距離372 mm，光源到紙板距離131 mm）。名優茶在外型上通常被人為地分成3類：芽茶、一芽一葉和一芽兩葉，如圖3所示。隨機地從原料中選擇等量茶葉，每類茶葉選擇100個樣本分別置于白色紙板上；然后放置在直徑50mm、高度20mm的玻璃皿中；最后，用之前構架好的采集設備進行采集。

圖3 預處理后的名優茶葉圖片

盡管拍攝環境一致，但還是會受到光照等一些難以避免的外部因素的影響；所以，先對圖像進行灰度處理，然后調整對比度，再將處理后的圖像做為實驗數據。

3.2 SIFT特征提取和視覺詞袋模型

尺度不變特征轉換（scale-invariant feature transform，SIFT）特征是一種常用于計算機視覺的局部特征，它在空間尺度中尋找極值點，并提取出其位置、尺度、旋轉不變量[11]。SIFT特征由David Lowe在1999年所提出，并于2004年完善總結。SIFT提取算法主要分為4步：

1）尺度空間極值點檢測。建立高斯尺度金字塔，對圖像中所有位置進行檢測，尋找到滿足尺度不變性和旋轉不變性的特征點。

2）特征點定位。因為數字圖像是離散的，所以需要插值來得到特征點的準確位置。

3）計算特征點方向。統計特征點附近的梯度，計算主方向。

4）對特征點進行描述。在特征點周圍的鄰域內4×4窗口對8個方向的梯度進行統計，生成128維的描述符對SIFT特征進行表示。

經過上述4個步驟，茶葉圖片的SIFT特征提取結果如圖4所示。

圖中，每一向量代表著一個相應的SIFT特征，剪頭代表特征的主方向，長短代表特征的梯度大小?？梢钥闯?，不同種類茶葉的特征點的信息和梯度大小都有一定區別；另外，SIFT特征具有旋轉不變性和尺度不變性，所以，無論從什么角度拍攝，茶葉都不會對特征提取的結果產生影響。

圖4 茶葉圖片的SIFT特征

在抽取SIFT特征之后，采用K-means方法對特征進行聚類，相應的聚類中心便是視覺單詞，可以統計每一張圖像中各個視覺單詞出現的次數，并將每一張圖像表示成一個包含詞頻的向量。

3.3 BP神經網絡分類預測

文中分別對每類茶葉收集了100張圖像，同時選擇生成了300個視覺單詞。這樣，便得到300×300的一個矩陣，并對3類茶葉進行人為標注：芽茶（0）、一芽一葉（0.5）和一芽兩葉（1）。然后，選擇一半的圖像作為訓練樣本，其余的作為檢驗數據，建立神經網絡模型。部分訓練結果的近似值如表1所示。

表1 BP神經網絡訓練結果

從表1中可以看出，大部分的訓練結果都是準確無誤的，尤其以芽茶的精度最高。BP神經網絡在訓練完成之后，其最后的權值和閾值作為知識，剩余的數據被輸入到訓練好的BP神經網絡中進行訓練，部分識別結果的近似值如表2所示。

由表2可知，分類準確度非常高，并且在150張圖的分類結果中，有127張圖被正確分類，準確度達84.67%。并且，在得到訓練好的神經網絡后，對于新的圖片，只需要根據視覺詞袋模型生成相應的向量便可以輸入到網絡中進行識別，大大提高了識別的效率和精度。

表2 BP神經網絡分類結果

在BP神經網絡訓練過程中，設置算法的迭代次數為300次，也同時設置了訓練的期望誤差為10-15。由于訓練的數據量比較大，一般情況下還沒有達到期望的誤差就達到訓練的次數，如圖5所示，為BP神經網絡運行一次情況下的系統誤差，系統誤差的初始值為1.51，最后能達到的訓練誤差為1.3×10-5，在訓練到200次的時候，系統基本穩定在10-5數量級上。增加算法的迭代次數可以增加算法的精確度，影響到結果的判斷，同時也會增加時間[12]。目前來講，還沒有相關的文獻提到如何來權衡兩者。

圖5 BP神經網絡訓練誤差

4 結束語

茶機智能化控制方法中名優茶的分類，往往需要具有專業經驗的工人進行人工鑒別，不能廣泛應用到大規模操作中。由于3類茶葉的顏色特征和紋理特征均不明顯，所以利用數字圖像的方法很難達到需求的準確率。本文提出了基于視覺詞袋模型和BP神經網絡模型的名優茶分類方法：首先提取每張圖像的SIFT特征，其次利用K-means方法生成視覺單詞，并將圖像表示成詞頻向量，最后利用BP神經網絡進行訓練，實驗結果證明了該方法的合理性和準確性。

雖然SIFT特征具有多種穩定的性質，但是單獨考慮一種特征并不能包含圖像的所有信息，并且視覺詞袋模型的單詞個數并不能準確的進行界定。所以，未來的工作可以通過增加特征和改善視覺詞袋兩個方面來提高分類的精度。

[1]管曦.中國出口茶葉產品的比較優勢探討：基于不同類別和包裝的分析[J].中國農村經濟，2010（1）：28-34.

[2]閆振宇，徐家鵬.基于品種細分的中國茶葉國際競爭力實證分析[J].湖北農業科學，2011，50（8）：1713-1716.

[3]汪新貴.提升越鄉品牌打造茶葉強市[J].中國茶葉，2012（11）：18-19.

[4]駱耀平，唐萌，蔡維秩，等.名優茶機采適期的研究[J].茶葉科學，2008，28（1）：9-13.

[5]田波平，孫秋梅，廖慶喜，等.6CZZ-600型針形名優茶做形機及成型工藝優化[J].農業工程學報，2005，21（4）：65-68.

[6]王云，李春華.名優茶氨基酸含量變化規律及其影響因素研究[J].西南農業學報，2006，19（6）：1121-1126.

[7]許明，韓軍偉，郭雷，等.利用模型選擇確定視覺詞袋模型中詞匯數目[J].計算機工程與應用，2011，47（31）：148-150.

[8]陸江鋒，單春芳，洪小龍，等.基于數字圖像的茶葉形狀特征提取及不同茶葉鑒別研究[J].茶葉科學，2010，30（6）：453-457.

[9]李志欣，施智平，李志清，等.融合語義主題的圖像自動標注[J].軟件學報，2011，22（4）：801-812.

[10]汪鐳，周國興，吳啟迪.人工神經網絡理論在控制領域中的應用綜述[J].同濟大學學報：自然科學版，2001，29（3）：357-361.

[11]紀華，吳元昊，孫宏海，等.結合全局信息的SIFT特征匹配算法[J].光學精密工程，2009，17（2）：439-444.

[12]李曉峰，徐玖平，王蔭清，等.BP人工神經網絡自適應學習算法的建立及其應用[J].系統工程理論與實踐，2004（5）：1-8.

Tea machine intelligent control method based on BOVW and BP neural network

TAN He-ping，XU Hai-wei，HU Chang-an，TANG Jiang-wen，XU Chuan-di
（National Institute of Measurement and Testing Technology，Chengdu 610021，China）

Classification of famous tea has been a difficult problem precisely，because the three types of famous tea have obviously little distinction in color and ARTS features.So，practical applications mainly rely on subjective human judgment.To address this problem，a novel method based on bag of visual words was proposed.The authors first collected images through digital image processing methods to adjust the contrast，and then used the bag of visual words model，to extract SIFT features from each images and generated to visual words.Finally，each image was expressed as a vector containing a visual representation of the words.Then，the vectors were entered into the BP neural network to train BP and classify tea pictures.Experimental results show that the proposed method is reasonable and effective.This method can be widely applied to tea classification problems.

tea machine；digital image processing；bag of visual words；SIFT features；BP neural network

TB99；TH741；TP391.4；TS272.5

：A

：1674-5124（2014)06-0084-04

10.11857/j.issn.1674-5124.2014.06.022

2014-05-11；

：2014-07-13

國家“863”計劃項目（2012AA10A508）

譚和平（1957-），男，重慶市人，研究員，享受國務院政府津貼專家，從事生物化學茶產業鏈研究。

猜你喜歡

向量茶葉神經網絡

《茶葉通訊》簡介

茶葉通訊(2022年2期)2022-11-15

基于遞歸模糊神經網絡的風電平滑控制策略

現代電力(2022年2期)2022-05-23

向量的分解

新高考·高一數學(2022年3期)2022-04-28

聚焦“向量與三角”創新題

中學生數理化(高中版.高考數學)(2021年1期)2021-03-19

藏族對茶葉情有獨鐘

創造(2020年5期)2020-09-10

神經網絡抑制無線通信干擾探究

電子制作(2019年19期)2019-11-23

基于神經網絡的中小學生情感分析

電子制作(2019年24期)2019-02-23

香噴噴的茶葉

快樂語文(2018年36期)2018-03-12

向量垂直在解析幾何中的應用

高中生學習·高三版(2016年9期)2016-05-14

向量五種“變身” 玩轉圓錐曲線

新高考·高二數學(2015年11期)2015-12-23

中國測試2014年6期

中國測試的其它文章: 基于TBVMC濕式冷卻塔熱力性能快速評估方法; Ar瞬態方程非線性渦流檢測信號數值模擬研究; 水下生產系統淺水測試技術研究; 基于MTF評價醫用硬性內窺鏡的分辨率; 工業鉑熱電阻不同檢定方法檢定結果可信度研究; 基于小波神經網絡和PSO的動態誤差溯源方法研究

91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合