?

基于高斯混合模型的太陽電池片顏色分類設想與驗證

2016-10-14 04:58封小云邱龍剛
太陽能 2016年3期
關鍵詞:太陽電池高斯顏色

■ 封小云邱龍剛

陜西眾森電能科技有限公司

基于高斯混合模型的太陽電池片顏色分類設想與驗證

■ 封小云*邱龍剛

陜西眾森電能科技有限公司

詳細介紹了高斯模型思想以及相關算法,將不同顏色的太陽電池片分選到不同檔位中,方便將同類電池片進行歸類。

太陽電池;高斯混合模型;RGB、HSI顏色分量;樣本訓練;分塊模型

0 引言

眾所周知,太陽電池片的生產工藝過程復雜,生產出來的電池片顏色各異,導致光電轉換效率不一,輸出電流能力存在差異。不同顏色的太陽電池片串聯使用時,最大輸出電流由該串聯電路中輸出電流能力最小的電池片決定,從而降低了整體轉換效率。由此可知,將不同顏色的電池片分選到不同檔位顯得非常重要。

長期以來,關于太陽電池片的顏色分選主要靠人的眼睛,但是由于人眼存在很強的主觀意識,并且長時間的人眼分選勢必會造成人眼的疲勞,進而導致工作效率下降或誤檢率增加。使用機器視覺的方法對太陽電池片進行分選,不僅重復精度高,而且增加檢測的客觀性和標準性。文中通過創建高斯混合模型,將采集的樣本(事先知道樣本的歸類)特征加入高斯混合模型中進行訓練,然后根據訓練好的分類器進行待測太陽電池片的分類,從而實現顏色分類的自動化。

1 理論知識

實驗中主要用的知識有顏色模型、圖像特征的提取和高斯混合模型對特征的訓練,其中顏色模型的選擇和圖像特征的選擇直接影響高斯混合模型的訓練結果。本節主要描述實驗中選擇的顏色模型和高斯混合模型的思想。

1.1顏色模型

通常采集到的彩色圖像都是以RGB顏色空間呈現的[1],主要原因是該顏色模型是與設備相關的顏色模型,采用三維直角坐標系。紅、綠、藍原色是加性原色,各個原色混合在一起可以產生復合色,如圖1所示。RGB顏色模型通常采用圖1所示的單位立方體來表示。在正方體的主對角線上,各原色的強度相等,產生由暗到明的白色,即不同的灰度值,(0,0,0)為黑色,(1,1,1)為白色。正方體的其他6個角點分別為紅、黃、綠、青、藍和品紅。

圖1 RGB顏色空間模型

由于RGB顏色空間并不接近人眼的顏色空間,因此有必要將顏色空間從RGB轉換到其他顏色空間。

HSI色彩空間[2]是從人的視覺系統出發,用色調(Hue)、飽和度(Saturation或Chroma)和亮度(Intensity或Brightness)來描述色彩。HSI色彩空間可以用一個圓錐空間模型來描述,雖然這種圓錐模型相當復雜,但能把色調、亮度和飽和度的變化情形表現得很清楚。通常把色調和飽和度統稱為色度,用來表示顏色的類別與深淺程度。由于人的視覺對亮度的敏感程度遠強于對顏色濃淡的敏感程度,為了便于色彩處理和識別[3],人的視覺系統經常采用HSI色彩空間,比RGB色彩空間更符合人的視覺特性,故而將顏色空間從RGB轉換到HSI,如圖2所示。在圖像處理和計算機視覺中,大量算法都可在HSI色彩空間中方便地使用,它們可分開處理且相互獨立。因此,HSI色彩空間可大幅簡化圖像分析和處理的工作量。

圖2 HSI顏色空間模型

HSI色彩空間和RGB色彩空間只是同一物理量的不同表示方法,因而它們之間存在轉換關系。RGB轉換到HSI的相關公式如下:

其中,

1.2高斯混合模型

高斯混合模型(Gaussian Mixture Model)的本質是聚類算法[4],該方法有很多種,k-means是最簡單的一種聚類方法[5]。其大致思想就是把數據分為多個堆,每個堆為一類,且都有一個聚類中心(學習的結果就是獲得這k個聚類中心),這個中心就是這個類中所有數據的均值,而這個堆中所有的點到該類的聚類中心都小于到其他類的聚類中心(分類的過程就是將未知數據對這k個聚類中心進行比較的過程,離哪個聚類中心近就將其歸為哪一類)。k-means是最直觀、最方便理解的一種聚類方式,原則就是把最像的數據分在一起,而“像”可自定義,比如說歐式距離的最小等。

GMM和k-means十分相似,區別僅是GMM將概率引入了分類過程中。統計學習的模型有兩種,一種是概率模型,一種是非概率模型。概率模型是指要學習的模型的形式是P(Y |X ),在分類的過程中,通過未知數據X可以獲得Y取值的一個概率分布;也就是訓練后模型得到的輸出不是一個具體的值,而是一系列值的概率(對應于分類問題來說,就是對應于各個不同的類的概率),然后可以選取概率最大的那個類作為判決對象(軟分類,soft assignment)。而非概率模型是指學習的模型是一個決策函數Y=f(X),輸入數據X就可以投影得到唯一的一個Y,是判決結果(硬分類,hard assignment)。在GMM中,學習的過程就是訓練出幾個概率分布。

所謂高斯混合模型就是指對樣本的概率密度分布進行估計,而估計的模型是幾個高斯模型加權之和(具體個數要在模型訓練前建立好);每個高斯模型代表一個類(一個Cluster);對樣本中的數據分別在幾個高斯模型上投影,會分別得到在各個類上的概率;最后可以選取概率最大的類做為判決結果。

從中心極限定理的角度上看,把混合模型假設為高斯混合模型較為合理,當然也可以根據實際數據定義成任何分布的混合模型,不過定義為高斯混合模型在計算上有一些方便之處。另外,理論上可以通過增加模型的個數,用GMM近似任何概率分布。

高斯混合模型的定義為:

式中,K為模型的個數;πk為第k個高斯的概率密度函數,其均值為μk,方差為σk。對此概率密度的估計即求πk、μk和σk各個變量,當求出這些變量的值后,求和式的各項結果就分別代表樣本x屬于各個類的概率。

2 算法描述

為了實現太陽電池片顏色的分選,文中主要使用的算法有顏色空間轉換、特征提取和高斯混合模型訓練。以下主要分析通過提取不同的特征,將這些特征通過高斯混合模型訓練進行分類。

2.1特征提取

太陽電池片特征提取主要有兩種實驗方式,根據提取的兩種特征派生出太陽電池片檢測的兩種方法。

2.1.1第一種特征提取方式

1)將原始圖像進行RGB顏色空間分解。

2)在B空間的圖像上根據圖像的寬度和高度選取16個圓,并確保16個圓在前景太陽電池片上,如圖3所示。根據圖像的大小進行設定,文中實驗圖像像素大小為204×204,圓數量越多可能代表性越強,但隨著圓個數的增加,算法的執行時間變長。為提高算法的執行效率,當圖像很大時,可將圖像進行分塊處理。

3)計算該圓上像素值的中值作為特征。之所以選擇中值,目的是在一定程度上避免太陽電池片圖像上柵線對特征的影響。實驗證明,在光照條件相對穩定的情況下,204×204像素大小的圖像選擇16個圓可以滿足太陽電池片分選的要求。

圖3 16個圓的選擇

2.1.2第二種特征提取方式

1)將原始圖像進行不同類別分類后,將其組合為一幅大圖,大圖中包含不同的種類,如圖4所示。

圖4 不同顏色太陽電池片圖像

2)將組合的大圖進行RGB顏色空間分解。

3)將圖像由RGB顏色空間轉換到HSI顏色空間。

4)由于太陽電池片基本都是藍色,如果將色調H作為特征,其可區分性太差,不能作為太陽電池片的代表,所以將HSI三通道圖像轉換SI二通道圖像,將SI作為圖像唯一性的表征。

2.2算法流程

首先對類別已知的樣本進行訓練,然后根據訓練好的分類器對待檢測圖像進行歸類。其中,訓練過程如圖5所示,可以將訓練過程理解為一種在輸入X和輸出Y均已知的情況下確定函數Y=f(X)具體形式的函數擬合過程。識別過程如圖6所示,可以將其理解為將類別未知的模式X作為函數f的輸入,從而計算出Y值的過程。

圖6 識別過程

本文從兩個不同的方向給出特征提取的方式,特征提取應遵循類內相似性和類間可區分性;然后將提取到的樣本特征加入到創建的高斯混合模型中進行訓練;通過對大量已知樣本的訓練,便可生成具有針對該類事物的分類器??衫糜柧毢玫姆诸惼鲗⒋龣z測太陽電池片歸到合適的分類中。

3 實驗驗證與分析

3.1實驗驗證

3.1.1實驗一

將不同類別的圖像分為7類,將原始空間轉換到SI空間,然后對圖像進行訓練,最后對待檢測圖像進行分類。

由表1可知,有些分類結果很接近。主要原因為:1)雖然圖像的大小一致,但圖像中太陽電池片的大小不一致,如圖7所示,太陽電池片自身大小的不同導致最終面積的匹配大小可能存在偏差;2)采集到的圖像打光方案不是很理想,導致圖像自身都比較接近。注意:面積從左到右為39059、37601、37006、37990、38411、38939、37600,單位為像素。

圖7 圖像中太陽電池片的定位

3.1.2實驗二

該方法是將拍攝到的圖像進行RGB顏色分解,在B通道中,在前景圖像(太陽電池片圖像)上根據圖像的高度和寬度畫指定半徑的圓,然后計算圓上像素點的中值作為特征進行高斯混合模型訓練,選擇中值的原因是防止太陽電池片柵線對顏色的影響。

實驗中使用的圖像大小為204×204像素,圓的選擇如圖3所示。每次從16個圓中將8個圓作為一組,如圖8所示。其中,粉色部分是第一組的8個圓,黃色部分是第二組的8個圓,白色部分是第三組的8個圓。這里圓組的選擇方式是橫向選擇,當然也可以縱向選擇三組8個圓。

圖8 16個圓中8個圓的選擇方式

根據不同的組合,模擬不同的樣本進行訓練。檢測階段,選擇16個圓中8個圓不同組成,選擇方式如上所述。為了進一步確保分類的準確性,對3組(4行3組)8個圓使用少數服從多數的原則進行顏色歸類,即保證3組中有兩組以上分類成功。

實驗結果表明,如果單純使用一組8個圓可能會導致分類結果出錯。但加上對3組8個圓使用少數服從多數的原則,誤檢率明顯降低。

在圖像增大時,需要選擇更多的圓進行訓練,或將圖像分割為不同的小塊,在不同的小塊中使用上述方法,并增加進行識別的組進行檢測。

3.2實驗環境要求

實驗中對檢測圖像在同一環境中進行拍攝,位置要求:

1)檢測過程中需要將太陽電池片的圖像相對固定,不能存在較大角度,如圖9所示,其中圖像以白色作為背景,太陽電池片為藍色區域。

圖9 太陽電池片在圖像中的位置

2)由于分類器是事先訓練好的,對環境的要求比較嚴格,最好是在暗室中,光照條件基本穩定。如果環境不穩定的話就要重新訓練分類器。

3.3實驗結論

通過實驗一和實驗二,并對其檢測結果進行分析,同一相機下拍攝到的像素大小為204×204不同顏色的太陽電池片圖像,兩個實驗都是通過對大量樣本進行學習、訓練,可將太陽電池片很好的歸類,與預期分類結果一致。如圖10所示,將下面的圖像準確的分類為淺淺藍、淺藍、藍、深藍、深深藍、亮片和跳色。

圖10 太陽電池片分類結果

4 結論

實驗中給出太陽電池片分選的指導思想和方向,暫時將太陽電池片顏色分為7檔,可以根據要求訓練已知類別的樣本,實現更多不同檔位太陽電池片的分選。即針對不同大小的圖像,在實驗二的方法中可以選擇不同個數的圓,選擇不同個數的組進行分類,具體的個數可以對已知樣本的大量訓練和分類得到。另外,實驗中選擇HSI顏色空間和圓上像素值的中值作為特征進行分類器的訓練,只有能夠很好地區分不同顏色的太陽電池片,可以選擇其他太陽電池片的特征作為高斯混合模型的訓練特征。

[1]顧明, 鄭林濤, 尤鄭. 基于顏色空間轉換的交通圖像增強算法[J]. 儀器儀表學報, 2015, (8): 1901-1902.

[2]邢岳,陳華秀,李偉越,等. 基于HSI顏色空間的交通標志圖像分割算法研究[J]. 中國高新技術企業, 2014, (8): 93-94.

[3] 鄭小東, 高潔, 張曉煜. 基于顏色空間轉換的混合豆類分類識別[J]. 中國糧油學報, 2015, (4): 103-104.

[4]朱峰, 羅立民, 宋余慶, 等. 基于自適應空間鄰域信息高斯混合模型的圖像分割[J]. 計算機研究與發展, 2011, (11): 2001-2003.

[5]宋余慶, 謝月華, 朱玉全, 等. 基于近似密度函數的醫學圖像聚類分析研究[J]. 計算機研究與發展, 2006, (11): 1947-1952.

2016-01-13

封小云(1987—),男,碩士、軟件工程師,主要從事圖像處理和機器視覺方面的研究。fxy@gsola.cn

猜你喜歡
太陽電池高斯顏色
載人航天器體裝太陽電池陣有效發電面積計算方法
神州飛船太陽電池翼與艙體對接
數學王子高斯
天才數學家——高斯
空間高軌高壓太陽電池陣靜電防護技術研究
一種航天器太陽電池陣供電能力計算方法
特殊顏色的水
從自卑到自信 瑞恩·高斯林
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合