?

基于K均值聚類算法的霧天識別方法研究

2015-12-02 21:02孟凡軍李天偉徐冠雷韓云東
現代電子技術 2015年22期
關鍵詞:霧天自動識別

孟凡軍+李天偉++徐冠雷+韓云東

摘 要: 為實現視頻監控設備對霧天天氣現象的自動識別,提出了基于K均值聚類算法的霧天天氣現象自動識別方法。該方法通過分析霧天天氣現象對視頻圖像采集的影響,提取圖像飽和度的均值、方差為特征參數,并利用K均值聚類算法對訓練圖像進行分類,得到不同圖像類別的聚類中心,測試階段計算不同圖像與聚類中心的相異度即可完成分類。實驗結果表明,該方法簡潔高效,易于實現對大規模圖像數據的處理,并能實現圖像分類后類別的標注,對霧天的識別率高于90%。

關鍵詞:霧天; 自動識別; K均值聚類算法; 圖像飽和度

中圖分類號: TN958?34; TP391.4 文獻標識碼: A 文章編號: 1004?373X(2015)22?0080?04

0 引 言

現代海戰往往是多軍、兵種的協同作戰。在影響戰斗力的諸多因素中,天氣是惟一無法加以控制但又具有決定意義的因素。當艦船在霧中(包括霧、雨、雪等能見度不良天氣條件)航行時,其定位、導航、規避等都會受到相當大的影響。同時,在城市生活中,霧也是一種常見的視程障礙類天氣現象,對當地生產、生活和交通都產生著極大影響。而目前在氣象領域,我國氣象臺站的天氣現象業務仍以人工觀測為主,未完全實現自動化,天氣現象信息的采集耗費了大量的人力和物力。因此近年來,在智能視頻和圖像理解技術的不斷發展下,基于視頻圖像數據的天氣現象自動識別研究也受到了較為廣泛的關注[1?3]。

1 研究現狀

近年來,人們已從不同角度對霧天天氣現象識別進行了研究,并取得了一定的成果。文獻[1]主要針對室外圖像,著重分析了天氣現象對圖像采集的影響,并提取圖像各項特征進行訓練分類,對霧天的識別率[1]高于85%;文獻[3]對原有的雙色模型算法進行改進,用于識別包括霧天在內的視程障礙類天氣現象[3]。文獻[4]對同一場景采集不同天氣條件下的視頻圖像,采用了一種多垂線檢測方法,提高了霧天天氣識別的正確率[4]。文獻[5]提取差分圖像的紋理特征識別出當前天氣,并實現了對霧天交通圖像的快速去霧[5]。

以上這些方法所提取圖像特征較為固定,對大規模數據的處理不夠高效,對霧天識別的針對性不強,不能充分滿足當前應用需求。

為更快速高效地實現霧天的識別與分類,本文針對霧天視頻圖像進行分析,提取圖像飽和度特征,并計算飽和度均值與方差,最后利用K均值聚類算法進行分類識別。其基本流程如圖1所示。

2 圖像特征提取

2.1 霧天對圖像采集的影響

霧天天氣條件下,大氣中的氣溶膠含量很高,此時在可見光波段,由于氣溶膠對光波的散射作用,通過視頻成像系統獲得的圖像都會有一定程度的降質[4]。

霧氣形成后,大氣粒子會形成許多反射面,并且部分大粒徑粒子會遮擋光線,這時自然光線無法穿透,而是被反射出來,各種顏色的光線被反射掉的同時也會產生衰減,霧就變成“白茫?!钡牧?。

這時候在所采集視頻圖像上的直觀反映就是飽和度的降低?;诖?,提取圖像飽和度的均值與方差作為識別霧天天氣現象的特征。

2.2 霧天圖像特征提取

本文首先進行圖像由RGB模式到HSV模式的空間轉換,并從采集圖像集中隨機選100副圖像(50副霧天圖像,50副非霧天圖像)作為訓練圖像,提取圖像的飽和度特征,并計算圖像飽和度的均值與方差,最后利用K均值聚類算法進行分類。

RGB(物理三基色)模式是色光的彩色模式,R,G,B分別代表紅、綠、藍3種不同的顏色,3種色彩疊加形成了其他的色彩。HSV是一種主觀彩色模型,不是將某種特定的顏色分解為三原色,而是描述顏色的三種屬性,分別為色調(Hue)、飽和度(Saturation)和純度(Value)。其中,飽和度值表示顏色中摻入白光的比例,純光譜的含量越多,其飽和度值也就越高[6]。

對于任何3個在[0,1]范圍內的R,G,B值,其對應的HSV模式中的S(飽和度)分量可以由下面給出的公式[6]計算:

[S=1-3R+G+Bmin(R,G,B)] (1)

本文在該部分提取圖像飽和度為特征,計算其均值與方差,并形成二維數據集。

3 K均值聚類算法在霧天識別中應用

3.1 算法概述

聚類描述的是一個無監督統計過程,該過程將物理或抽象對象的集合,按照一定的計算方法,分成多個類。聚類后所生成的類是一組具有相似特征的數據對象的集合,同一類中的對象彼此相似,不同類中的對象彼此相異[7]。常用的聚類方法主要有劃分法、層次法、密度法、網格法以及模型法五種[7?9]。

K均值聚類是最著名的劃分聚類算法,因簡潔和高效而被廣泛使用。通常,給定一個數據點集合以及需要的聚類數目K(K由用戶指定),K均值聚類算法便會根據某個距離函數(本文采用歐式距離)把對象分為K個聚類。這個過程中,首先要隨機選取K個初始聚類中心,然后計算每個數據對象與各個聚類中心之間的距離(本文計算歐式距離),根據所得值將每個對象分配給距離它最近的子聚類。

聚類中心以及分配給它們的對象所形成的簇集就代表一個聚類。全部對象都被分配后,會根據聚類中現有的對象重新計算每個聚類的聚類中心。這個過程將不斷重復,直到數據集中的任何一個對象不再被分配給不同聚類,或者所得到的聚類中心不再發生變化[9?10]。

3.2 算法流程

Step1:預處理,數據規格化

提取訓練圖像的特征值,并對特征值進行規格化。也就是按照一定比例,完成所提取圖像特征值到相同取值空間的映射,從而平衡各個特征值對距離的影響。本文將各個特征值映射到[0,1]區間,映射公式如下:

[ai′=ai-min(ai)max(ai)-min(ai)] (2)

式中[ai]代表選擇的圖像特征值。本文提取圖像飽和度的均值和方差形成數據集D,作為特征參數。

Step2:選取初始聚類中心

本文將圖像分為兩類(霧天與非霧天),則從數據集D中隨機選取兩個元素,作為兩個簇的初始聚類中心。

Step3:計算相異度

相異度即每個元素到聚類中心的距離。本文分別計算比較剩余元素到兩個初始聚類中心的歐式距離,將元素劃歸到距離較小的一簇。

Step4:重新計算聚類中心

根據聚類結果,取每個簇集中所有元素各自維度的算術平均值,計算得出新的聚類中心。按照新的聚類中心,將數據集中所有元素進行重新聚類。

Step5:循環迭代

循環以上步驟(Step4),直到所得聚類中心以及聚類結果收斂到不再變化。

Step6:輸出結果[8?9]。

本文在訓練階段提取圖像飽和度特征,計算其飽和度與方差,并運用K均值聚類算法得到霧天圖像與非霧天圖像的聚類中心。測試階段,提取測試圖像特征并計算測試對象與聚類中心的距離,并根據最小距離對相應圖像進行劃分。

4 實驗結果與分析

為測試本文所運用的K均值聚類算法對視頻圖像中霧天識別的有效性,本文使用Intel[?]CoreTMi3?2310M CPU@2.10 GHz、RAM 4.00 GB的機器,在Matlab 7.1平臺下編程設計了相關實驗。

實驗數據采用的是本文采集的圖像數據1 000幅,每幅圖像均手工標記有晴、陰、雨、霧、沙塵等天氣現象。由于夜間的各種天氣現象在圖像中反映不夠明顯,因此本文隨機抽取采集圖像數據集中100幅白天圖像(50幅霧天圖像,50幅非霧天圖像)作為訓練樣本,樣本圖像如圖2所示。

4.1 圖像特征提取

本文首先對所選取的100幅樣本圖像進行分析,將圖像模式進行由RGB空間到HSV空間的轉換,經計算得到圖像飽和度的均值與方差,得到數據集D,結果如表1所示。

4.2 聚類結果

根據3.2節所講到的K均值聚類算法流程,本文首先從數據集D中隨機選取兩個元素,作為兩個簇的聚類中心,為了計算更有說服力,分類前兩簇圖像中均包含部分霧天圖像并作以記錄。分組前的圖像特征數據分布如圖2所示。其中符號“+”和“○”代表分類前的兩簇數據。

在對樣本圖像數據進行聚類分析之后,結果如圖4所示。其中符號“+”代表K均值聚類分析后的第一類圖像(霧天圖像),“○”分別代表K均值聚類分析后的第二類圖像(非霧天圖像)。符號“☆”代表計算得到的兩個聚類中心:[0.131 3,0.021 5],[0.536 5,0.025 6]。

測試階段本文又選取采集圖像集中具有代表性的100幅圖像進行測試,計算測試對象與聚類中心的歐式距離,并根據最小距離對相應對象進行劃分。

實驗結果表明,該算法能有效地實現視頻圖像數據中的霧天識別,識別正確率高達90%。但對雨天圖像與霧天圖像的區分不明顯。

5 結 語

本文運用K 均值聚類算法實現了視頻圖像數據中的霧天識別。實驗證明,該算法思想簡便,并能高效地完成大規模數據的處理,達到了預期的效果。實驗結果證明識別正確率達到90%以上。但是,本文僅限于區別霧天和非霧天兩種天氣現象,針對更為復雜的其他天氣現象識別需要基于更為復雜的算法[10]進行進一步研究。因此,在未來的工作中,重點將在如下幾個方面進行改善和拓展:視頻圖像中雨天與霧天的區分;霧天中輕霧、中霧、濃霧的分類;其他天氣現象的分類。

參考文獻

[1] 李騫,范茵,張璟,等.基于室外圖像的天氣現象識別方法[J].計算機應用,2011(6):1624?1627.

[2] ROSER M, MOOSMANN F. Classification of weather situations on single color images [C]// Proceedings of 2008 IEEE Intelligent Vehicles Symposium. Eindhoven: IEEE, 2008: 798?803.

[3] 郭佳,楊玲,吳可軍,等.基于改進雙色模型的視程障礙類天氣現象識別[J].氣象科技,2013(2):236?241.

[4] 宋曉建,楊玲.基于圖像退化模型的天氣現象識別[J].成都信息工程學院學報,2011(2):132?136.

[5] 宋洪軍,陳陽舟,郜園園.基于交通視頻的霧天檢測與去霧方法研究[J].控制工程,2013(6):1156?1160.

[6] 秦襄培,鄭賢中.Matlab圖像處理寶典[M].北京:電子工業出版社,2011.

[7] 羅可,蔡碧野,吳一帆,等.數據挖掘中聚類的研究[J].計算機工程與應用,2003(20):182?184.

[8] MACQUEEN J B. Some methods for classification and analysis of multivariate observations [C]// Proceedings of 1967 the 5th Berkeley Symposium on Mathematical Statistics and Probability. Berkeley: [s.n.], 1967: 283?297.

[9] 徐義峰,陸春明,徐云青.一種改進的K均值聚類算法[J].計算機應用與軟件,2008,25(3):275?277.

[10] 謝娟英,蔣帥,王春霞,等.一種改進的全局K?均值聚類算法[J].陜西師范大學學報,2010(2):18?22.

[11] NARASIMHAM S G, NAYAR S K. Contrast restoration of weather degraded images [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2003, 25(6): 713?724.

[12] XU Guanlei, WANG Xiaotong, XU Xiaogang. Improved bi?dimensional empirical mode decomposition based on 2D assisted signals analysis and application [J]. IET Image Processing, 2011, 5(3): 205?221.

[13] 張馭龍,張健.基于數值天氣預報預測電波雨衰的關鍵問題分析[J].現代電子技術,2014,37(1):27?30.

猜你喜歡
霧天自動識別
中國自動識別技術協會
為什么在霧天不適宜進行晨練
船舶自動識別系統對船舶救助的影響
自動識別系統
微波輻射計對昆明霧天的監測及應用
霧天盡量減少室外運動
金屬垃圾自動識別回收箱
大霧天氣
基于IEC61850的配網終端自動識別技術
霧天高速公路交通安全風險評估
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合