?

基于集成學習的風云四號遙感圖像云相態分類算法

2020-05-25 09:00田曉宇
紅外技術 2020年1期
關鍵詞:相態風云神經網絡

高 軍,陳 建,田曉宇

基于集成學習的風云四號遙感圖像云相態分類算法

高 軍1,2,陳 建1,田曉宇1

(1. 上海海事大學 信息工程學院,上海 201306;2. 西藏自治區經濟和信息化廳信息化推進處,拉薩 850033)

云相態分類在氣象預報和氣候研究中具有重要的地位。我國新一代氣象衛星風云四號的成像儀在光譜通道數量和空間分辨率較上一代風云二號有較大提升,這為云相態的研究提供了新的遙感數據。本文首先對風云四號相隔15min的遙感圖像進行分析,然后提出亮溫云相態指數,該指數可以進行初步云相態分類,最后在此基礎上提出基于集成學習的云相態分類算法。實驗結果與風云四號官方云相態分類結果進行比較,水云的一致率達到91.69%,冰云的一致率達到76.10%。

云相態;集成學習;風云四號;遙感圖像處理

0 引言

云相態是指云所處的熱力學狀態,分為液態或固態。云相態變化對地球大氣輻射系統收支平衡、天氣系統的形成與演變都有不可忽視的影響,因此研究云相態對探究全球大氣變化機理,預測飛機積冰和反演云微物理性質等都具有現實意義[1–3]。

衛星遙感技術具有觀測范圍廣、不受時空限制的優點,越來越多的人利用衛星遙感數據進行云相態分類。根據衛星成像儀觀測數據特性的不同,國內外研究者提出了許多云相態分類算法。主要的云相態分類方法分為2種,一種為光譜閾值法,另一種為機器學習算法。光譜閾值法一直被廣泛使用,包括經典的熱紅外波段三光譜法[4],以及后來經過三光譜法改進的雙光譜法[3],還有僅利用熱紅外單通道的單光譜閾值法[5]。除了使用熱紅外波段,可見光和近紅外波段也被用來進行云相態分類,包括光譜比值[6]和光譜對應的云微物理特性[7]等方法。單獨使用熱紅外波段或者可見光和近紅外波段有一定限制,研究者漸漸聯合使用可見光,近紅外和熱紅外波段[8]來提高云相態分類的準確性。劉建[9-10]等人結合云微物理特性在風云一號和風云二號上使用多光譜閾值法進行云相態分類。Himawari氣象衛星官方[11]也使用多光譜閾值法進行云相態分類。光譜閾值法中,無論是三光譜法,雙光譜法,多光譜法等,閾值選取上都有一定的主觀性且閾值的大小與具體的遙感數據有關,易受經緯度,季節,氣候等影響。

隨著機器學習的快速發展,許多研究者使用機器學習相關算法進行云相態分類[12],神經網絡算法由于非線性擬合性突出被大量使用。從參數優化的反向傳播神經網絡[13]、經過特征篩選的BP神經網絡(Back Propagation Neural Network,BPNN)[14-15],再到經模擬退火算法改進的BP神經網絡[16],還有自組織映射網絡[17]。神經網絡的使用降低了建立云相態分類模型所需的成本,減少了云相態分類所需的時間。但是BP神經網絡屬于有監督學習范疇,訓練該神經網絡需要大量有標簽的數據,大部分研究者對BP神經網絡訓練時都使用了官方已經標注的云相態數據。自組織映射網絡屬于無監督學習,訓練時不需要使用標簽數據,但是訓練數據量很大時,自組織映射網絡神經元數量也隨之增加,計算復雜度較高。

風云四號A星(FY-4A)屬于新一代靜止氣象衛星,其搭載的多通道掃描成像輻射計(Advanced Geosynchronous Radiation Imager,AGRI)為云相態分類提供了新的數據來源。相比風云二號輻射成像儀,AGRI的觀測性能有顯著提高,其中,輻射成像儀觀測通道從5個擴展到14個(6個可見/近紅外波段、2個中波紅外波段、2個水汽波段和4個長紅外波段),觀測時效從半小時提高到15min,最高空間分辨率從1.25km提高到500m。AGRI的觀測通道數量與國際同類衛星相比水平相當[18–22]。

本文針對風云四號成像儀的多通道和相對于觀測區域靜止的特性提出一種基于集成學習的云相態分類方法,此方法包括兩步:

1)根據風云四號特性提出亮溫云相態指數,并應用該方法建立云相態數據集。

2)使用基于集成學習的云相態分類算法,應用云相態數據集進行訓練,實現云相態分類。

1 數據集建立

1.1 數據來源

本文實驗數據主要源于風云四號AGRI成像儀的數據。表1列出了風云四號AGRI成像儀的通道設置。

風云四號AGRI的數據可以從國家衛星氣象中心數據服務網獲取。截止到目前,風云四號A星的數據產品包括一級數據產品,大氣產品和輻射產品等。本文需要用到的風云四號產品包括成像儀全圓盤4KML1數據(以下簡稱:L1數據),云檢測實時產品(以下簡稱:云檢測數據),云相態實時產品(以下簡稱:云相態數據)。

1.2 數據集建立

1.2.1 亮溫云相態指數

風云四號屬于靜止軌道氣象衛星,具有對同一片區域持續觀測的優勢。15min成像間隔可以忽略太陽高度角對亮溫和反射率的影響,比較此時刻衛星云圖和15min前的衛星云圖,可以得到每個云像素點前后15min反射率和亮溫的變化量。反射率只有光照時有效,亮溫不受晝夜變化的影響,使用亮溫進行云相態分類可以在晝夜間平滑過度。結合風云四號A星的通道特點,本文提出亮溫云相態指數(Brightness temperature Cloud Phase Index,BTCPI),亮溫云相態指數用公式(1)表示:

BTCPI=BTnow-BTpast(1)

式中:BTnow為當前圖像云像素點對應的亮溫值;BTpast為15min前圖像云像素點對應的亮溫值。當云層移動時,遙感圖像中的云區域從水云變成冰云,或者從冰云變成水云。因為冰云和水云在不同波段下的亮溫值不同[10,13],相同波段下前后15min兩張遙感圖像的亮溫值相減結果與0比較即可檢測出云相態。該公式只針對15min前后都有云且云相態發生變化區域。若某區域15 min前后從無云變成有云、有云變成無云或云相態不變,亮溫云相態指數則無法檢測出該區域的云相態。

表1 AGRI通道成像設置

為了減少噪聲對亮溫云相態指數的影響,人為設置一個常數>0),使分類結果更加準確,公式(2)如下:

當冰云的亮溫值低于水云時:15min前圖像Result<0的云區域為的冰云,Result>0的云區域為水云。

風云四號A星亮溫云相態指數的示意圖如圖1所示。

圖1 亮溫云相態指數示意圖

圖1中(a)和(b)分別為風云四號衛星15min之前和15min后去除非云像素區域的亮溫圖,黑色區域代表無云。(c)為亮溫云相態指數得到的15min前云相態數據,為了方便觀察,上色處理后,紅色代表水云,藍色代表冰云??梢钥闯?,利用亮溫云相態指數能夠清楚分類出部分冰云和水云。

1.2.2 建立訓練和預測數據集

選取L1數據過程中,考慮晝夜和四季的變換對遙感影像遙感衛星云圖的影響。本文選取不同季節、晝夜下的數據,以豐富數據集共計48個時刻。

L1數據并不能直接用于云相態分類,需要對該數據進行預處理。預處理有2個目的:第一個利用云檢測數據去除遙感圖像中無云區域的數據;第二個是對遙感圖像有云的數據進行輻射定標。云檢測是云相態分類的基礎和前提,一般先進行云檢測,標記出衛星云圖中有云和無云的部分,然后再進行云相態分類。風云四號云檢測方法可以參考高軍等人的研究[23],風云四號官方也給出了云檢測的結果,本文直接使用官方云檢測數據。云檢測完成后需要根據給定的輻射定標表進行輻射定標。根據官方輻射定標表,表1中,FY-4A衛星1到6號通道定標為反射率,7到14號通道定標為亮溫。

利用亮溫云相態指數,對L1數據進行處理,構建云相態數據集。為了彌補數據集較少的情況,消除訓練數據集和預測數據集選取的偶然性,利用6折交叉驗證[24]的方法,將構建好的云相態數據集分為6組,5組為訓練集,1組為預測集。

2 集成學習

隨機森林(Random Forest,RF)是集成學習代表算法之一。隨機森林由多棵決策樹[25]構成,決策樹是一種重要的分類方法,單一的決策樹可能會發生過擬合。隨機森林中的決策樹引入了隨機屬性選擇,傳統的決策樹在當前特征中選取最優的特征開始進行劃分,在隨機森林中決策樹的每個結點都是從特征集合中隨機選擇個特征子集,然后從特征子集中選擇最優的特征進行劃分[26]。隨機森林算法能夠解決過擬合等問題,還可以獲得優越的泛化性能。集成學習示意圖如圖2所示。

圖2 集成學習示意圖

2.1 特征選取

特征選取對訓練機器學習算法有重要作用,特征選取不同可能影響最終建立模型與預測結果的好壞。水和冰的折射率虛部[27]能夠表示水、冰粒子吸收輻射的能力,也是云相態分類的一種重要參考因子[14-15],如圖3所示。

圖3 冰和水的折射率虛部隨波長變化圖

風云四號成像儀中有波長為6.25mm、7.1mm和12mm、13.5mm通道,從圖3可以看出,6.25mm和7.1mm連線斜率與12mm和13.5mm連線斜率在水態和冰態下有差異,因此可以根據斜率來區分冰云和水云。定義水汽指數7.1和熱紅外指數13.5來描述折射虛部的斜率不同,如公式(4)和公式(5)所示:

結合其他云相態分類算法所使用的波段,本文將8.5mm和10.7mm的亮溫差BT8.5_10.7,10.7mm和12mm亮溫差BT10.7_12也作為分類的特征。集成學習特征選取如下表2所示。

表2 云相態分類特征提取

2.2 實驗過程

實驗使用scikit-learn機器學習庫進行隨機森林的平臺搭建,使用10棵決策樹進行集成學習。隨機森林通過訓練集形成云相態分類模型,再利用分類模型對預測集進行預測,得到云像素點為水云和冰云的概率,選取概率較大者為預測的結果。

3 結果與討論

本文對云相態分類結果從兩方面進行比較。一方面從視覺上進行比較,另一方面從數據上進行比較。

3.1 視覺對比

視覺對比法是直接通過人眼觀察結果圖像,該方法可以很直觀地看出云相態分類的結果和每種云相態的輪廓。

選取2018年10月23日7時(北京時間2018年10月23日15時)的FY-4A遙感圖像作為代表,使用本文算法對該遙感圖像進行云相態分類,得到的云相態分類結果圖和風云四號官方云相態產品圖像、FY-4A通道合成圖、Himawari-8云產品圖像進行比較。

圖4為3種云相態分類算法的結果圖和官方云相態圖。其中(a)為FY-4A官方云相態圖,(b)為本文算法得到的云相態分類結果圖,(c)為BP神經網絡分類結果圖,(d)為閾值法分類結果圖。由圖4(b)可以看出,本文算法能夠將大部分的冰云和水云正確分類。FY-4A官方云相態產品把云分為液態水云、過冷水云、混合云、冰云。本文將液態水云和過冷水云都歸為水云。官方云相態產品中有混合云,所以混合云部分在云相態分類結果(b)中被冰云或水云代替。

圖4 不同算法云相態分類結果圖

圖5為本文算法結果與FY-4A通道合成圖。FY-4A通道合成圖是利用通道2,通道3和通道5進行圖像合成。3個通道的差異能夠反映水體,云和地物信息,由于水云在這3個通道的反射率接近,在合圖像中為白色,而積雪和冰云的信息在通道5的反射率遠遠高于水,圖像中為藍色調[19],為了提高人眼的觀測性,提高了亮度,通道合成圖像如圖5(a)所示。利用本文算法得到的云相態分類結果如圖5(b)所示,水云用紅色標出,冰云用藍色標出。從整體看,本文算法的云相態分類結果在不同下墊面檢測區域表現良好。

圖5 整體對比圖

為了比較細節,選取中國區附近,澳大利亞附近區域進行比較。針對中國區的云相態情況如圖6所示??梢钥闯鲈谒浦械募毿”埔脖蛔R別出來。針對澳大利亞區域附近云相態分類結果如圖7所示。一些細小薄云也能區分出云相態。

圖6 中國區域附近的云相態情況

圖8為本文算法結果與Himawari-8云產品圖像。Himawari-8監控范圍與FY-4A有部分重合,該衛星在2015年已經業務化,對應的各種氣象產品已經發布。氣象產品中的云產品包含了云分類產品,但Himawari-8的云分類產品沒有明確指出具體的云相態。在ISCCP的云分類標準中[5],層云、層積云和積云屬于低云,云相態以水云為主,本文把這類云歸為水云;雨層云、高層云、高積云為中云,歸類為冰水混合云;深對流云或高云、卷云為高云,歸類為冰云。

圖7 澳大利亞附近區域的云相態情況

中國南部及周邊區域Himawari-8衛星的云分類產品與云相態分類結果如圖8所示。從圖中可以看出,由于多了混合云的存在,一部分冰云和水云被歸為了混合云,但云相態分類的大致輪廓相似,存在的水云基本都被檢測出來。

圖8 中國南部及周邊區域的云相態情況

3.2 數據評估

本文使用準確率、錯誤率、靈敏性和特效性4個度量對云相態分類模型進行評估[28],對比使用官方云相態數據作為真實云相態數據。設水云為正元組,冰云為負元組,準確率、錯誤率、靈敏性和特效性計算公式如下:

式中:TP、TN、FP、FN、P、N分別表示真正例、真負例、假正例、假負例、正樣本數和負樣本數。本文算法,BP神經網絡,閾值法云相態分類模型6次交叉驗證評估均值詳情如表3所示。

表3 云相態分類模型評估詳情

從表3評估結果可以看出,本文算法結果準確率超過了其他兩種分類算法,分類模型效果良好。

4 結論

本文提出的基于集成學習的云相態分類算法,針對FY-4遙感圖像,該算法可以提供相對良好的云相態分類結果。該算法的關鍵是利用亮溫云相態指數構建云相態數據集。相對于傳統的人工標注法和閾值法為數據貼標簽,亮溫云相態指數對L1數據進行初步云相態分類進而產生大量標簽且該方法對使用者先驗知識要求不高。分類特征的提取主要利用不同波段之間對應冰云和水云的亮溫值差異。隨機森林利用訓練集訓練最后建立云相態分類模型,經過評估,該模型的分類準確率較好,可以進行快速云相態分類。云相態結果圖在視覺上和官方結果圖大致相當,能夠反映不同區域、水云冰云交界處的云相態特征,對于一些細小的薄云也能夠正確分類,總體分類效果良好,能為后續其他云數據反演工作提供參考依據。同時,本文算法對云相態只劃分為水云和冰云,下一步工作中,將針對混合云相態的劃分進行研究。

[1] Shupe M D. Clouds at Arctic Atmospheric Observatories. Part II: Thermodynamic Phase Characteristics[J]., 2011, 50(3): 645-661.

[2] Knap W H, Stammes P, Koelemeijer R B A. Cloud Thermodynamic-Phase Determination From Near-Infrared Spectra of Reflected Sunlight[J]., 2002, 59(59): 83-96.

[3] 任建奇, 嚴衛, 葉晶, 等. 云相態的衛星遙感研究進展[J]. 地球科學進展, 2010, 25(10): 1051–1060.

REN Jianqi, YAN Wei, YE Jing. Advances in Satellite Remote Sensing of Cloud Phase State[J]., 2010, 25(10): 1051-1060.

[4] Ackerman S A, Smith W L, Revercomb H E, et al. The 27–28 October 1986 FIRE IFO Cirrus Case Study: Spectral Properties of Cirrus Clouds in the 8–12 μm Window[J]., 2009, 118(118): 2377-2388.

[5] Rossow W B, Schiffer R A. Advances in understanding clouds from ISCCP[J]., 1999, 80(11): 2261-2287.

[6] King M D, Platnick S, Yang P. Remote Sensing of Liquid Water and Ice Cloud Optical Thickness and Effective Radius in the Arctic: Application of Airborne Multispectral MAS Data[J]., 2004, 21(6): 857-875.

[7] WANG J, CHAO L, MIN M. Effects and Applications of Satellite Radiometer 2.25-μm Channel on Cloud Property Retrievals[J]., 2018, 99: 1-10.

[8] Arking A, Childs J D. Retrieval of Cloud Cover Parameters from Multispectral Satellite Images[J]., 2003, 24(4): 322-333.

[9] 劉健, 董超華, 朱元競, 等. FY-1C資料在云頂粒子熱力學相態分析中的應用研究[J]. 大氣科學, 2003, 27(5): 901-908.

LIU Jian, DONG Chaohua, ZHU Yuanjing. Thermodynamic Phase Analysis of Cloud Particles with FY-1C Data[J]., 2003, 27(5): 901-908.

[10] 劉健, 李云. 風云二號靜止氣象衛星的云相態識別算法[J].紅外與毫米波學報, 2011, 30(4): 322-327.

LIU Jian, LI Yun. Cloud phase detection algorithm for geostationary satellite data[J]., 2011, 30(4): 322-327.

[11] MOURI K, IZUMI T, SUZUE H. Algorithm Theoretical Basis Document for Cloud Type/Phase Product[EB/OL]. http://www.data. jma.go.jp/mscweb/technotes/msctechrep61-2.pdf. 2016.

[12] 郭洪濤, 謝歡歡, 馬英, 等. 基于支持向量機的云相態分析[J]. 解放軍理工大學學報: 自然科學版, 2012, 13(2): 226–231.

GUO Hongtao, XIE Huanhuan, MA Ying. Analysis of Cloud Phase Based on Support Vector Machine[J]., 2012, 13(2): 226-231.

[13] 熊賢成, 楊春平, 敖明武, 等. 基于BP神經網絡的云相態檢測方法研究[J]. 遙感技術與應用, 2015,30(4): 714-718.

XIONG Xiancheng, YANG Chunping, AO Mingwu. AResearch on Cloud Phase Detection Based on BPNetural Network[J]., 2015, 30(4): 714-718.

[14] 李錫祥, 麻金繼, 梁曉芳. 基于BP神經網絡進行云相態識別方法的研究[J]. 大氣與環境光學學報, 2010, 5(4): 299-304.

LI Xixiang, MA Jinji, LIANG Xiaofang. Retrieving Cloud Phase Based on BP Neural Network[J]., 2010, 5(4): 299-304

[15] 靳澤群, 張玲, 劉神聰. 基于BP神經網絡的云檢測和云相態識別[J]. 光學與光電技術, 2016, 14(5): 74-77.

JIN Zequn, ZHANG Ling, LIU Shencong. Cloud Detection and Cloud Phase Retrieval Based on BPNeural Network[J]., 2016, 14(5): 74-77.

[16] 盛夏, 孫龍祥, 鄭慶梅. 模擬退火優化BP神經網絡進行云相態分類[J]. 解放軍理工大學學報: 自然科學版, 2008, 9(1): 98–102.

SHENG Xia, SUN Longxiang, ZHENG Qingmei. Simulated Annealing Optimized BP-ANN Method for Cloud Thermodynamic Phase Retrieval[J]., 2008, 9(1): 98-102.

[17] 郭晶, 楊春平, 葉玉堂, 等. SOFM神經網絡的FY-3A/VIRR多光譜圖像云相態反演方法[J]. 光電工程, 2015, 42(12): 20-24.

GUO Jing, YANG Chunping, YE Yutang. A Cloud Phase Retrieval Approach Based on SOFM Neural Network Using FY-3A/VIRR Multi-channel Images[J]., 2015, 42(12): 20-24.

[18] 張鵬, 郭強, 陳博洋, 等. 我國風云四號氣象衛星與日本Himawari-8/9衛星比較分析[J]. 氣象科技進展, 2016, 6(1): 72–75.

ZHANG Peng, GUO Qiang, CHEN Boyang. The Chinese Next-Generation GeostationaryMeteorological Satellite FY-4 Compared with theJapanese Himawari-8/9 Satellites[J]., 2016, 6(1): 72-75.

[19] 陸風, 張曉虎, 陳博洋, 等. 風云四號氣象衛星成像特性及其應用前景[J]. 海洋氣象學報, 2017, 37(2): 1-12.

LU Feng, ZHANG Xiaohu, CHEN Boyang. FY-4 geostationary meteorological satellite imaging characteristics and its application prospects[J]., 2017, 37(2): 1-12.

[20] 董瑤海. 風云四號氣象衛星及其應用展望[J].上海航天, 2016, 33(2): 1–8.

DONG Yaohai. FY-4 Meteorological Satellite and its Application Prospect[J]., 2016, 33(2): 1-8.

[21] 華建文, 毛建華. “風云四號”氣象衛星大氣垂直探測儀[J].科學, 2018, 70(1): 24-29.

HUA Jianwen, Mao Jianhua. "FY-4" MeteorologicalSatellite Atmospheric Vertical Detector[J]., 2018, 70(1): 24-29.

[22] 王淦泉, 沈霞. 風云四號輻射成像儀及其數據在衛星氣象中的應用[J]. 自然雜志, 2018, 40(1): 1-11.

WANG Ganquan, SHEN Xia. The FY-4 Radiometer Imager and The Application of its Data in the Satellite Meteorology[J]., 2018, 40(1): 1-11

[23] 高軍, 王愷, 田曉宇, 等. 基于BP神經網絡的風云四號遙感圖像云檢測算法[J]. 紅外與毫米波學報, 2018, 37(4): 477-485.

GAO Jun, WANG Kai, TIAN Xiaoyu. A BP-NN based cloud detection method for FY-4 remote sensing images[J]., 2018, 37(4): 477-485.

[24] 范永東. 模型選擇中的交叉驗證方法綜述[D]. 太原: 山西大學, 2013.

FAN Yongdong. Overview of cross-validation methods in model selection[D]. Taiyuan: Shanxi University, 2013.

[25] 欒麗華, 吉根林. 決策樹分類技術研究[J]. 計算機工程, 2004, 30(9): 94-96.

LUAN Lihua, JI Genlin. The Study on Decision Tree Classification Techniques[J]., 2004, 30(9): 94-96.

[26] 周志華. 機器學習[M]. 北京: 清華大學出版社, 2016.

ZHOU Zhihua.[M]. Beijing: Tsinghua Press, 2016.

[27] Strabala K I, Ackerman S A, Menzel W P. Cloud properties inferred from 8-12??m data[J]., 1994, 33(2): 212–229.

[28] HAN Jiawei, Micheline Kamber, PEI Jian. 數據挖掘概念與技術[M]. 3版, 北京: 機械工業出版社2012.

HAN Jiawei, Micheline Kamber, PEI Jian.[M]. Third Edition, Beijing: China machine press, 2012.

Ensemble-learning-based Cloud Phase Classification Method for FengYun-4 Remote Sensing Images

GAO Jun1,2,CHEN Jian1,TIAN Xiaoyu1

(1.,,201306,; 2.,,850033,)

Cloud phase classification plays an important role in meteorological forecast and climate research. The image of meteorological satellite FengYun-4 (FY-4) has more channels and better resolution than FY-2. So it provides new remote sensing data for the study of the cloud phase. This study uses a brightness temperature cloud phase index to obtain cloud phase data. Thereafter, using the cloud phase data and ensemble learning algorithm, we develop a cloud phase classification model. By applying the cloud phase classification model, the predicted classification accuracy of water cloud and ice cloud are 91.69% and 76.10%, respectively.

cloud phase, ensemble learning, FY-4, remote image processing

TP389.1

A

1001-8891(2020)01-0068-07

2019-04-08;

2019-12-15.

高軍(1979-),男,浙江嘉興人,博士,主要從事遙感信息處理、網絡通信方面的研究。E-mail:jungao@shmtu.edu.cn。

國家自然科學基金項目(61602296)。

猜你喜歡
相態風云神經網絡
哈爾濱市冬半年降水相態預報技術研究
基于遞歸模糊神經網絡的風電平滑控制策略
風云三號E星初樣星
“風云”眼中的世界
SX油田PVT相態特征實驗測試研究
神經網絡抑制無線通信干擾探究
基于神經網絡的中小學生情感分析
煮不熟的雞蛋
象甲風云
基于支持向量機回歸和RBF神經網絡的PID整定
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合