?

基于深度學習的太赫茲時域光譜識別研究

2021-01-06 03:02胡其楓
光譜學與光譜分析 2021年1期
關鍵詞:赫茲時域光譜

胡其楓,蔡 健

博微太赫茲信息科技有限公司,安徽 合肥 230088

引 言

太赫茲波介于遠紅外和微波之間,頻率在0.1~10 THz。在太赫茲光學技術中,太赫茲時域光譜(terahertz time-domain spectroscopy,THz-TDS)技術是目前使用最廣泛的技術之一。THz-TDS技術是一種相干探測技術,不同的物質分子被一定頻寬的太赫茲波透射過后,會吸收不同頻率的太赫茲光波能量,從而產生特征吸收峰,對應的光譜又被稱為“太赫茲指紋光譜”。通過對物質“指紋譜”的識別可以實現對毒品和爆炸物等生化危險品進行非接觸式無損檢測,因此THz-TDS技術受到了警方、海關、安保反恐等部門的高度重視[1]。

總結近年來國內外關于太赫茲時域光譜識別方法的研究,主要集中在一些光譜分析法和機器學習方法相結合的技術[2-4]。馬帥等提出一種采用兩層受限玻爾茲曼機(restricted Boltzmann machine,RBM)構建深層信念網絡模型自動提取太赫茲光譜特征,使用k最近鄰(k-nearest neighbor,k-NN)分類器對不同物質進行識別。Yin等[5]提出一種利用遺傳算法和偏最小二乘判別分析相結合的方法來鑒別食用油。Mumtaz等[6]通過主成分分析(principal component analysis,PCA)區分了對太赫茲輻射是透明的聚合物。

這些方法往往需要經驗豐富的工程師手工設計特征提取器,對于變化的自然數據具有局限性。深度學習方法目前已經成功運用在圖像分類、語音識別等領域,不需要人工設計特征提取器,通過一些非線性的結構把原始數據轉變成更加抽象的表達,自動提取特征,特別適合自然數據,并且算法性能會隨著數據的豐富而提升。太赫茲時域光譜的識別,本質上是一個非線性分類問題,深度學習方法由激活函數引入非線性,更加適合非線性分類問題。作為深度學習的代表方法,卷積神經網絡(convolutional neural network,CNN)在太赫茲時域光譜識別上應用的相關文獻資料很少,循環神經網絡(recurrent neural network,RNN)的應用暫無相關文獻報道。

本文設計了兩種深度學習識別光譜的網絡: 基于RNN的一維譜線分類網絡和基于CNN的二維譜圖分類網絡。由于毒品、爆炸物樣本難以獲得,以12種物質(包含11種有機物和空氣)為研究對象,通過Matlab和Python編碼實現對物質類別的判定。相較于傳統方法,深度學習識別方法能夠更好地克服噪聲等干擾、耗時不受數據量的影響,準確率更高、速度更快,為太赫茲時域光譜的毒品、爆炸物識別提供參考。

1 實驗部分

用于探測物質的THz-TDS系統構成如下: 由飛秒激光器產生激光脈沖通過分束鏡,分為泵浦光路和探測光路; 泵浦光入射光電導天線激發出THz脈沖,經過一組拋物面鏡,對準射向測量樣品; 探測光與透射樣品的THz波共同射入探測天線,通過控制時間延遲系統來改變THz脈沖和探測光脈沖之間的時間延遲,獲得完整的時域光譜。經過傅里葉變換得到頻域譜,從中進一步能夠獲取吸收譜、折射率、透射率等光學參數。

已有研究[7]發現常見毒品在1.0~2.5 THz具有不同的特征吸收峰,單質炸藥在0.6~2.3 THz具有不同的特征吸收峰。由于毒品、爆炸物的樣本難以獲得,本文以五種酸類物質(抗壞血酸、L-谷氨酸、L-組氨酸、L-蘇氨酸、L-酪氨酸)為例,獲取其太赫茲吸收譜如圖1所示??梢钥吹皆?.5~2.5 THz頻段內,五種物質吸收峰的位置各不相同。因此,根據太赫茲時域光譜來對不同物質進行識別是可行的。由于2.0 THz頻段之后包含較多的無效信號,識別時需要對光譜進行截取。

圖1 五種不同物質吸收譜Fig.1 Absorption spectra of five acids

太赫茲時域光譜會受到各種噪聲干擾[8]: 光源漂移帶來的本底噪聲; 平臺、器械振動帶入的機械噪聲; 空間電磁輻射帶來的電子噪聲; 光路準直、光學元件帶來的衍射噪聲等等。另外,樣品濃度、空氣濕度也對太赫茲時域光譜的“指紋”造成干擾,本文對這兩種因素的影響進行分析。

選用在太赫茲波段無吸收特征、基本透明的聚乙烯粉末作為稀釋混合劑,將維生素B2與聚乙烯粉末按照1∶1,1∶3,1∶5,1∶7的質量比(即濃度)進行混合,用壓片機將粉末壓成片劑。在空氣濕度4%下測試不同質量比的維生素B2的太赫茲吸收譜,結果如圖2(a)所示; 將維生素B2在空氣濕度15%和70%下分別測試其吸收譜,結果如圖2(b)所示。

圖2 (a)不同濃度的維生素B2吸收譜; (b)不同濕度下的維生素B2吸收譜

從圖2中可以看出,在0.5~2.5 THz頻段,吸收峰的位置不隨物質濃度的變化而變化,濃度越大、信噪比越好; 空氣濕度不會消除物質原本的吸收峰[9],但會引入額外的吸收峰,濕度越大、毛刺(噪聲)越多,識別的難度越大。

因此,有必要對光譜數據進行平滑除噪。S-G(Savitzky-Golay)濾波器[10]是一種廣義移動平均濾波器,在時域內基于局域多項式最小二乘法擬合的線性濾波器,被廣泛地運用于光譜數據平滑除噪。使用S-G濾波器對維生素B2的吸收譜進行處理,如圖3所示,黑色曲線是原始數據、紅色曲線是處理后數據??梢钥闯?,S-G濾波后的數據能夠保留信號的峰值等重要特征,提高了光譜的平滑性同時降低了噪聲干擾。

圖3 S-G濾波結果Fig.3 Result of S-G filtering

2 光譜識別

2.1 算法結構

CNN和RNN都是在傳統的深度神經網絡(deep neural network)基礎上發展起來的,是深度學習中最具代表性的兩類方法。深度神經網絡一般由輸入層、隱藏層、輸出層構成。輸入層一般是原始數據或圖像,也可以有一些預處理操作。

CNN中常見的隱藏層有: (1)卷積層: 前一層的特征圖與卷積核進行運算,經過激活函數構成該層特征圖,過濾有用的特征而抑制無用的特征; (2)池化層: 對特征圖通過下采樣來降低網絡的空間分辨率,在保留主要特征的同時減少參數計算量; (3)全連接層: 卷積和池化層的輸出經過全連接運算,將特征加權映射到樣本標記空間。CNN模擬的是動物大腦的視覺皮層機制,隱藏層的內部神經元之間是無連接的。CNN在圖像分類等視覺任務上取得了較好的性能[11],可以將光譜數據轉化為圖像來進行處理。

而RNN中的隱藏層,內部神經元之間是有連接的,輸入來自上一層的輸出和上一時刻本層的輸出,通過記憶信息保留序列依賴性。因此,RNN非常適合研究序列和時間數據,太赫茲時域光譜數據就是有時序關系的數據。

一個完整的深度學習算法流程有如下幾個步驟: (1)網絡結構設計: 這是算法的核心部分。根據問題的輸入和輸出,同時參考經典的網絡結構(如LeNet、VGG等),來設計網絡的輸入層、隱藏層、輸出層。(2)數據準備: 數據集是由形如(數據,標簽值)的向量對構成,數據可能是圖像、信號、特征等等,標簽值是輸入數據的類別。按照互斥同分布的原則和一定的比例,將數據分為訓練集和測試集。(3)網絡訓練和測試: 訓練集用于訓練模型,數據通過網絡進行前向傳播,損失函數計算前向傳播結果與標簽之間的誤差; 反向傳播確定梯度向量,進而調整每一個隱藏層的權值; 重復前向傳播和反向傳播,直到損失不再顯著下降,將這時網絡的權值保存下來,稱為模型。最后,用測試集來整體評估模型的性能。

(1)基于RNN的一維譜線分類網絡

網絡結構如圖4所示,第一層是數據輸入層,輸入數據是一維數據。第二層是一個長短時記憶(long-short term memory,LSTM)單元,LSTM[13]是傳統RNN的變體,解決了傳統RNN訓練時間比較長會出現梯度彌散的問題。第三層是全連接層,起到連接所有的特征、將輸出值送給分類器的作用,因為我們要解決的是分類問題。第四層是softmax層,輸出類別和置信度。

圖4 RNN分類網絡結構Fig.4 RNN classification network structure

為了識別多種物質光譜,本文采集了12種物質在非真空環境下的太赫茲光譜,每種物質的樣本數量需要保持相當,否則算法會朝著樣本數量多的物質種類過擬合(overfitting),過擬合是神經網絡常見問題,即模型對訓練數據擬合非常好,對測試數據擬合比較差。同時,增加不同濃度的樣本以提高識別算法的魯棒性。

數據格式為一維的太赫茲光譜頻域信號,數據取前256維,包含主要特征信息。

(2)基于CNN的二維譜圖分類網絡

網絡結構如圖5所示: 第一層是數據輸入層,輸入數據是二維圖像。接下來是若干個卷積層、池化層、全連接層、BN(batch normalization)層。使用多個卷積層是為了得到更深層次的特征圖。BN層把所有訓練樣本的統計分布標準化,降低了不同樣本的差異性,使得網絡的訓練速度加快、效果提升。隨機失活(dropout)在訓練過程中,隨機將部分隱藏層節點的權值歸零,能夠克服過擬合。最后一層是softmax層,輸出類別和置信度。

圖5 CNN分類網絡結構Fig.5 CNN classification network structure

數據格式為二維圖像,是由太赫茲光譜頻域信號前256維轉化而來,每一張圖像大小固定為256×160。如圖6所示,每張圖像代表一條光譜信號。

圖6 12種物質的光譜圖像Fig.6 Spectral images of 12 materials

2.2 方法

第一步是數據采集和處理: 首先進行數據采集,實驗設備采用德國Menlo Systems公司的Tera K15型太赫茲時域光譜儀,動態范圍為60 dB,泵浦激光的重復頻率為100 MHz,波長為1 560 nm。數據采集時,設定脈沖的時域范圍為80 ps,每8組原始數據進行一次平均,此時頻率分辨率為6.25 GHz。在非真空環境下采集22 491組3種濃度(1∶0,1∶1,1∶2)的如圖6所示12種物質的光譜。數據處理首先去除異常數據,對原始數據進行S-G濾波、濾波窗口設為9; 然后將光譜數據截斷,取前256維的數據作為RNN網絡輸入,變換成256×160的圖像作為CNN網絡輸入; 最后采用“留出法”將數據集劃分為訓練集和測試集: 將數據集中所有類別的數據均按照4∶1的比例劃分為兩個互斥的集合,較多的數據集合作為訓練集、較少的數據集合作為測試集。

第二步是模型訓練: 將訓練集數據通過前向傳播和反向傳播,觀察損失變化,保存模型。通過改變數據集和網絡超參數等方式,訓練多個模型,從中擇優。

(1)基于RNN的一維譜線分類程序使用MATLAB語言編碼,調用Deep Learning工具箱。學習率設為0.001。如圖7所示,訓練到2 000次iteration左右,損失已經不再顯著下降,將此時的權值保存作為模型。訓練耗時約20 min。

圖7 RNN網絡訓練過程Fig.7 The training process of RNN network

(2)基于CNN的二維譜圖分類程序使用Python語言編碼,基于TensorFlow框架。學習率設為0.000 01,batch不宜設置過大,否則泛化性不好,本文設為8。如圖8所示,訓練到50個epoch左右,損失已經不再顯著下降,將此時的權值保存作為模型。訓練耗時約80 min。

圖8 CNN網絡訓練過程Fig.8 The training process of CNN network

第三步是模型測試: 載入上一步中保存的模型,將測試集數據通過前向傳播得到測試結果。

3 結果與討論

使用經過S-G濾波后的3種濃度(1∶0,1∶1,1∶2)的測試數據對上述兩種算法以及k-NN算法進行比較分析。k-NN算法的基本原理是計算測試數據與已知類別的訓練數據之間的距離,找到與測試數據距離最近的k個鄰居,根據鄰居所屬的類別來判斷測試數據的類別。測試結果如表1所示。由表可知,k-NN算法的缺陷在于: 測試數據每一次都需要和訓練數據逐一進行比較,算法測試耗時與訓練集大小有關,訓練集越大、測試耗時越長; 算法對所有數據逐點進行距離計算,對噪聲敏感、泛化性差。而基于RNN和CNN的算法,訓練集只影響訓練耗時,測試耗時僅和網絡復雜度即層數有關; 算法可以克服一定程度的噪聲干擾。

為了分析數據預處理對于深度學習方法的影響,分別使用不經預處理的數據集和S-G濾波后的數據集,在同樣的超參數設置下,使用本文方法進行對比實驗,測試結果如表2所示。由表可知,數據預處理對于深度學習類方法是有必要的,可以消除噪聲對模型的干擾,提升模型泛化性。

表1 三種算法的性能比較Table 1 Performance comparison of three algorithms

表2 數據預處理對于RNN和CNN性能的影響Table 2 The effect of data preprocessing onperformance of RNN and CNN

圖9 (a)樣品濃度的比較實驗; (b)數據維度的比較實驗

為了對比RNN和CNN方法的效果,在同樣的超參數設置下,分別使用不同濃度和不同維度的數據進行對比實驗。樣品濃度越大,光譜信噪比越好; 前256維光譜頻域信號包含主要特征信息,維度越大,包含的冗余信息越多。測試結果如圖9所示,對于不同濃度和不同維度的數據,CNN方法的準確率普遍比RNN更高,且更加穩定。因此,在光譜的識別上,CNN方法要優于RNN方法,其泛化能力更好、能更好地克服低信噪比和噪聲。

4 結 論

對非真空環境下12種物質的光譜進行分析,提出基于RNN的一維譜線分類網絡和基于CNN的二維譜圖分類網絡。測試結果表明,兩種算法均能夠實現光譜識別,在測試集上分別能達到97.5%和99.6%的準確率,算法耗時均小于10 ms,與傳統k-NN方法相比準確率更高、速度更快。由于自然環境下的空氣濕度和其他噪聲干擾,我們對光譜數據進行S-G濾波處理,發現處理后的光譜數據特征更加明顯,算法的準確率得到提高。進一步對RNN和CNN方法進行對比分析,發現CNN方法能夠更好地克服樣品濃度和數據維度的影響,比RNN方法的魯棒性更強。

本文探索了兩種深度學習算法在光譜識別上的應用,克服了空氣濕度和樣品濃度對信噪比的干擾,解決了k-NN算法速度慢的問題,為太赫茲技術在無損安全檢查領域的應用提供了算法基礎。

猜你喜歡
赫茲時域光譜
基于三維Saab變換的高光譜圖像壓縮方法
基于時域信號的三電平逆變器復合故障診斷
基于雙頻聯合處理的太赫茲InISAR成像方法
太赫茲低頻段隨機粗糙金屬板散射特性研究
太赫茲信息超材料與超表面
基于極大似然準則與滾動時域估計的自適應UKF算法
基于時域逆濾波的寬帶脈沖聲生成技術
星載近紅外高光譜CO2遙感進展
基于時域波形特征的輸電線雷擊識別
苦味酸與牛血清蛋白相互作用的光譜研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合