?

基于深度多監督哈希的快速圖像檢索

2020-06-29 18:39潘紅艷
大眾科學·中旬 2020年7期

潘紅艷

摘要:隨著互聯網平臺上各類APP在人們之中的盛行,快速圖像檢索技術更新的需求日益迫切,因此近十年來在快速圖像檢索領域應用廣泛的哈希算法越來越無法滿足人們的需求。本文通過在哈希算法中引入深度學習的概念,同時運用分類和驗證信息等多監督方式,最終形成可以應用于快速圖像檢索的深度多監督哈希(Deep Multi-supervised Hashing,DMSH)。深度多監督哈希DMSH可以極大地提升快速圖像檢索在時間和空間上的效率,提高為用戶檢索所需信息的準確度。

關鍵詞:深度哈希;多監督;圖像檢索

引言

隨著各類社交平臺在人們生活中盛行,圖片、影像等數據呈現飛躍式增,人們迫切需求更高效的數據處理方式。哈希方法便是一種高效的數據查找方式,它通過將圖像數據轉換為低維表示或者一組有序的二進制編碼,大為減少了圖像所需的存儲空間。同時直接讀取圖像哈希碼的檢索時間,比讀取高維圖像文本特征的檢索時間更短。之后,深度學習概念的引入進一步提高了哈希算法的實用性,通過在輸入圖像后構建卷積層,引入分類信息和驗證信息等多監督方式,DMSH能夠同時進行圖像特征的提取和哈希函數的學習,極大程度地加強其在圖像特征上的表達能力,從而在時間和空間上更有效率的檢索圖像。

一、快速圖像檢索的現存技術不足

(一)傳統哈希方法無法滿足快速圖像檢索的效率需求

傳統哈希方法包括局部敏感哈希(Locality Sensitive Hashing,LSH)和譜哈希(Spectral Hashing,SH)等,在圖像數據特征的標記過程中需要手工進行,同時分步驟進行圖像特征提取和將特征轉換為哈希碼。但手工進行特征標記意味著只能進行線性特征的編碼,難以捕捉轉換圖片中隱含的語義信息。如LSH便是將通過哈希變換后相似圖像對的數據,采用隨機映射算法放入相同的原始數據分區內,讓具有相似特征的圖像劃分在相同的空間中。因此,隨著圖像數據的增多,為了準確表達圖像數據的特征并將其放入相應的原始數據分區內,往往需要輸出很長的哈希編碼來將特征全部包含在內,從而保證其有效性,但圖像檢索的響應時間也會隨哈希碼的增長變長。

(二)哈希碼提取不完善使圖像檢索不準確

圖像數據隨互聯網發展不斷增多,在進行圖像的成對對輸入時,非相似圖像的組合要遠多于相似圖像組合,正負樣本之間存在失衡的問題。由于這些非平衡數據的存在,在正樣本中的圖像分類任務中準確率可以近乎 100% ,但與此同時在負樣本中進行的分類任務準確率卻不到10%。因此,一般哈希算法中快速圖像檢索的準確性會隨著圖像數據的增多而下降。同時,為了保持歐式空間和漢明空間的一致性,傳統哈希方法一般通過激活函數的方式來逼近離散二值,但這會使得反向傳播變得困難,當圖像的訓練數據增多時還會相應的產生訓練時間加長的問題,不利于進行圖像的快速檢索。而如果采用sigmoid等非線性函數則會減緩網絡收斂的速度,導致圖像檢索時無法準確查找相似圖片。

二、深度多監督哈希在快速圖像檢索上的應用

(一)深度多監督哈希的結構

DMSH是一種在深度學習基礎上構建的多監督哈希網絡,具體的網絡結構如下圖所示。

在進行成組圖像的輸入時,先經過一個卷積層,在經過由38個兩兩相連的Block結構和卷積采樣層形成的基礎模塊,最后再經過兩個全連接層和單獨的特征層后,分別進入用于約束的分類、驗證和哈希分支。在最后的約束環節中通過將每副圖像分類到不同的子類中,讓深度哈希學習到的特征能夠很好地預測圖像的標簽信息,保證哈希編碼的在類別上的可區分性,從而增加圖像的類間距離。然后是利用驗證任務,讓信息相近的圖像映射得到相似的特征,信息差異大的圖像在映射后得到非相似的特征,從而將相似圖像的類內距離不斷減小。在該網絡模型中,能夠同時進行特征學習和哈希函數的訓練,極大地縮短了網絡查詢的時間,提高了網絡查詢的效率。

(二)更新損失函數獲得更優秀的哈希編碼

首先我們可以引入加權的方法,通過增加相似圖像對的權重、添加懲罰項降低非相似圖像對的權重等方式,構建更合理的的損失函數:

最后則是用歐式距離替代漢明距離,通過將輸出的哈希編碼每一維數據的絕對值與1求方差,使輸出數據最大化或最小化從而接近-1或+1,輸出近似二值的特征:

在整個DMSH網絡結構中,當將任意圖像輸入檢索相似圖片時時,都能從圖像中提取出能準確、完整地描述圖像包含信息的哈希編碼,然后根據哈希碼尋找相似圖片并按共有特征的重合程度進行排列,從而將快速圖像搜索準確性提升到更高。

結語

基于深度多監督哈希構建的快速圖像檢索技術,能夠獲得差異更小的圖像真值特征和哈希特征,同時將分類信息和驗證信息等作為監督方式,降低圖像數據類內距離并擴大其類間距離,從而提升快速圖像檢索在時空上的效率。通過在損失函數中加入了量化誤差、權重懲罰等方法,降低正樣本與負樣本之間數據不平衡對結果的影響。同時在網絡輸出上進行正則化從而減少圖像真值特征和哈希特征的不同,最終得到緊湊而表達準確的哈希編碼。深度多監督哈希不僅在快速圖像搜索領域能夠發揮出更高效的應用,還可以廣泛應用于人像搜索、社科以及地理環境等其他科學。

參考文獻

[1]李泗蘭,郭雅.基于深度學習哈希算法的快速圖像檢索研究[J].計算機與數字工程,2019,47(12):3187-3192.

[2]王華秋,郎帥.深度哈希卷積網絡在圖像檢索中的應用[J].重慶理工大學學報(自然科學),2019,33(03):98-106.

91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合