?

基于深度學習的初級戰場態勢理解研究

2018-01-18 00:31廖鷹易卓胡曉峰
指揮與控制學報 2017年1期
關鍵詞:態勢戰場神經網絡

廖鷹 易卓 胡曉峰

隨著新技術變革的推進,現代戰爭已發展為以信息技術為支撐的體系對抗.戰場是敵對雙方作戰活動的空間,是進行戰爭的基本條件.在信息化戰爭中,戰場空間空前拓展、戰場信息海量化、戰場環境復雜化、作戰對象多元化、作戰強度急劇增大給指揮員的精準指揮帶來巨大挑戰.傳統基于人經驗或認知的指揮模式已無法有效應對瞬息萬變的戰場和海量數據,準確快速地把握戰略、戰役層面的戰場態勢成為了難題.同時,現有面向作戰指揮的計算機輔助決策尚不能以人的認知模式來理解態勢(例如用數據對比[1?2]、數據場[3]、信息熵[4]等方法,并不能很好地解決態勢理解問題),難以適應新形勢的需要,人工智能的研究水平已成為制約戰場態勢輔助理解的瓶頸.因此,面對復雜萬變的戰場環境和海量數據,研究基于機器學習的戰場態勢理解問題對戰場輔助決策具有重要意義.

戰場態勢是個復雜概念.態,強調的是當前的狀態,是對作戰單元實體屬性、狀態信息和戰場環境的描述;勢,主要指作戰的發展趨勢,即作戰單元實體的能力變化、動態關系和行為趨勢.面對海量、復雜的戰場數據,要想輔助指揮員準確提取有用信息,發掘復雜態勢背后的隱藏知識,最為重要的是深入理解戰場態勢,以減輕指揮員作戰決策的難度.對戰場態勢理解的研究應建立在對戰爭的深刻認識基礎上,必須從認識戰場的復雜性入手,從體系對抗的角度,把信息化戰場作為一個復雜系統來研究.戰爭是一門藝術,也是一個復雜系統,“戰爭的偶然性”、“戰爭結果的不可重復性”、“戰爭中的迷霧”、“戰爭的自同步”等現象,都在說明戰爭復雜性[5],而作為與戰爭密不可分的戰場自然也就具備了復雜系統特征.因此,要研究戰場態勢,就必須從認識戰場的復雜性入手,從體系對抗的角度,把信息化戰場作為一個復雜系統來研究,不能簡單地只采用牛頓科學體系、還原論、決定論的思想作為戰場態勢理解的基礎,而要從更新的觀念出發來擴展戰爭認識論.

復雜網絡、大數據和深度學習研究的逐步興起,為從體系對抗的角度來研究戰爭、理解戰場態勢提供了契機.戰場就是一個涉及各類不同作戰單元和戰場環境的復雜系統,大量的作戰單元和指揮系統之間的聯系、人員、裝備與戰場環境之間的聯系等構成了一個高度復雜的復雜網絡;而戰場在推演的過程中,每時每刻均有大量的數據產生,進而構成了戰場大數據;而作為戰場主體的人,只有通過對戰場大數據、復雜網絡的深入理解,才能實現對戰場態勢的理解,進而實現戰場的運籌帷幄.隨著戰場數據的劇增,人的智能無疑越來越難以適應戰場態勢理解和決策的需要,采用人工智能方法對研究戰爭進程、理解戰場態勢和輔助戰場決策具有重要意義.

縱觀人工智能的發展歷程,人工智能已經歷了從2007年深藍擊敗國際象棋大師卡斯帕羅夫,到2011年超級電腦“沃森”在美智力競猜節目中擊敗人類,到以2012年深度學習為基礎的Google貓臉識別[6],再到AlphaGo戰勝李世石這幾個里程碑事件,其理論和技術日益成熟,應用領域也不斷擴大.根據米勒法則:人只能考慮7~9個因素,如果計算機能考慮10個因素以上,其分析能力就超過人[7].隨著計算機技術的進一步發展,計算機以其強大的運算能力、存儲能力使其在未來的許多應用領域有可能勝過人類.當前人工智能研究的熱點聚焦于深度學習:深度學習的動機在于建立、模擬人腦進行分析學習的深度神經網絡,它模仿人腦的機制來解釋數據,其基本原理是通過組合低層特征形成更加抽象的高層表示屬性類別或特征,以發現數據的分布式特征表示.深度學習已經成功應用于機器視覺、語音識別和自然語言處理[8],其研究和應用已經為進行戰場態勢理解提供了一定條件.

基于深度學習的戰場態勢理解的研究,對真正實現有效的作戰輔助決策具有重大意義.戰場作為高度復雜的系統,參戰雙方是不合作、相互對抗的,個體或單元獲得的信息是不完全的和不確定的.同時,在戰場態勢信息的認知過程中,抽象層次越高,對態勢認知就越具有主觀性,直接導致可量化程度越低.為了克服主觀性和不完全信息帶來的弊端,采用更為客觀的深度學習,可以挖掘出大數據背后包含的隱含特征,全面的抽象到態勢理解.通過模仿人對事物的認知方式,深度學習可以在無監督的情況下,不斷對事物進行抽象學習,一方面通過逐層抽象、提取特征達到知識學習的目的,而最大程度上保持數據的等效性,進而可以提取出戰場態勢中的關鍵部分,形成表達戰場態勢的最小集合,進而對戰場數據進行有效過濾,提高態勢理解的效率;另一方面,通過計算機對戰場態勢的累積學習,可以逐步形成戰場態勢的理解,進而對實時的戰場信息形成人工智能認知,為指揮員提供輔助決策,提高指揮員的作戰指揮決策速度和準確性.因此,基于深度學習的戰場態勢理解的研究,對真正實現有效的作戰輔助決策具有重大意義.

1 態勢理解方案及設計流程

以體系對抗、戰爭復雜系統思想為指導,系統地研究聯合作戰條件下戰場態勢理解問題,深入剖析指揮員對戰場態勢理解的過程,探索深度學習網絡的特征提取和抽象機理,探討初步的無監督態勢分析構想,通過建立復合架構的多層神經網絡,基于多次聯合作戰條件下的兵棋演習數據進行深度學習訓練,實現戰場態勢的無監督逐步理解,構建態勢理解系統平臺,對現有兵棋系統進行功能擴展.

1.1 態勢理解目標的分層設計

模擬指揮員對戰場態勢理解的過程來設計分層無監督學習的態勢理解目標,使得分層目標需要符合人腦認知的過程,也便于構建相應的深度學習網絡對其進行實現.

將態勢的理解目標分為3個層面,如圖1所示,第1個層面是理解作戰實體屬性、作戰實體狀態和作戰環境;第2個層面是理解作戰實體的動態關系;第3個層面是理解作戰實體的能力變化和行為趨勢.這樣易于實現態勢理解這一復雜、困難的任務,也便于構建復合架構的深度學習網絡.

1.2 態勢理解的深度學習機理研究

人的大腦有無數神經元進行數據交換和處理.在目前計算機達不到同等處理能力的條件下,準備分階段進行,構建多層神經網絡對戰場態勢淺層(易理解)信息先進行學習,隨著研究的深入,逐步去挖掘其隱含的深層信息.通過大量的學習實驗來縮小識別的誤差,研究在每一層隱含層輸出的可理解特征,結合指揮員的經驗來重新規劃設計深層學習網絡,以提升每一層神經網絡學習抽象的效果.

人的經驗來源于工作生活中無時無刻的學習,新的信息和經驗不斷地存儲在大腦中,而利用大量數據樣本不斷地深度學習的多層神經網絡,進行訓練就是模擬態勢理解過程.為了使得對大規模的多層神經網絡訓練結果得以保存,實現學習經驗的不斷累積,利用復雜網絡理論,構建相應的權重系數矩陣,將每一輪成功訓練得到神經網絡顯層和隱含層之間的權重系數保存.整個態勢理解的機器學習模擬過程如圖2所示.

在構建面向態勢理解的深度學習模型過程中,需要考慮到深度學習模型效率的問題.一方面在深入分析深度學習機理的基礎上研究加快神經元處理速度的方案,另一方面結合不同的認知模式,研究相應認知模式的數學模型,并將其融入深度學習模型,從而得到面向態勢理解的深度學習模型.

我們采用了條件反射來進行強化學習,其過程可以由如下等式表示:

其中w ij表示神經元j到神經元i的連接權,y i與y j為兩個神經元的輸出,α是表示學習速度的常數.若y i與y j同時被激活,即y i與y j同時為正,那么w ij將增大.若yi被激活,而y j處于抑制狀態,即y i為正y j為負,那么w ij將變小.通過將該學習方式融入到深度神經網絡,即可使得機器具備強化學習的能力.

1.3 復合架構深度學習模型的構建

戰場態勢理解的復雜性和效率要求,決定了單一的學習模型難以滿足需求,本文構建了復合架構的深度學習模型.以分層態勢理解目標為指導,通過對戰場中基本作戰單元實體的學習,可以建立不同作戰單元的基本實體模板;進一步,對不同作戰單元的基本實體模板,通過學習其特定時間段中時序狀態信息,則可以構建作戰單元的動態關系模板;再者,對某一作戰單元特定時間段的時序動作進行學習,即可識別出作戰單元的行為意圖,從而構建出行為模板.通過上述學習,則構建了戰場態勢的主要基本模版.

以戰場態勢中不同類別的基本單元模板的深度學習模型為基礎,構建復合架構的多層神經網絡模型.以戰場基本單元的深度學習模型為主題,以作戰單元之間聯系的深度學習模型為基本聯系,結合戰場環境的深度學習模型,進行模型的融合,生成面向態勢理解的基于復雜網絡的深度學習模型,以實時感知戰場態勢.

1.4 分層次的態勢理解的檢驗與優化

從歷次兵棋演習數據中選取具有一系列由時序數據組成的典型意義態勢,利用這一系列典型態勢信息構建成測試態勢集,對復合架構的多層神經網絡進行測試,以評判學習的效果,與數據對比對學習過程改進優化,實現對態勢理解系統平臺的檢驗與優化,其具體步驟如下:

對多層神經網絡中高層隱含層特征進行逐層分析,提取出無監督學習抽象得出的特征,并進行特征還原,將這些特征還原成人能夠理解的方式,與對應的戰場態勢數據進行關聯分析.需要說明的是,態勢數據架構復雜且數量巨大(一個對抗時段的數據就高達數十G),以目前的軟硬件計算能力,無法完成深度學習的處理.因此,為更好地完成態勢理解原型系統平臺的測試,選取一個具有代表性的態勢理解過程來進行態勢理解的檢驗與優化:首先進行雙方作戰單元部署的理解,進而完成各作戰單元之間關系的理解,最后實現雙方之間態勢優劣的理解.分層次態勢理解的檢驗與優化流程見圖4,對演習數據進行抽取后進行深度學習,提取多層神經網絡隱含層的特征,還原特征與實際態勢進行關聯分析,得出逐層的特征理解,將態勢理解的結果與演習實際數據進行數據比對,將比對結果通過仿真、實驗進行反饋調整,通過反復的數據實驗,對分層特征分析的結果進行優化,提升態勢理解原型系統平臺學習理解的效果.

2 仿真與實驗

仿真平臺使用的是Python,因兵棋演習數據包含大量結構、非結構化數據,為便于開展實驗,抽取了部分演習數據,進行了數據轉換和實驗重構,如圖5所示,仿真用實驗數據格式如下:

?000000005000001//前10位為作戰單元標識號,后5位標識紅方、藍方;

?080034079000022//前面3個3位分別是人員數、武器數、彈藥數,后6位為戰斗力值;

?006550037000084//3個5位分別是地理位置的經度、緯度、高度;

?000000000400000//前10位為地形類型,后5位為其他屬性秒速.

作戰單元聚類:

采用K-均值聚類算法對生成的1000個作戰單元實體進行聚類分析,以從地理上識別可能處于對戰關系的實體集合.

作戰聚類態勢分類:

經過上述處理,對樣本空間的數據進行聚類后得到小聚類,采用改進RBM算法對其進行無監督訓練,然后按照步驟1~3生成測試數據,進行5次實驗(態勢復雜度依次上升),每次進行10組態勢測試.同時,由人工(專家)根據測試數據給出戰場態勢優劣的評價標準,對比改進RBM識別結果和專家評判結果,如圖6所示.

通過對隱含層的數據進行識別發現,改進RBM能夠一定程度上識別出數據中帶有的比較關系,如圖7中第2列為戰斗力指數,成為算法自動組織關系網絡的依據:

3 結論

面對全維戰場和海量數據,研究基于深度學習的戰場態勢理解問題對作戰輔助決策具有重要意義.本文圍繞著作戰態勢問題,從體系對抗性和戰爭復雜性角度出發,系統研究聯合作戰條件下戰場態勢理解,通過模仿指揮員理解態勢的模式,初步建立復合架構的深度學習網絡,基于兵棋演習數據,實現了初步的戰場態勢優劣判別,有助于態勢理解問題的進一步研究.目前我們所進行和即將進行的研究如下:

1)以體系對抗的思想為指導,從復雜網絡、大數據和深度學習的角度研究聯合作戰,提出戰場態勢理解的智能輔助方案;

2)對人認知和深度學習原理進行深入研究,探索深度學習網絡的特征提取和知識抽象機理,構建具有復合架構的多層神經網絡,實現對戰場態勢大數據的無監督學習;

3)設計無監督學習獲取的特征還原機制,將特征與對應戰場態勢進行關聯分析,形成逐層的戰場態勢特征理解,將態勢理解與演習數據進行科學比對,通過仿真、實驗進行反饋調整,實現態勢理解的過程和結果優化.

1 淦文燕,李德毅,王建民.一種基于數據場的層次聚類方法[J].通信學報,2006,34(2):258?262.

2 楊靜.基于數據場的密度聚類算法研究[D].太原:山西大學,2013.

3 嚴家德,金蓮姬,王巍巍,等.第二代自動氣象站不同氣溫觀測系統數據對比分析[J].氣象科學,2014,34(1):60?65.

4 李赟,劉鋼,老松楊.戰場態勢及態勢估計的新見解[J].火力與指揮控制,2012,37(9):1669?1677.

5 胡曉峰,楊靜.基于數據場的密度聚類算法研究[M].北京:國防大學出版社,2012.

6 LE Q V,RANZATO M A,MONGA R,et al.Building high-level features using large scale unsupervised learning[C]//The 29’th International Conference on Machine Learning,Edinburgh,Scotland,UK,2012.

7 陸明濤.魔法數字7:米勒法則的行為經濟學分析[J].重慶工商大學學報(社會科學版),2011,28(1):23?27.

8 L?NGKVIST M,KARLSSON L,LOUTFI A.A review of unsupervised feature learning and deep learning for time-series modeling[J].Pattern Recognition Letters,2014,42(1):11?24.

猜你喜歡
態勢戰場神經網絡
基于神經網絡的船舶電力系統故障診斷方法
歷史虛無主義的新近演化態勢與特征
基于遞歸模糊神經網絡的風電平滑控制策略
戰場上的神來之筆
C-130:戰場多面手
貼秋膘還有三秒到達戰場
2019年12月與11月相比汽車產銷延續了增長態勢
匯市延續小幅震蕩態勢
國際金價能否延續上漲態勢
基于神經網絡的中小學生情感分析
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合