?

面向軍事領域的動態本體構建技術研究*

2023-02-01 12:23李墈婧胡建軍吳迪禮冬雪葉亞峰
現代防御技術 2023年6期
關鍵詞:本體軍事圖譜

李墈婧,胡建軍,吳迪,禮冬雪,葉亞峰

(北京計算機技術及應用研究所,北京 100854)

0 引言

軍事領域知識圖譜是建立指揮員、指揮信息系統以及作戰單元之間溝通的重要手段。其中,知識本體是廣義的領域知識框架,用于定義事物的類型、用于描述它們的屬性以及事物之間的關系,是知識圖譜構建的基礎。針對軍事領域數據來源廣泛、專業性強、保密性要求高等特點,現有的領域本體構建多是基于專家知識的靜態本體構架方法。劉麗等[1]針對態勢感知、作戰籌劃、指揮控制等功能需求,將軍事本體體系分為基礎本體、領域本體和應用本體3 層,實現對數據的統一建模。車金立等[2]通過挖掘百科數據中的裝備類型、裝備型號及裝備參數等數據,構建了軍事裝備領域知識庫。付雨萌等[3]梳理了軍事活動中涉及的事件、軍事人員、武器裝備、戰法等關鍵要素,完善及擴展了軍事活動事件本體模型。王震南[4]從兩棲登陸作戰領域場景出發,構建了包含裝備體系、作戰事件、作戰能力等實體的知識體系模型。劉夢超[5]針對面向海戰場的知識模型構建問題,定義了海戰活動、海戰裝備、軍事政治事件、專家先驗知識等核心概念的本體模型。趙文正等[6]通過定義軍事事理模式,開發了基于交互式分析工具的事理圖譜可視化系統。劉朝暢等[7]針對偽裝方案場景下的兵力、時間、資源等關鍵要素進行歸類,設計偽裝目標本體化模型,從而輔助軍事推理。

隨著信息增速、新概念的誕生、概念關系變化等,傳統基于手動構建靜態本體的方式已無法滿足海量數據動態更新的需求,現有的自底向上的本體構建方法存在噪聲大、準確性不高、適應性差等問題。近年來,國內外學者開始研究動態本體的構建問題[7-10],在理論上,利用已有資源實現概念、關系更新的本體映射技術受到廣泛關注;在應用上,主要集中在醫學領域[11-12]以及制造領域[13]的應用研究。目前,在軍事領域,尚缺乏對戰場數據進行刻畫的系統化動態本體更新策略,從而難以指導軍事智能在作戰數據上的實際應用。因此,本文在基于動態本體研究的基礎上,設計了一種基于軍事領域的動態本體構建方法,通過設計領域內實體、關系及屬性更新方法,改善了傳統知識建模對專家知識依賴性強、可擴展性差等缺點,并基于該動態本體更新方法,以俄烏沖突知識圖譜為案例,驗證了動態本體在知識圖譜構建、更新和分析上的重要性,為充分挖掘軍事數據的價值提供了基礎。

1 軍事領域知識圖譜需求分析

智能化戰爭形態下,戰場瞬息萬變,作戰數據來源廣、規模大、更新快,偵察監視預警需求多維全面,需要指揮員對重大戰略問題快速做出響應,而正確快速的戰略決策前提是必須了解和掌握大量的信息以及進行深入的信息挖掘。知識圖譜作為一個龐大的語義網絡,能夠對各類軍事實體、關系進行有效鏈接,對知識進行快速梳理整合并進行深層次挖掘,從而輔助指揮人員快速理解實時戰事,做出正確的指揮命令。

1.1 多源異構軍事領域數據融合處理的需求

隨著信息化時代背景和我軍獲取信息渠道的不斷升級,各種情報數據量呈現指數級上升。多源異構軍事領域數據除結構化數據外,還包括作戰指令、文書、戰場環境、敵情、我情等文字、圖像、音視頻數據。面對數據量和數據復雜度的爆炸式增長,如何從海量數據中挖掘關鍵信息,并進行高效組織管理成為軍事領域數據處理和分析的關鍵問題。知識圖譜在多源情報數據的處理方面展現出了極大優勢,已經發揮出重要作用。然而隨著戰場新的作戰對象、裝備的出現,其對應的概念體系也會發生變化,而同系列的裝備隨著新型號的研發,其性能和參數屬性也會隨之發生變化,導致知識圖譜的動態融合更新成為難點。因此,需要建立能夠動態更新的知識本體建模方法,實現大規模軍事情報知識圖譜的自動融合更新,形成戰場情況綜合態勢,進而解決作戰人員對知識的個性化搜索推薦和隱含知識的推理需求。

1.2 軍事事件演化推理的需求

目前,軍事領域重大突發事件的案例整編和復盤反演通常依賴情報分析人員人工從各類情報數據中梳理關鍵要素。隨著事件的發展演化,需要動態地從各類情報中檢測多維度的各類事件實體,解析事件要素,構建事件從開始、發展到結束的演化脈絡,形成軍事事件的整體描述。通過人物、裝備與作戰事件的關聯分析,能夠快速分析出其規律,提供精準的信息保障。如美國在抓捕恐怖分子本·拉登的行動中,通過Palantir 公司動態本體技術和工具,基于世界各基地頭目的通信和事件數據構建情報知識圖譜,并采用人物關聯分析、行為分析、事件演化分析等分析方法,最終挖掘出本·拉登的藏身地點,實現戰略目標,該行動突出了知識圖譜在軍事領域的重大效用。因此,亟需構建一套動態更新的軍事領域本體體系,基于該技術構建的知識圖譜才能夠打通系統底層功能域,根據戰場態勢的變化,對各類數據進行動態組織,從而完成作戰決策的智能推薦,輔助指揮員對戰場態勢進行綜合研判。

2 面向軍事領域的動態本體構建方法

軍事領域數據來源廣泛,專業性強。主要包含相關業務系統中的結構化數據、開源情報數據(新聞、百科、論壇、社交媒體等)、內部軍事情報數據(敵情、我情、戰場環境等)以及相關指令問答請求數據等。其中開源情報數據具有傳播速度快、信息多樣化、交互復雜等特點,如何從海量信息中自動化篩選出符合要求的信息,并與專有軍事領域知識進行融合更新一直是研究的難點。此外,隨著信息內容隨時間的變化,對問題的關注點也會有所不同,提取的語義信息會發生較大變化。因此對于指揮員日常作戰中的指令問答請求數據的處理也是本研究的關鍵點。

文本提出一種面向軍事領域的動態本體構建方法,實現知識本體的動態更新,具體架構如圖1 所示。主要包括初始本體設計、數據映射、形式背景合并、本體更新4 個部分,其中初始本體設計部分主要基于專家知識、基礎數據庫、歷史案例、軍事領域書籍或標準等進行抽象設計形成初始本體O1;數據映射部分主要將結構化、半結構化、非結構化等數據進行知識挖掘,映射為易于處理的結構化數據D;隨后,形式背景合并部分將初始本體O1轉換為形式背景K1,將結構化數據D轉換為形式背景K2,然后將K1和K2進行合并形成形式背景K;最后本體更新部分利用形式概念更新將形式背景K處理形成新的本體O2,實現本體的動態更新。

圖1 軍事領域動態本體構建方法架構圖Fig.1 Architecture of dynamic ontology construction method for military field

2.1 初始本體設計

軍事領域本體的構建往往依賴專家經驗來完成,本文在總結前人工作經驗以及相關知識的調研后,構建了軍事領域初始本體。

(1)確定實體分類體系

本文在借鑒第三方知識體系[14]的基礎上,通過綜合專家知識、基礎數據庫、歷史案例等數據,并參考相關行業標準[15-18]中的軍事分類及基本概念,結合軍事領域特點,完成本體的知識分類。在本文中,通過領域分析,把軍事數據分為裝備、人物、組織機構、物資、環境、設施、理論法規和軍事事件,具體分類方式如圖2 所示。

圖2 軍事領域數據實體分類體系Fig.2 Entity classification for military field data

(2)定義軍事實體屬性及實體間關系

基于以上實體分類體系,設計對應的實體屬性,主要有共有屬性以及專有屬性,部分屬性示例如表1 所示。

表1 軍事領域部分實體屬性示例Table 1 Examples of entity attributes for military field

此外,定義各實體類之間的關系,主要有隸屬關系、部署關系、參與關系、指揮和掛載等關系,對應的主要實體間關系如表2 所示。

表2 軍事領域實體之間主要關系示例Table 2 Examples of relationships between entities for military field

2.2 數據映射

數據映射主要是將多源異構數據進行信息抽取后統一映射處理。業務系統的結構化數據映射主要利用關系型數據庫(包括業務數據、武器裝備等實體庫、同義詞庫),抽取涉及原始數據之間的強語義關系,將語義信息進行關系映射;內部軍事情報等文本數據主要通過分詞、句法分析、語義分析等自然語言處理技術完成文本知識的挖掘,形成結構化數據存入關系型數據庫;開源情報數據涉及范圍較廣,需要先基于匹配規則進行篩選,去除數據噪聲后,再通過文本知識挖掘進行處理;指令及問答請求數據主要通過問答查詢理解映射抽取問題的關鍵信息點。

2.3 形式背景合并

基于構建好的初始本體,通過本體本身的語義信息以及概念之間的推導,將其轉化為形式背景K1=(G1,M1,I1),其中G1代表對象,M1代表屬性,I1代表關系。同理,可以根據2.2 節數據映射后的結果,得出形式背景K2=(G2,M2,I2);根據形式背景合并,求出合并后的形式背景K=(G',M',I')。

形式背景合并算法主要由相似度算法計算對象、屬性和關系間的相似性,判斷生成新的元素或元素合并。由于軍事領域有很多相似的表達,如“航空母艦”可以表達為“航母”,“殲-15”可以有“殲15”“J-15”等多種相似表達,此處采用基于知網的詞語語義相似度概念[19]來計算。知網中,每個詞語均可以由概念集合來描述,每個概念又由相應的義原來定義。

(1)詞語相似度。當詞語w1涉及n個概念:s11,s12,…,s1n,詞語w2涉及m個概念:s21,s22,…,s2m,則詞語的相似度為各概念相似度的最大值,即

(2)概念相似度。每個概念由相應的義原來描述其語義,由概念的語義描述包含第一基本義原、其他基本義原、關系義原、符號義原,故2 個概念s1和s2的相似度為

式中:βi為可調參數,代表不同類型義原的占比。

義原相似度計算公式為

式中:p1,p2表示2 個義原;d為兩義原在義原樹中的距離;α為可調參數。

通過以上計算可求出形式背景中詞之間的相似度,設定閾值,判定其大于閾值,代表2 個詞相似度較高,假設其中一個詞已經在形式背景中,則不需要添加,如小于閾值則將其添加到新的形式背景中去。

2.4 本體更新

在本體更新部分,文本采用基于形式概念分析[20]的本體更新策略。形式背景合并后得到對象與屬性之間的聯系,形式概念分析則是對實體、關系、屬性的泛化后的抽象表達,通過泛化表達形成概念格。已知形式概念的相關定義如下:

定理 1.對于形式背景K=(G,M,I),G的元素代表對象,M的元素代表屬性,I代表關系,gIm表示對象g和屬性m值之間的關系為I。

定理 2.假設A為對象集合G的子集,則A中對象共同屬性集合為

假設B為屬性集合M的子集,則具有B中相同屬性的對象的集合為

如果f(A)=B且g(B)=A,則稱C={A,B}為形式背景K的形式概念。

形式概念的更新包括對象的更新和屬性的更新,以屬性更新為例,假設初始本體對應節點的形式概念為C={A,B},新增屬性為m',具有該屬性的對象集合為g(m')。形式概念更新過程如下:

同理可以完成對象的更新,本方法基于初始本體構造的基礎上,完成初始形式概念的形成,進而基于合并后的形式背景完成本體的更新,利用形式概念更新算法,自動生成新的本體。

3 案例分析

為了更好地驗證動態本體對知識圖譜構建過程的影響以及本文動態本體構建方法的可用性,本節以俄烏沖突為背景,收集來自網絡開源新聞數據作為樣本集。首先依據初始本體抽取部分數據完成初始知識圖譜構建,隨著事件演化,新數據也層出不窮,利用本文所提出的動態本體構建技術對形式概念和本體進行判定更新,最終完成圖譜的實例化構建,構建結果使用Neo4j 圖數據庫進行存儲和可視化展示,最后結合構建的知識圖譜進行應用分析。

3.1 基于初始本體的知識圖譜構建

以俄烏沖突為背景,結合事件背景及第1 次沖突升級為例,利用爬蟲技術獲取公開網頁新聞、公眾號等相關數據,通過數據預處理及結構分析,形式化地表達了事件的發展脈絡,實現知識的結構化展示,部分初始實例結果如圖3 所示。

圖3 基于初始本體的知識圖譜示例Fig.3 Illustration of initial ontology-based knowledge graphs

如圖3 所示,每個節點代表一個實體。由圖中示例可以看出:“俄軍首次集結兵力”的背景原因主要包括“克里米亞事件”“新明斯克協議”和“北約擴張”?!岸碥娛状渭Y兵力”事件的下位事件主要有“頓涅茨克人民共和國獲準‘先發制人摧毀’烏克蘭軍事要地”“俄軍直升機跨過烏克蘭邊境”“俄軍從西部及中部調運大量兵力進入克里米亞占領區”和“俄軍準備‘西部2021’軍演”事件。其對應的相關事件有“烏克蘭總統簽署‘2021 年第117 號令’”。根據第2.1 節中的初始本體模型可以得到每個事件關聯的時間、人物、裝備、組織機構等實體。以上構建的知識圖譜以“俄軍首次集結兵力”為檢索對象,展示了相關事件之間的邏輯關系,根據時間線梳理使得事件的始末更加清晰,對于今后的事件發展演化分析具有較大參考價值。

3.2 基于動態本體的知識更新

隨著沖突的進一步升級激化,新聞數據也在不斷擴充細化,在實驗中,參考文獻[19]中的參數值進行計算。參數設置為:α=1.6,β1=0.5,β2=0.2,β3=0.17,β4=0.13。

假設現有形式背景中武器類實體已有“戰斗機”元素,對于新增同類型實體元素“殲擊機”、“直升機”是否要加入該背景進行判定,基于2.3 節形式背景合并算法,查找知網詞庫[21]“戰斗機”涉及的概念為:[No.134930|fighter| 戰斗機,No.134931|fighter plane|戰斗機],“殲擊機”涉及的概念為:[No.173130|fighter plane|殲擊機,No.173128|fighter|殲擊機,No.173129|fighter aircraft| 殲擊機,No.173127|attack aircraft|殲擊機],“直升機”涉及的概念為:[No.212666|chopper|直升機,No.212667|helicopter|直升機]。

每個概念由相應的義原來描述其語義,可通過義原樹的形式展示概念的層次關系,如圖4 所示。

圖4 概念對應的義原樹Fig.4 Semantic trees corresponding to concepts

經過計算得出“戰斗機”和“殲擊機”兩個詞語之間的相似度為0.865?!皯鸲窓C”和“直升機”的相似度為0.486。本實驗中,閾值設置為0.5,則將“直升機”判定為新元素加入該形式背景中。同理,可獲得更新后的形式背景。

利用本文動態本體構建方法進行本體模型的擴展更新,實例化后將新的三元組信息融合到知識圖譜中,部分示例結果如圖5 所示。

圖5 基于動態本體的知識圖譜示例Fig.5 Illustration of dynamic ontology-based knowledge graphs

針對沖突類事件“烏克蘭海軍炮艇與俄羅斯的一艘艦艇爆發沖突”,需要抽取烏方和俄方的裝備、組織等實體信息;針對戰爭類事件,則需要抽取軍事行動、外交談判以及影響等實體。知識圖譜不僅可以實現數據的關聯查詢展示,還可以實現關聯關系挖掘,事件演化推理?;趫D數據庫的路徑查找算法和圖算法,對于海量數據和關系的查詢及推理具有極高的效率。在該案例中,根據俄烏沖突中事件之間的關聯關系所生成的路徑,可以挖掘出揭示事件的演化方向和邏輯線索。

3.3 結果分析

通過動態本體構建的知識圖譜克服了靜態本體適應性弱、可擴展性差的缺點,實現知識的關聯融合更新及擴充,使得構建大規模知識圖譜成為可能。本節基于動態本體構建的俄烏沖突知識圖譜中包含多條事件演化路徑,且存在順承、并發、相關等關聯關系。通過事件關聯分析、事件時序分析和事件關聯實體對象分析,可以得出事件演化路徑的特點、演化原因、關鍵事件以及決策行動的底層邏輯。詳細解讀如下:

(1)基于構建的知識圖譜,提供信息的檢索和基礎計算功能。首先,對事件關聯的特定裝備(如“Giurza-M”小型裝甲炮艇、伊斯坎德爾短程彈道),可快速從知識圖譜中的裝備信息查詢其服役時間、裝備屬性、隸屬部隊、衍生型號等基礎信息,從知識圖譜中的歷史行為信息查詢其過往行動記錄,掌握裝備的作戰性能和使用規律。

(2)可根據圖算法構建包含軍事裝備、時序(不同事件發生的時間)、位置信息(地點)的子圖結構,依據這些關鍵要素進行子圖匹配和挖掘,查找歷史相似事件,為后續行動預測提供參考。

(3)可發掘本次事件不同于過往事件的新模式、新屬性等信息。例如,“烏克蘭海軍炮艇與俄羅斯的一艘艦艇爆發沖突”判定為沖突事件,則可根據需要抓取俄烏雙方的裝備、組織等信息;而“入侵烏克蘭”為戰爭類事件,則可挖掘分析軍事行動、外交談判和后續的影響。

(4)可根據知識圖譜中的知識和數據進行高效關聯分析。例如,根據事件之間的關聯度分析,整理出事件主線“暴力活動持續升溫”-“俄軍第2 次集結”-“俄羅斯承認頓巴斯獨立”-“俄軍第3 次集結”-“入侵烏克蘭”,根據當前行動態勢和歷史數據并利用圖譜中的大量關聯信息進行快速實時的事件預測預警,同時為后續事件發展提供可解釋依據。

4 結束語

本文對軍事領域知識圖譜本體構建的研究現狀和需求進行調研和分析,總結出目前研究存在的不足,提出一種軍事領域動態本體構建方法,同時利用該方法構建了俄烏沖突知識圖譜并進行分析,驗證了動態本體在軍事領域知識圖譜中所發揮的重要作用,為構建大規模知識圖譜提供了理論支撐。具體研究內容及創新點包括:

(1)考慮軍事領域數據量大且專業化程度高,結合軍事場景設計基于形式概念分析的本體更新算法,提出面向軍事領域的動態本體構建完整流程。

(2)結合目前研究現狀和專家知識構建初始本體模型,使用開源情報數據和本體更新算法進行動態本體構建,驗證了本文提出的軍事領域動態本體構建方法的可行性。

(3)以俄烏戰場實例為背景,基于動態本體構建俄烏沖突知識圖譜,進行圖譜可視化,并對圖譜的應用場景進行詳細分析,驗證了本文提出的軍事領域動態本體構建方法的實用性。

但是由于數據的敏感性,本文的實驗數據仍顯不足,無法全面覆蓋所提到的軍事本體模型,未來需要查找更全面的數據,擴充知識圖譜規模,進而完善動態本體自動更新的流程。

猜你喜歡
本體軍事圖譜
Abstracts and Key Words
繪一張成長圖譜
對姜夔自度曲音樂本體的現代解讀
補腎強身片UPLC指紋圖譜
主動對接你思維的知識圖譜
《我應該感到自豪才對》的本體性教學內容及啟示
Care about the virtue moral education
雜草圖譜
軍事幽默:局
軍事
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合