?

面向算法認知戰的開源情報智能化分析

2024-03-19 11:30李靈芝
軍事文摘 2024年5期
關鍵詞:敵方開源情報

李靈芝 李 浩 馮 訊

烏克蘭危機是人類進入數字化、信息化、智能化時代的一次重大軍事沖突,呈現了戰爭形態和規則顛覆性的變革,使戰爭的主體和范疇不斷擴展、戰爭的社會化特點更加突出。戰爭不僅僅是現實世界的火力攻擊,更是人類認知的激烈博弈。借助于算力、算法,數據算法認知戰在烏克蘭危機中大顯身手,使人們第一次深刻體會到智能化時代認知攻防的巨大威力。算法認知戰是算法戰和認知戰的結合,它基于情報能力的支撐,利用算法的強大力量與數字條件下的智能優勢,達到改變人類認知的目的。

利用社交媒體操控和影響民心士氣,進而影響決策已經成為算法認知戰的通用手段。以美國為例,對內,類似Cambridge Analytica利用大數據影響美國競選的丑聞屢見不鮮;對外,從顏色革命到烏克蘭危機,利用各類媒體操控和影響民眾意識更是層出不窮??v觀算法認知戰的實踐運用,算法固然是核心,情報信息卻是算法顯效的關鍵,由此凸顯了開源情報工作的重要性。開源情報具有易獲取、時效強、內容多、傳播快等特點,但同時也存在數據一致性差、數據解釋力低下、碎片化等不足,傳統的開源情報分析方法已經不能滿足算法認知戰的要求,需要研究利用機器學習、知識圖譜等人工智能新理念與新技術,形成快速、精準、高效的情報產品,以面對未來戰爭的混合多域和智能化的發展需要。

面向算法認知戰的開源情報分析面臨的主要挑戰

要充分發揮開源情報在算法認知戰中的巨大優勢,就要對各類開源數據應搜盡搜。根據各類數據進行挖掘分析,形成目標的活動規律庫、事件的關聯關系庫等,以便構建目標知識圖譜,對目標進行研判,對事件進行推理預測,制定策略措施。但要發揮開源情報在算法認知戰的最大效能還面臨著以下三大主要挑戰。

情報來源多且同質化嚴重。開源情報獲取渠道眾多,隨著各類新媒體的出現,使得信息流動更快更方便,大量傳播者和平臺喜歡跟風炒作熱點事件,敵方利用這一特點,制造熱點新聞和話題,迅速以音頻、視頻、文本、評論等方式散播,使大眾看到聽到的都是重復內容,達到改變大眾認知的目的。同質化的開源信息需要情報搜集人員全面、細致地篩選,既影響了情報人員研判的客觀性,又可能遺漏重要的情報,還增加了情報預處理的難度。

情報源質量不高。算法認知戰是一場看不見硝煙的戰爭,大部分原始數據都來自于網絡上的視頻、音頻、文本等非結構化數據,為了贏得戰爭,采用深度偽造技術,充分利用短視頻、直播、演講等直觀有沖擊力的方式,引發大眾強烈的情感,致使在信息洪流中,搜集到的數據帶有欺騙性和隱蔽性,挖掘分析的結果會出現嚴重偏差,大大降低了情報的可用性,甚至會導致錯誤的決策。

開源情報信息易失效。社交媒體等網絡平臺的實時信息,往往是目標識別、趨勢預測、威脅預警的第一窗口,但網絡上各類輿論信息是快餐式、碎片化的,甚至是曇花一現的,而有的極具情報價值的關鍵點可能就隱藏在某些不易察覺的信息里,如果沒有及時發現,就會很快被淹沒在信息洪流中,再要尋找無異于大海撈針。而稍縱即逝的時間窗口被耽誤后,敵方很可能就達到了瞞天過海的目的,實現信息時代“眼皮子底下”的運籌帷幄、排兵布陣。

威脅情報信息體量、獲取難度、重要性的層級圖

智能化開源情報分析的體系架構

隨著算法認知戰在不同沖突場景中的廣泛應用,新的威脅在無形中快速出現,開源情報的價值挖掘在算法認知戰中將持續提升。人工智能技術的迅速發展為開源情報分析持續賦能,探索將人工智能領域新興技術應用到開源情報搜集、分析和運用流程中,采用機器學習、關聯規則、神經網絡等智能化技術或方法,從大量的開源數據中,發現其中的隱含價值,為決策者提供有效情報,對打贏算法認知戰具有重要意義。

收集層收集開源情報數據并進行預處理,是情報分析的基礎層。由于不同數據源采用的數據格式、度量單位、屬性描述等不一定相同,因此需要經過清洗、去重、分類、評估等一系列預處理,才能得到相對完整準確的數據。數據清洗可以去掉無關的廣告、垃圾信息等;數據去重可以去掉不同來源的重復信息,減少數據處理的時間和空間;數據分類可以按照任務或規則分成不同的類別并且打上標簽;數據評估可以去除虛假情報,并對情報來源的重要程度進行排序。

廣東省藥品檢驗所堅持“為藥品標準做方法,為藥品監督做方法”,不斷提升食品藥品檢測能力和水平,把食品藥品質量風險關進防控籠子里,書寫“最嚴謹標準”的“廣東樣本”。

管理層分布存儲并管理各類預處理后的數據。預處理后的數據具有不同的結構,而不同結構數據采用不同的數據庫來保存,如表格等結構化數據可采用關系型數據庫來保存;視頻、圖像、文本等非結構化數據,采用HDFS保存。在保存數據時,需要實時監控各個存儲節點的存儲資源,當某一節點出現過載時,則需要將數據遷移到其他節點,從而達到負債均衡。

各類數據中蘊涵大量的目標特征信息,具有一定的價值,因此在存儲數據時采用相應的冗余策略,避免出現某一節點崩潰導致數據丟失的現象。同時,大部分數據具有一定的密級,需求設置訪問權限、加密存儲、數據隔離等措施來提高數據安全性。

分析層分析層是算法認知戰中算法、算力價值的體現。通過對大量的數據進行分析和處理,挖掘出敵方的行為模式、意圖、目標等證據庫,構建其知識圖譜,為目標識別、態勢預測、威脅評估提供依據。

應用層應用層是挖掘分析結果在作戰中的運用。根據活動規律、事件關聯等證據性結果,對事件進行推理研判、趨勢預測,結合重點區域、要地目標,研判其企圖、評估威脅等級;根據不同用戶的需求和理解力,對信息進行精準推送,實現信息的高效利用和認知效能的最大化。

智能化開源情報知識挖掘與運用

算法認知戰背景下,智能化開源情報知識的挖掘和運用主要是通過分析獲取開源情報中的敵方目標活動規律、網絡行為痕跡、關系關聯網絡等信息構設知識圖譜,基于知識圖譜開展算法認知戰攻防行動。

智能化開源情報知識挖掘數據挖掘的方法包括統計分析、聚類分析、關聯規則挖掘、序列模式挖掘等。統計分析法可以揭示目標的活動規律,從而發現敵方目標活動特點、行為習慣等;聚類分析法可以將數據按照不同的特征進行聚類,從而發現敵方的不同活動區域、不同組織結構或不同的目的;關聯規則法可以挖掘出數據之間的關聯關系和規則,從而發現敵方行動背后的關聯事件和規律;序列模式法可以挖掘出數據之間的時序關系,從而預測敵方下一步可能的行動。

智能化開源情報分析的體系架構

揭示目標活動規律。雖然算法認知戰以高頻、分層、精準、多樣的形式對普通大眾形成思維認知壓迫,但其背后仍然存在一定的規律。目標活動規律主要包括目標活動頻次、活動地域、活動時間、活動路線、興趣偏好等來表征。主要采用聚類分析、分類分析方法揭示各類目標在特定路線、特定地域、特定時間反復出現的活動狀態,挖掘出不同類型目標規律性的特性,進而綜合分析和歸納總結出目標的活動規律。例如,通過關鍵人物的外交、演講、行為等開源數據,挖掘其性格特點、活動習慣等規律,按照一定的格式組裝后,建立起目標活動規律的數據庫。

挖掘目標事件關聯關系。向大眾精準推送專門設計的內容是算法認知戰的關鍵環節之一,而推送的內容不僅僅是一次簡單的事件,往往與社會活動、軍事行動等有一定的關聯度。事件關聯關系是發現不同事件之間的聯系,這種聯系可以從多個維度挖掘,包括事件發生的時間、地點、參與者、利益相關者、因果關系等。關聯規則分析是目標事件關聯關系挖掘的重要研究方法之一。在大數據環境下,關聯規則分析的作用得到了極大的發揮,它可在海量數據中尋找隱藏的數據項之間的關聯或相互關系。采用關聯規則分析可尋找得出某一事件或目標與其他相關事務之間的關聯關系,通過對挖掘所得的關聯規則的理解,達到預測推理的目的。

構建知識圖譜。大量傳播偽造信息是實施有效的算法認知戰的重要手段之一。要準確理解敵方行動意圖,就要掌握敵方復雜的內在連接關系、戰場事件序列、動態變化等情況。知識圖譜可以根據目標相關的專業知識,建立目標體系關系,從而形成以知識為中心的態勢。知識圖譜構建主要包括知識抽取、知識融合、知識存儲三個步驟。

知識建模是按照知識圖譜約定的一些模式進行業務抽象以及業務建模,主要是指對目標活動數據中的文本內容進行實體、實體屬性、實體屬性值類型、實體關系等的定義。

知識圖譜構建和運用過程

知識抽取是從管理層的結構化、半結構化和非結構化數據中提取實體、屬性、關系和事件數據,構建他們之間的關系,形成一系列的知識表達。例如,在算法認知戰情報感知體系知識圖譜中,目標實體包括人物、裝備等;屬性包括人物外形特征、活動特點、興趣愛好,裝備的型號、性能參數、作戰能力等;關系包括人際關系、裝備部署、指揮關系等;事件包括重點人物參與重要事件的時間、地點,裝備參與主要戰爭使用情況等。

知識融合是將不同來源的知識在規范下進行關聯、消歧處理,減少冗余和錯誤,達到知識、方法、思想的綜合,形成統一的目標知識庫。實體關聯是判斷兩個或多個實體是否屬于同一目標的實體,并將屬于同一目標的實體進行融合;實體消歧是根據上下文關系消除模糊、消除同一實體的一詞多義。

知識存儲將融合后的知識實體以“圖”這種數據結構存儲起來,形成知識圖譜。

將目標活動規律庫和關聯規則庫與知識圖譜結合起來,可以通過可視化的方式展現事件的發展趨勢,對目標進行識別和威脅評估。知識運用的結果又可以更新知識圖譜,使圖譜不斷完整壯大,為算法認知戰提供有力的情報支撐。

知識結果在算法認知戰中的運用算法認知戰是一個復雜的系統工程,基于算法、數據、情報、媒體等的支撐,才能穩中有序地層層推進,實現作戰目的。

趨勢預測。通過目標活動規律庫、目標關聯關系庫、知識圖譜等證據,形成包括目標、目標體系、事件之間的活動特點和關系數據,進而生成重要事件熱度趨勢、擴散途徑、發展演化,大眾在事件中的情感傾向、觀點態度等多維度全方位的分析結果,采用神經網絡建模、時間序列等方法實現事件發展趨勢預測和目標行為意圖預測,發出早期預警。

目標識別。通過分析敵方算法的語義、行為模式、邏輯結構等信息,識別出敵方的目標、意圖和動機。目標識別的方法包括文本分析、圖像識別、語音識別等,通過自然語言處理技術,可以分析出文本中的關鍵詞、主題、情感等,從而判斷出敵方的意圖和目標;圖像識別技術可以識別出圖片中的物體、場景、人臉等,從而判斷出敵方的行動計劃和目標;語音識別技術可以識別出語音中的關鍵詞和語調,從而判斷出敵方的情緒和態度。

威脅評估。這是評估敵方攻擊能力和可能造成危害的重要手段。通過對敵方算法的分析,評估出敵方的技術水平、不同內容攻擊范圍和層次、可能造成的傷害等。威脅評估的方法包括定量評估和定性評估。定量評估可以通過數學建模,分析敵方算法的攻擊能力和危害程度;定性評估可以通過專家意見、案例分析等方式,評估敵方算法的威脅程度。

智能化開源情報分析需要把握的問題

算法認知戰具有壓制敵人思維認知的智能優勢。近幾場具有智能化特點的軍事沖突表明,開源情報尤其是社交媒體情報在算法認知戰中的重要性日益增加。未來人工智能技術與開源情報挖掘分析將深度融合,人工智能等新興技術是一把雙刃劍,在提升開源情報分析能力的同時也可能面臨情報虛假欺騙的問題,因此需要把握三個方面。

技術為主,人工為輔。利用人工智能技術可以及時篩選、抓取、搜集并分析處理開源情報信息,自動生成規范化的情報產品,及時為事件的發展預測提供預警。人工智能的計算速度和耐力已經遠遠突破了人腦的極限,但人工智能技術不能完全模擬人的行為、也無法感知人的情感,面對算法認知戰的精準釋能,難以從多維度分析,因此在關鍵環節仍然需要人的干預。由于開源情報信息數據來源和內容的復雜性,利用人工智能技術提升人腦認知能力才是算法認知戰中開源情報分析工作發展的方向。

知識結果在算法認知戰中可用于威脅評估

分級管理,數據共享。開源情報種類繁多,各級各類情報分析部門搜集方法與手段不一樣,得到的情報維度和深度就不一樣,針對有計劃、有迭代、無孔不入、大范圍制造的話題熱點,應建立“戰爭目標中心、全源數據分析、按規分類共享”的分布式大情報分析體系,打破情報部門之間的壁壘,建立不同層級的數據管理機制,在安全的條件下,協調不同情報機構搜集分析盡可能全面的數據,并實現相互共享。

加強監測,防范安全?;谒惴ㄕJ知戰的開源情報分析需要實時關注輿論環境的變化,不斷掃描監測有無異常信息,對熱點話題進行持續跟蹤,但當數據積累到一定程度的時候,情報分析人員的操作習慣會被敵方發現并利用,從而可能出現身份冒用、惡意入侵等安全問題。因此,要增強數據入口、傳輸和分析過程中的安全監控、威脅預警等能力,使用基于人工智能技術研究數據加密、存儲的方法,確保數據安全。

結 語

算法認知戰在烏克蘭危機中顯示出巨大威力,開源情報、智能技術在其中起到了決定性作用。面對如今無處不在的開源數據,應加強人工智能相關領域以及相關技術的開發,將復雜的數據、先進的技術優勢、分析人員的主觀能動性結合起來,充分挖掘開源情報數據的內在價值,破解算法認知戰中情報分析的困境,進一步滿足作戰的情報需求。

猜你喜歡
敵方開源情報
情報
少林韋陀十八手
情報
4打5,敵方還剩幾個人?
情報
五毛錢能買多少頭牛
水果大作戰
人工智能有助于處置敵方炸彈
大家說:開源、人工智能及創新
開源中國開源世界高峰論壇圓桌會議縱論開源與互聯網+創新2.0
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合