陳 磊 李露平 劉玉敏
(1.訊飛智元信息科技有限公司,安徽 合肥 230088;2.訊飛華中(武漢)有限公司,湖北 武漢 430000;3.安徽省引江濟淮集團有限公司,安徽 合肥 230601)
中國是一個幅員遼闊的國家,地理環境復雜多樣,同時也是世界上經歷洪澇災害頻繁和嚴重的國家。在過去的幾十年里,中國汛情的影響范圍和程度都在不斷擴大。據統計,每年的夏季和秋季期間,中國的洪澇災害造成的直接經濟損失和間接損失都非常巨大,給人民的生命和財產帶來了極大的威脅和危害。河南鄭州“7·20”特大暴雨造成遇難失蹤380人,直接經濟損失409億元[1]。據2023年1月12日應急管理部發布的2022年全國十大自然災害事件,暴雨洪澇災害占一半,主要發生在6—8月,涉及珠江流域及福建、江西、湖南、四川、遼寧、青海等地區。其中珠江流域形成較大洪水,導致廣東、廣西兩省(自治區)因災失蹤死亡37人,直接經濟損失278.2億。
面對不確定性和突發性的洪澇災害,亟須提高搶險隊伍防汛應急搶險技能和處置能力,便于高效開展防汛應急搶險工作。目前,防汛應急搶險主要存在應急預案體系不夠完善[2]、搶險隊伍人員及專業能力不足、搶險物資存儲不足、搶險設備落后、信息化能力弱等問題,積極探索提升防汛應急搶險能力的舉措勢在必行[3]。
近年來,人工智能[4]、大數據[5]、知識圖譜等新型技術在監測預警、類案推送[6]等方面的高效率和高準確度發展,給防汛應急搶險舉措提供了一種新的思路。朝陽市通過“互聯網+”、大數據技術構建了智能防汛指揮系統,實現了積水、除澇泵閘、實時水位、實時雨量等綜合汛情數據的實時監測,為汛情研判提供了支持[7]。瞿智豪等[8]基于知識圖譜技術利用深度學習模型和傳感器信息判斷故障的發生,提出一種多模態信息融合的設備故障處理方案推薦方法,實現了工業設備故障處置的智能推薦。本文詳細介紹了利用知識圖譜技術構建防汛應急搶險方案智能推送系統的思路和技術方案。
建立汛期險情與險情處置方案之間的關聯,當汛期出現險情預警時,主動向防汛管理人員推送預警信息及歷史同類險情的處置方案,為防汛管理人員處置險情提供強有力的數據支撐,以縮短險情處置時間,大大降低災害人員傷亡和經濟損失。同時可將新的險情處置方案進行結構化處理,存儲于歷史搶險方案庫,指導后續險情的快速處置。技術路線見圖1。
圖1 技術路線
構建險情處置知識圖譜,梳理險情、材料、部門之間關系,明確事項申請材料,挖掘關聯事項、關聯材料,簡化辦件和智能審批。險情知識圖譜的構建及應用架構見圖2。在平臺支撐層面,利用通用知識圖譜平臺構建、存儲、管理知識圖譜;大數據和云計算平臺為知識獲取和智能應用提供算力支撐。在數據層面,主要利用水雨情、工情等結構化數據以及視頻等非結構化數據來支撐知識圖譜的構建。構建圖譜層面使用通用建設方案,基于業務需求進行知識建模、知識獲取、知識融合和知識計算。在業務能力上,整理險情處置知識圖譜通用的算法能力,為業務能力提供基礎算法支撐;結合業務需求和應用場景梳理險情處置領域的業務能力,為智能化應用提供算法接口。
圖2 險情處置知識圖譜架構
對歷史上發生的險情以及處理方案進行收集、整理、入庫,建立歷史險情處置方案數據庫,包括處置方案的查詢、上傳、下載、刪除、智能推送等功能。
2.2.1 數據檢索
支持對歷史全部險情處置方案進行全面檢索和調看。系統提供險情處置方案模糊查詢功能,查詢條件分為險情類型、工程類型、方案來源、方案編號、方案名稱、險情處置專家等條件。
2.2.2 關聯分析
通過知識圖譜技術,把險情處置方案與當前洪水形勢、工程基礎信息建立關聯關系,作為險情處置的基礎方案庫。
從歷史險情處置方案數據庫中進行相關知識抽取,包含各類實體、屬性及其之間的關聯關系,進而對抽取的知識進行自動分類、關聯性分析等信息融合,最后借助專家知識和現有知識庫進行知識建模,儲存形成險情處置知識圖譜。
險情處置知識圖譜構建流程包括知識建模、數據獲取、知識抽取/消歧、知識計算/更新/融合等步驟[9],構建流程見圖3。
圖3 險情處置方案知識圖譜構建流程
在概念層設計中,首先識別出險情發生的行為主體(水閘、泵站、水庫、堤防等)涉及的險情類型、產生原因、搶護原則、搶護方法、注意事項等限定條件,并進一步抽象為概念及其屬性。隨后,判別出險情處置的依據模式以及需要的其他數據,據此設計形成險情處置知識圖譜本體。
由于限定條件中涉及多種上下位關系,因此,在數據獲取層中需要首先獲取結構化條件關系數據,以及半結構化報表、檔案數據,非結構化文本、圖片數據等;其次,使用D2R、啟發規則、信息抽取等方法實現實體、關系以及屬性的抽取,并進行實體消歧以及共指消解等對齊處理;最后,對抽取的三元組進行數據質量評估,融合限定條件(險情類型、產生原因、搶護方法等)擴展知識圖譜中的知識,完成關系推理以及知識更新、補全等計算,最終形成險情處置知識圖譜,并不斷反饋質量評估結果,持續對知識三元組進行更新,從而形成閉環。在此過程中,險情處置本體對知識抽取、消歧、更新、融合等步驟起著指導作用。
2.3.1 險情處置知識建模
知識圖譜一般包括自上而下和自下而上兩種構建方法,前者是在定義好知識圖譜的語義和邏輯結構的基礎上豐富數據,后者是先通過對數據的實體和關系抽取進而歸納語義,再確定知識圖譜的結構。由于本次研究的是專業性強的垂直領域知識圖譜,所以采用自上而下的方法進行知識圖譜構建[10]。
險情處置知識圖譜本體分為險情、案例、搶護方法三個核心概念。圍繞險情又可細分為險情類型、產生原因、搶護原則、注意事項、搶護方法,見表1~表5。案例可細分為案例時間、案例概況、案例圖片、險情描述、處置措施、處置效果,見表6~表12。
表1 險情類型
表2 產生原因
表3 搶護原則
表4 注意事項
表5 搶護方法
表6 案例
表7 案例圖片
表8 險情描述
表9 案例概況
表10 案例時間
表11 處置措施
表12 處置效果
2.3.1.1 概念導入
本體構建完成后,需要將相關概念、關系、屬性導入通用知識圖譜平臺,提供三種方式實現概念導入。
a.手動添加。在“知識建?!拍顦嫿ā辈藛螜谥?選擇指定的父類概念,可手動添加或刪除其子概念,包括編輯子概念的名稱、標示、描述,及其屬性、涉及的概念關系等。
b.Excel導入。在“知識建?!拍顦嫿ā拍顚搿辈藛螜谥?選擇導入Excel文件也可實現本體的構建。Excel文件模板包括分組、英文名稱、上位概念、中文名稱、中文描述、值域類型等字段。
c.OWL導入。在“知識建?!拍顦嫿ā拍顚搿辈藛螜谥?選擇導入Protégé生成的OWL文件也可實現本體的構建。
2.3.1.2 概念可視化
完成本體構建之后,可在“知識建?!拍羁梢暬敝袑﹄U情處置知識圖譜本體進行可視化瀏覽,見圖4??蛇x擇樹狀或者網狀結構表示,并提供顯示/隱藏功能。
圖4 險情處置知識圖譜概念可視化
2.3.1.3 概念導出
險情處置知識圖譜本體構建完畢后,可將相關概念、實體、關系、屬性等導出保存為Excel文件或OWL文件,其中OWL文件可進行可視化展示。
2.3.2 險情處置知識抽取
本體建模只提供機器認知的基本骨架,還要通過知識獲取環節來充實知識實例。本次研究基于水利行業領域的業務數據庫、專家的經驗總結文檔和歷史險情案例的數據進行手工三元組標注,以實現險情處置知識的抽取。依據險情處置知識圖譜本體設計,逐條抽取險情類型、產生原因以及相應的搶護方法。險情處置對應關系見表13。
表13 險情處置對應關系
2.3.3 險情處置知識存儲
2.3.3.1 知識導入
知識抽取完成后,需要基于通用知識圖譜平臺完成關系三元組的導入,同樣提供以下三種知識導入方式。
a.手動添加。在錄入三元組之前,需要預先在概念層中構建好概念之間的關系,并且關系具有方向性,在屬于被指向概念的實體集合中,無法獲取到該條關系。因此,若關系三元組中存在本體未定義的關系時,需要返回概念導入模塊手動添加該關系。
選擇“知識存儲→實體管理→添加實體”,輸入實體名稱以及消歧標識,可完成實體錄入。確保實體與關系均合法后,點擊實體編輯按鈕,對該實體所屬的概念、實體屬性、實體關系進行手工編輯,即可完成三元組的手動錄入。若三元組中的實體已存在,則僅在該實體的關系屬性中新增一條關系指向即可。
b.Excel導入。通用知識圖譜平臺支持三元組的Excel導入,并且可實現實體或關系的單獨導入。選擇“知識存儲→實體管理→實體導入”,選擇實體對應的概念,下載實體導入模板并填寫。該模板可根據概念屬性自動設置表頭字段,實現實體及其屬性的導入。
關系導入流程類似于實體導入,選擇“知識存儲→實體管理→關系導入”,下載關系導入模板,填寫關系三元組涉及的起點與終點實體概念標識以及關系名,即可實現關系的導入。若該關系表存在知識圖譜實體集合中不存在的實體時,可選擇忽略該條關系或在圖譜中新建實體,但新建實體時,無法新建該實體的屬性。
c.工作流導入。通用知識圖譜平臺提供以任務流的形式將知識圖譜的構建過程進行可視化展示功能,即將圖譜構建的每一步操作如數據導入、數據清洗、模型訓練、信息抽取等配置成任務流的工作節點。通用知識圖譜平臺內置數據導入、數據清洗、實體抽取、非結構化文本轉換等通用節點,同時支持用戶自定義節點能力。因此可通過構建工作流的方式實現關系三元組的導入。
在基于工作流導入三元組之前,需要構建搭配工作流輸入輸出的數據空間。選擇“數據空間→文件管理”,即可進入自建數據管理頁面。
數據空間提供MySQL、Oracle、Mongo DB等數據庫數據的接入能力,并且提供外接爬蟲平臺和標注平臺的能力,同時還支持對自建數據(Excel)的智能導入或在線構建,提供對已接入數據的增、刪、查、改等基礎數據管理能力。將關系三元組數據保存為JSON格式,選擇“新增文件夾→上傳數據”,將JSON文件上傳至數據空間,即可完成自建數據集的上傳。
將關系三元組導入知識圖譜,選擇通用節點中的“數據輸出→保存數據”。右鍵選擇節點屬性保存為“SPO三元組”,點擊運行工作流,即可完成三元組導入。
2.3.3.2 知識管理
知識導入完畢后,可在通用知識圖譜平臺對實體、關系進行管理。選擇“知識存儲→實體管理”,可查看所有概念類別下的實體集合,選擇“知識存儲→可視化管理”,可基于可視化交互操作的形式,對實體及關系進行增、刪、查、改??梢暬缑孢€可以設定關系層數,設定篩選關系方向等操作。
險情知識圖譜中記錄了大量的險情及對應的搶護方法,利用知識圖譜可以輔助防汛工作人員快速完成險情的判定、消除和搶護,便于高效開展防汛應急搶險工作。
圖5所示為險情處置方案的智能推送流程,首先通過基層防汛人員上報的險情描述判斷出險情類型,確定險情類型后,進行實體識別和對齊,為防汛人員自動推薦歷史類似案例的處置措施和效果。同時支持歷史方案的下載展示,供現場防汛專家進行會商決策。在完成本次險情處置后,防汛工作人員將該次險情案例的整個過程記錄下來(包含案例時間、案例概況、險情描述、處置措施、處置效果等信息),經過知識抽取和存儲后,更新到知識圖譜中,便于后期更好地進行防汛應急搶險方案推薦工作。
圖5 險情處置方案的智能推送流程
本次研究的險情處置方案知識圖譜已在安徽省水旱災害搶險專家系統[11]中成功應用。系統可結合基層上報的險情主動推送歷史同類險情的處置方案,供專家進行會商研判和指導險情處置。當新的險情處置成功后,可對險情進行結構化處理,作為新的經驗進行積累用于指導處置未來發生的險情。系統的建設顯著提高了安徽省水旱災害防御和險情處置的水平,使科學決策和精準處置成為現實。
本研究利用知識圖譜技術輔助防汛工作人員在汛期快速制定防汛應急搶險方案,提升防汛應急搶險能力。險情處置知識圖譜通過對各類險情信息進行分析和整合,包括管涌、散浸、滑坡、堤潰等,幫助政府和防汛應急管理部門實現對險情的精準管控。同時,險情處置知識圖譜可以對歷史險情數據、處置方法及效果等進行分析和統計,提取有用信息并進行可視化展示及類案推送,幫助應急指揮部門快速作出決策。但險情處置知識圖譜的構建和應用是一項需要不斷更新完善的工作,數據源需要不斷擴充、實體抽取準確率需要不斷提高、險情處置知識圖譜需要在實踐中不斷挖掘更多的應用場景和實現相關知識系統的落地。