?

基于知識圖譜的公路工程領域GIS 應用研究現狀

2021-03-05 10:09田學澤
上海工程技術大學學報 2021年4期
關鍵詞:圖譜尺度矩陣

田學澤

(長沙理工大學 交通運輸工程學院,長沙 410114)

公路工程是一項復雜的系統工程,其前期規劃至全生命周期中擁有大量的地形數據,并需要經常地進行參數設計與計算.傳統方法采用計算器進行,不僅繁瑣而且工作量大,同時也無法克服地形圖表示方法的抽象性、概括性及人員視角局限性等難點.地理信息系統(Geographic Information System,GIS)作為一種將采集、存儲、管理、分析、顯示及應用地理信息等功能集成于一體的計算機系統,憑借其在分析與處理海量地理信息數據上的極大優勢,在公路工程領域獲得廣泛應用[1].

目前,國內外專家及學者在將GIS 應用于公路工程領域方面已進行了大量研究.Tan 等[2]將遙感與GIS 用于線狀滑坡地質災害風險評估,獲得了更準確的評價結果;Al-Aamri 等[3]將GIS 用于繪制道路交通事故熱點地區的地圖;Bazlamit 等[4]采用GIS 進行路面養護管理系統的開發;張弛等[5]將GIS 技術與智能進化算法相結合用于多年凍土區公路路線的智能選擇,為多年凍土區公路路線的選擇提供了新方法;程方圓等[6]采用GIS 與建筑信息模型(Building Information Modeling,BIM)技術相結合的數據集成方法進行公路隧道的數字化管理研究;林報嘉等[7]將XGBoost 機器學習模型與GIS 相結合進行公路崩塌災害易發性研究.由此可見,關于GIS 在公路工程領域應用的研究主題呈現出多元化,并存在不斷演化出新研究分支的態勢.因此,有必要對該領域的階段性成果進行系統梳理,以促進該領域學術的進一步探析.但目前僅有少量學者,如虞顏等[8]對GIS 在公路工程中的應用進行歸納性評述,而尚無以定量與定性相結合方法對公路工程領域GIS 應用進行可視化分析的研究.

鑒于此,本研究對近10 年來CNKI 數據庫中公路工程領域GIS 研究的相關文獻進行計量統計、聚類樹狀圖分析、因子分析與多維尺度分析,并結合社會網絡中的可視化知識圖譜與網絡中心性分析,直觀且系統地呈現出公路工程領域GIS研究的現狀結構及熱點,以期為公路工程領域GIS 的應用研究提供理論指導,及時發現被忽略且可能成為主流熱點的研究主題.

1 研究設計

1.1 數據來源與處理

為保證搜集到的數據具有全面性與可靠性,研究選取文獻收錄與檢索量最大、數據最權威的中國知網(CNKI)數據庫為數據來源庫.首先,利用高級檢索將檢索條件設置為:主題=“公路工程并含GIS”,時間跨度為2010—2020 年(數據采集時間為2021 年1 月3 日),文獻來源類別=全部期刊,共檢索出795 篇相關文獻.經剔除征稿通知、論文摘編、人物專訪、專題導讀及文獻評述等關聯性不大的文獻后,共獲得553 篇有效文獻.然后,對有效文獻數據進行清洗:1)采用data 數據園軟件剔除無效關鍵詞,如“應用”“影響因素”“應用研究”及“新技術”等無實際研究意義的關鍵詞;2)利用GIGO 軟件合并含義相同、相近或相似,但表達方式不同的關鍵詞,如將“GIS”“地理信息系統”“GIS 系統”與“交通地理信息系統”合并為“GIS”.

1.2 研究方法及工具

科學知識圖譜是一種以知識域(knowledge domain)為對象,采用文獻計量軟件,對文獻中的關鍵詞、機構及作者等信息進行挖掘,進而呈現出科學知識結構關系與演化歷程的圖像.其既能將知識以圖片的形式進行可視化,又可以揭示知識單元或知識群之間復雜的交叉、互動、演化及結構關系[9].目前,該方法已在各學科研究熱點與研究內容演化路徑的量化分析中得到廣泛應用[10?13].

本研究采用COOC 1.8 軟件、SPSS 26.0 軟件與UCINET 相結合來分析經處理后的文獻數據,繪制科學知識圖譜及實現可視化分析.其中,COOC 可以快速實現文獻中關鍵詞的提取并將其轉換為共現矩陣與相異矩陣;SPSS 主要用于依據共現矩陣與相關矩陣進行聚類分析、因子分析及多維尺度分析,將高頻關鍵詞進行研究主題的劃分;而UCINET 是一款由社會網絡研究者開發,經加州大學林頓·弗里曼等網絡研究者編寫的功能強大的社會網絡分析工具[14],主要用于關鍵詞共現網絡圖譜的繪制與進行關鍵詞中心性分析.

2 研究熱點的共現分析

2.1 矩陣構造

研究熱點是針對某一領域研究人員在一定時期內廣泛關注的主題,而最能反映研究熱點的是文獻中的關鍵詞[15?17].本研究采用COOC 軟件對上述553 篇有效文獻的關鍵詞進行提取,提取關鍵詞的詞頻皆為5 次及以上,共獲得34 個高頻關鍵詞,分別為GIS(361)、公路工程(80)、高速公路(66)、邊坡地質災害易發性評價(27)、路線設計(27)、路面管理系統(25)、BIM 技術(23)、數據庫(19).以上關鍵詞基本表征了公路工程領域近10 年來GIS 應用研究的熱點話題,但僅對高頻關鍵詞的數量統計難以揭示它們之間的核心關系,還需進行高頻關鍵詞共現、相關矩陣分析與多元統計分析,以將熱點研究進行聚類和主題劃分.

2.1.1 共現矩陣

運用COOC 軟件中關鍵詞轉共現矩陣功能得到一個34 × 34 的高頻關鍵詞共現矩陣,見表1.矩陣中關鍵詞兩兩相交的數值表示兩者共同在文獻中出現的頻次,代表兩者的疏密程度.矩陣對角線上的數值表示各關鍵詞在文獻中出現的總頻次.由于共現頻次易受各關鍵詞頻次的影響,進而影響后續的多元統計分析與社會網絡分析.因此,須對高頻關鍵詞共現矩陣進行包容化處理,將其轉換為高頻關鍵詞相關矩陣,以更好地反映關鍵詞之間的親疏程度[18].

表1 公路工程領域GIS 研究高頻關鍵詞共現矩陣(部分)Table 1 Co-occurrence matrix of high-frequency keywords for GIS research in highway engineering field (part)

2.1.2 相關矩陣

運用Ochiai 系數進行共現矩陣包容化處理,公式為

式中:Ci j為 關鍵詞i和j的共現次數;Ci和Cj分別為關鍵詞i和j的總頻次,即對角線上的數值.處理后相關矩陣見表2.矩陣中數值表示關鍵詞的相關度:數值越接近1,表明相關度越高;越接近0,表明相關度越低;數值為0 時,表明兩關鍵詞不相關.

2.2 多元統計分析

2.2.1 聚類分析

聚類分析的目的是使同類事物的同質性更高,異類事物的差異性更大.通過對關鍵詞進行聚類分析,可以將距離較近的關鍵詞聚集成同一類團,進而清晰地展示相關領域的研究熱點.將表2導入SPSS 26.0 軟件,通過系統聚類中的分層聚類可繪制出高頻關鍵詞的聚類分析圖譜,如圖1 所示.由圖1 可知,公路工程領域GIS 應用研究的熱點可分為3 個類別:第1 類由14、27、30、16、13、34、7、22、26 和23 組成;第2 類由24、25、15、32、11、17、21 和33 組成;第3 類由5、9、12、4、19、18、1、3、6、8、28、10、31、2、20 和29 組成.其中,第1 類和第3 類下分化出幾個小聚類,形成幾個具有較大交融性的研究分支;第2 類包含的關鍵詞較少,主要有空間分析、最佳路徑、公路交通網絡與交通網通達性評價等高頻關鍵詞,與公路工程領域GIS 應用的實際情況相符.

圖1 公路工程領域GIS 研究高頻關鍵詞樹狀聚類圖Fig.1 High-frequency keyword tree clustering diagram of GIS research in highway engineering field

表2 公路工程領域GIS 研究高頻關鍵詞相關矩陣(部分)Table 2 Correlation matrix of high-frequency keyword for GIS research in highway engineering field (part)

雖然聚類分析可將公路工程領域GIS 應用研究的熱點詞快速分類,但無法體現聚類后各類別的重要程度.因此,仍需進行因子分析與多維尺度分析,以顯示出各類別的重要程度及相對位置.

2.2.2 因子分析

因子分析可利用提取的主要因子,并依據因子成分得分值對相關性較高的原始指標進行歸類,為下一步多維尺度分析提供參考[19].首先,將表2 中高頻關鍵詞相關矩陣導入SPSS 26.0 軟件進行信度檢驗,Cronbach′s Alpha 值為0.758 >0.7,表明數據信度檢驗合格,可用于因子分析.其次,采用主成分分析法進行因子分析,共提取15 個特征值大于1 的公因子,見表3.15 個公因子類別分別為:(1)移動GIS、道路養護、系統開發;(2)邊坡地質災害易發性評價、危險性評價、滑坡監測;(3)交通可達性、公路交通網絡;(4)數據庫、路面管理系統、GIS;(5)路面養護管理、可視化、BIM 技術;(6)高速公路監控系統、高速公路;(7)道路選線、線路設計;(8)空間分析、最佳路徑;(9)信息管理系統、機電系統;(10)RS 技術、交通網通達性評價、公路工程;(11)暴雨災害風險評估、ArcGIS;(12)3S 技術、公路信息化系統;(13)三維GIS;(14)GPS、WebGIS;(15)空間分布特征.采用因子分析形成的類別較多,且各類別間的相關關系不明確.因此,本研究采用多維尺度分析法繪制多維尺度圖譜對其進行更深地剖析.

表3 總方差解釋Table 3 Explanation of total variance

2.2.3 多維尺度分析

多維尺度分析(Multidimensional Scaling)是一種可將高維度空間的研究對象轉換至低維空間中進行定位、分析與歸納,且保持原有研究對象數據關系不變的數據分析方法[20].在多維尺度分析圖譜中,關鍵詞的頻次越高,離圖譜的中心位置越近;反之,則越偏離圖譜中心.考慮到相關矩陣中數值0 較多會影響多維尺度分析結果的準確性,采用相異矩陣進行分析所得到的圖譜更符合實際.因此,在進行多維尺度分析前,需先將相關矩陣轉換為相異矩陣.相異矩陣可用1 ?Ochiai 系數獲得,見表4.將高頻關鍵詞相異矩陣導入SPSS 26.0軟件中,在度量功能選項卡中選擇多維尺度分析,繪制高頻關鍵詞二維尺度圖譜如圖2 所示.該圖譜在進行多維尺度分析過程中,Stress=0.125,RSQ=0.932,表明數據擬合情況可靠.

圖2 二維尺度圖譜Fig.2 Two-dimensional scale map

表4 公路工程領域GIS 研究高頻關鍵詞相異矩陣(部分)Table 4 Dissimilarity matrix of high-frequency keyword for GIS research in highway engineering field (part)

由圖可知,高頻關鍵詞依據間距可劃分為3 大主題區域.主題區域1 主要包括道路選線、路線設計、最佳路徑選擇、空間特征分布、空間分析等高頻關鍵詞,主要探討GIS 的系統設計及多樣化研發,利用移動GIS、三維GIS 與WebGIS 等軟件對地理信息進行處理,以實現道路路線設計與最佳路徑選擇、空間特征分析,可將主題區域1 描述為GIS 的多樣化研發與應用;主題區域2 主要包括公路交通網絡、交通網通達性評價、滑坡監測、危險性評價與邊坡地質災害易發性評價等高頻關鍵詞,主要探討公路交通網和地質災害方面的研究,可將主題區域2 描述為公路交通網與地質災害評價;主題區域3 主要包括公路信息化系統、路面養護管理系統、高速公路監控系統、信息管理系統與數據庫等高頻關鍵詞,主要探討實現公路管理信息化以及與BIM 技術、3S 技術等相結合實現公路管理可視化方面的研究,可將主題區域3 描述為公路管理信息化與可視化.

3 研究熱點的社會網絡分析

通過對最近10 年CNKI 數據庫收錄的有關公路工程領域GIS 應用研究的文獻進行聚類分析、因子分析與多維尺度分析,掌握了我國公路工程領域GIS 應用研究的總體現狀.為進一步對我國公路工程領域GIS 應用研究的現狀及發展趨勢進行深度了解,本研究采用社會網絡分析的可視化與3 種網絡中心度對關鍵詞間的聯結關系與關鍵詞在網絡中的位置進行分析.

3.1 關鍵詞共現網絡圖譜

為直觀顯示高頻關鍵詞的聯結關系,將高頻關鍵詞共現矩陣(見表1)導入UCINET 軟件,利用Netdraw 組件繪制高頻關鍵詞的共現網絡知識圖譜,如圖3 所示.在共現網絡圖譜中,節點表示關鍵詞,節點大小表示該關鍵詞出現的總頻次,節點間連線的粗細表示關鍵詞間共現的頻次[21].由圖3可知,公路工程領域GIS 應用研究共詞網絡圖譜連線較多,不存在孤立節點,且高頻關鍵詞間的聯結較為緊密,高頻關鍵詞間的交融與共存性較大.對共現網絡圖譜進行密度分析后發現,該網絡的密度值為0.221,網絡密度值d=2l/[n(n?1)].式中:n為網絡圖譜中節點的數目;l為網絡圖譜中各節點之間連線的數目,除了可表示網絡圖譜中各個節點間的親疏關系之外,還可表明網絡圖譜的松緊及研究方向的集中與發散.本研究中網絡圖譜密度值d為0.221,表明該網絡較松散且研究方向趨于多樣化.

3.2 關鍵詞中心度分析

中心度是量化分析社會網絡中節點權利與地位的方法.若某個節點的中心度越高,則其在網絡中所處的位置越重要,與其他節點的聯系也越緊密,一般采用點度中心度、中間中心度與接近中心度等3 種中心度值進行綜合考量[22].對高頻關鍵詞共現網絡知識圖譜進行3 種中心度的度量,見表5.由表可知,在3 種中心度度量值中排名靠前的高頻關鍵詞基本一致且重復率較高,表明這些高頻關鍵詞處于社會網絡中的核心關鍵位置,是當前公路工程領域GIS 應用研究的熱點.

對圖3 和表5 分析可得:GIS、高速公路、公路工程、道路選線、可視化、滑坡監測、邊坡地質災害易發性等關鍵詞處于網絡圖譜的中心位置,且3 種中心度值均靠前,表明這些關鍵詞與其他關鍵詞間的聯系較為緊密,代表該領域的學術熱點;而BIM 技術、公路信息化系統、系統開發、高速公路監控系統、公路交通網絡、交通可達性與空間分析等關鍵詞處于共現網絡圖譜外圍邊緣位置,且3 種中心度值靠后,雖然這些高頻關鍵詞與其他關鍵詞關聯度不強,但在推動公路工程領域實現信息化與數據化管理方面起著重要作用.

圖3 高頻關鍵詞共現網絡知識圖譜Fig.3 High-frequency keyword co-occurrence network knowledge graph

表5 高頻關鍵詞共現圖譜中心度(部分)Table 5 Co-occurrence map centrality of high-frequency keywords(part)

4 結語

1)本研究對公路工程領域GIS 應用研究的高頻關鍵詞進行詞頻統計,提出無實際研究內容的名詞,得出邊坡地質災害易發性評價、路線設計、路面管理系統、數據庫及滑坡監測等為該領域研究的熱點.采用聚類分析、因子分析與多維尺度分析將高頻關鍵詞進行研究主題歸類,形成GIS 多樣化研發及應用、公路交通網與地質災害評價、公路管理信息化與可視化等3 大主題類別.

2)運用社會網絡分析繪制高頻關鍵詞共現網絡圖譜并進行中心度分析,結果顯示:網絡圖譜密度值為0.221,該網絡較為松散且研究方向較為發散;代表主流研究熱點的關鍵詞間聯系較為緊密,皆位于網絡圖譜中心位置且中心度值均靠前.

3)通過對關鍵詞共現圖譜及中心度的分析發現:BIM 技術、公路信息化系統、系統開發與高速公路監控系統等關鍵詞位于圖譜邊緣且中心度靠后,但這些關鍵詞所代表的研究方向在促進公路工程領域實現信息化與數據化方面起著重要作用,可作為新的研究熱點.

4)本研究采用知識圖譜的方法對國內公路工程領域GIS 應用研究的熱點進行量化分析,由于提取的關鍵詞來源于CNKI 數據庫近10 年的相關文獻,且采用高頻關鍵詞進行分析,可能會對研究結果的準確性產生干擾,后續將探析更科學的研究方法.

猜你喜歡
圖譜尺度矩陣
基于圖對比注意力網絡的知識圖譜補全
論社會進步的評價尺度
圖表
多項式理論在矩陣求逆中的應用
宇宙的尺度
主動對接你思維的知識圖譜
矩陣
矩陣
矩陣
9
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合