?

“交通智搜”為交通運輸部數字政府建設賦能

2023-11-29 11:26交通運輸部科學研究院張蕊
數字技術與應用 2023年11期

交通運輸部科學研究院 張蕊

智能搜索系統是政府網站賦能數字政府的重要手段,交通運輸部政府網站充分利用智能搜索技術,建立了“交通智搜”系統,提供了范圍更廣泛、功能更實用、結果更準確的搜索服務。

2022 年,《國務院關于加強數字政府建設的指導意見》(國發〔2022〕14 號)正式印發,《意見》指出:到2035 年,與國家治理體系和治理能力現代化相適應的數字政府體系框架更加成熟完備,整體協同、敏捷高效、智能精準、開放透明、公平普惠的數字政府基本建成,為基本實現社會主義現代化提供有力支撐[1]。

數字政府建設需要通過對政府數據進行挖掘、分析、融合、共享、開發、利用,以消除數字鴻溝,實現各業務領域的互聯互通、協同聯動,促進政府治理革新,推進服務流程優化,而數字政府的對外展示、對外服務需要依托政府網站。

黨的十八大以來,在政府網站與政務新媒體檢查、政府網站績效評估等一系列“以評促建”活動的推動下,政府網站建設工作取得了積極進展,網站建設規范、內容豐富詳實、功能便捷完善、互動暢通及時,為數字政府提供了良好的展現平臺。智能搜索系統的建設,不僅可以精準定位信息和服務,實現“搜索即服務”,同時也賦能數字政府的“敏捷高效、智能精準”服務。

近些年,依據《國務院辦公廳關于印發“互聯網+政務服務”技術體系建設指南的通知》(國辦函[2016]108號)和《國務院辦公廳關于印發政府網站發展指引的通知》(國辦發[2017]47 號)提出的優化政府網站搜索功能,開發模糊搜索、目錄搜索[2]、拼音轉化搜索、通俗語言搜索、服務事項和辦事指南搜索、關鍵詞推薦、辦事進度和信件回復情況查詢、錯別字自動糾正、搜索結果排序、多維度分類展現、聚合相關信息和服務等功能,實現“搜索即服務”[3]的要求,交通運輸部積極推進智能化搜索系統建設,開展集約化搜索應用,本著統一性、實用性、安全性、先進性、規范性、開放性的原則,不斷升級“交通智搜”系統,擴大搜索范圍,提升搜索結果準確性,豐富搜索結果展現形式,使用戶可以方便快捷地在交通運輸部政府網站查找所需信息和服務內容,政府的對外服務形象得到了顯著提高。

1 集約化智能搜索平臺

“交通智搜”系統通過構建集約化搜索引擎應用平臺(如圖1 所示)提供交通運輸行業政府網站跨站點信息搜索服務,搜索引擎與內容管理系統之間通過數據接口進行信息數據傳遞、維護、更新,網站信息經分析、處理后索引進入集約化搜索引擎平臺,保障網站信息與搜索信息的及時同步與一致性。

圖1 交通運輸部集約化智能搜索平臺Fig.1 Intensive intelligent search platform of ministry of transport

目前,“交通智搜”的搜索范圍涵蓋了交通運輸部政府網站群(含門戶網站、子站)的全部信息、辦事服務和互動服務內容、微信公眾號以及交通運輸部海事局、長江航務管理局、珠江航務管理局、直屬海事機構和地方交通運輸主管部門的政府信息公開內容,實現了全行業政策信息的一站式搜索。

2 技術架構

“交通智搜”系統總體技術架構結構分為:基礎設施層、信息資源層、接口層、搜索應用支撐層和搜索功能層,各層通過相應的技術接口進行參數與數據、命令的傳遞。

信息資源層與搜索應用支撐層之間通過XML/Web Service 技術進行網站信息(包括:ID、更新標志、時間、內容等)的數據傳遞、維護與更新,并完成索引工作,保障搜索信息與發布信息的及時同步與一致性,更新頻率可以根據業務需要自定義(分鐘、小時)等。

搜索應用支撐層與搜索功能層之間通過HTTP/XML技術進行請求提交與數據交換,通過JSON/XML 獲得返回的結果數據并包裝成業務結果返回給用戶。即互聯網用戶通過門戶網站搜索框提交搜索請求后,搜索條件傳遞到集約化智能搜索應用中,搜索應用將轉化后的請求傳遞到分布式搜索引擎中,通過索引庫的搜索返回相關的結果列表。

3 系統性能保障

3.1 分布式控制系統保障系統穩定性

“交通智搜”系統采用分布式控制系統應對交通運輸部政府網站群大數據量、高并發、高性能、高可用性的應用需求,保證系統的容災備份、故障切換和負載均衡。其主要組成模塊包括以下幾個部分:

(1)分布式請求服務器:使用加權算法將請求轉發至不同的智能搜索引擎系統上,實現容災備份和負載均衡。

(2)分布式索引服務器:將文檔分別索引至不同的智能搜索引擎系統中,實現故障切換和負載均衡。

(3)分布式管理服務器:為智能搜索引擎系統各模塊提供關鍵的維護、管理、控制和監測功能,采用統一的方式從中央位置與所有智能搜索引擎系統服務進行通訊。

3.2 合理的索引庫提升響應速度

為提高搜索引擎的響應速度,“交通智搜”系統根據信息源的范圍,為網站群設計多個索引庫(即每個站點一個索引庫)來分散搜索引擎的搜索壓力。

針對具體的搜索應用,“交通智搜”系統根據搜索數據的特點,采用合理冗余的索引字段設計方式,提高搜索引擎響應時間。例如,日期字段2008-01-09,在索引庫中存儲時,設計為:

年:2008

月:2008-01

日:2008-01-09

雖然這種設計會導致索引空間膨脹,但可以提高搜索速度,符合索引系統空間換時間的理念。

3.3 緩存技術緩解系統壓力

通常情況下,在某一時間段內,80%的用戶搜索請求會集中于某些特定內容,在搜索引擎收到相同或相似的搜索請求時,“交通智搜”系統合理采用搜索緩存技術緩存上個用戶的搜索結果,以減少服務器負載及快速返回搜索結果。

依據上述合理的技術應用與數據庫設計,交通運輸部政府網站在日均頁面搜索量約1.5 萬的情況下,搜索結果仍可以快速反饋,服務穩定可靠。

4 豐富的搜索功能

“交通智搜”系統不僅搜索范圍廣泛、響應速度快速,其搜索方式和搜索結果展示也滿足了用戶多樣化的需求。

4.1 搜索方式多樣

系統提供了普通搜索、高級搜索、二次搜索(如圖2所示)等搜索方式。

圖2 普通搜索和二次搜索Fig.2 General search and secondary search

(1)普通搜索,用戶僅需輸入搜索詞,點擊搜索按鈕,即可得到相關的搜索結果;

(2)高級搜索,可以對關鍵詞、文檔格式、時間范圍、排序方式、搜索位置等進行設置;

(3)二次搜索:在第一次搜索的搜索詞后空一格,并繼續輸入二次搜索的搜索詞,即可對包含某一搜索詞的信息數據進行二次搜索,二次搜索的次數不限,直至搜索到目標信息。

4.2 搜索詞類型豐富

系統建立了停用詞、全拼、大眾詞匯、同義詞、行業相關主題詞、部門領導人、內設機構名稱、直屬機構名稱、行業相關長尾關鍵詞、辦事事項、政策、問題等詞典,與網站內容管理系統對接,全面提升搜索詞的準確性以及網站自查和校對能力,針對不同的搜索需求,提供了拼音搜索、模糊搜索等,用戶輸入拼音、同/近義詞、大眾詞匯后,系統會對相關搜索詞進行提示、智能糾錯,還會推薦其他相關搜索。

(1)拼音搜索:系統基于漢字注音技術和多音排歧技術,在大量拼音語料基礎上,統計漢字串的分布規律、拼音串的分布規律等,形成了基于上下文的注音算法技術,保證了注音的準確性。當用戶只輸入拼音時,系統可推薦相關的搜索詞匯,完成搜索。例如,用戶輸入拼音“jiazhao”,系統會返回含有“駕照”和“機動車駕駛證”兩個相關搜索詞的搜索結果。

(2)大眾詞匯搜索:系統將白話文/大眾詞匯與專有詞匯、專業術語一一對應,建立了大眾詞匯庫,通過詞庫匹配將其轉換為網站中的專業術語或準確表述,并返回相關搜索結果。例如,用戶輸入“駕照”時,系統會提示“您是不是要搜索機動車駕駛證或僅搜駕照”,并返回與“駕照”和“機動車駕駛證”相關的信息。

(3)模糊搜索:系統建立了同義詞庫,用戶輸入的搜索詞有同義詞時,系統會自動按照同義詞進行模糊搜索,并返回相關搜索結果。例如,用戶輸入“交費”時,系統會反饋含有“繳費”和“交費”的相關信息,得到較全面的搜索結果。

(4)智能糾錯:對于經常性輸入錯誤的詞語,系統會提示按正確詞語作為搜索詞進行搜索,以減少重復輸入操作。例如,用戶輸入“簡歷工程師”就可以得到“監理工程師”相關的結果。

(5)搜索詞推薦:由于用戶使用的搜索詞不準確,往往不能得到想要的結果,系統會在用戶每次搜索時,依據相關度算法,自動分析出一系列相似或相關搜索詞,并在頁面下方按照搜索熱度進行推薦,點擊新搜索詞即可完成相關搜索。例如,用戶輸入“旅游”后,系統會在搜索結果列表下方自動推薦“旅游法、云南旅游、旅游公路標準”等相關搜索詞。

(6)熱搜詞推薦:系統可根據用戶搜索頻率統計熱門搜索詞的排名,并在搜索框下推薦熱搜詞,用戶可以直接點擊熱搜詞進行搜索。

4.3 結果展示形式靈活

(1)分類展示:用戶可選擇信息所在板塊(包括交通運輸部門戶、政策、新聞、服務、數據、互動、微信、圖片等)和信息來源(含子站、部管政府網站和地方交通運輸主管部門網站)對搜索結果進行分類展示。

(2)自定義排序:用戶可按照相關度、更新時間等自定義搜索結果的排序方式。

(3)縮小搜索結果的顯示范圍:用戶可通過設置搜索詞所在位置(如全文、標題)、信息的附件類型、更新時間等進一步縮小搜索結果范圍。

4.4 搜索結果推薦

系統可根據用戶的搜索詞,在搜索框的下拉框中或搜索結果列表的右側按照信息所在板塊智能分類提示相關搜索結果(如圖3、圖4 所示)。

圖3 下拉框搜索結果推薦Fig.3 Drop-down search results recommendation

圖4 搜索結果列表右側智能推薦Fig.4 Smart recommendations to the right of the search results list

5 強大的統計分析功能

強大的統計分析功能是智能搜索賦能數字政府建設的一個重要表現。系統可進行可靠即時地搜索統計,內容包括搜索用戶數、熱搜詞排名、流量趨勢、用戶來訪地區等,幫助網站管理者了解用戶搜索行為,為做好服務型政府網站提供決策性數據支撐。

5.1 搜索詞分析

5.1.1 常用搜索詞排名

系統可采集分析站群或某個特定站點的所有搜索詞,并通過柱圖等展現各搜索詞的搜索占比,政府部門可以及時掌握輿情動態、了解用戶需求。

5.1.2 站內搜索詞列表

系統可采集所有搜索詞,并通過列表方式分析展現搜索詞的名稱、搜索次數、命中次數、作為二次搜索的次數、結果頁瀏覽量、帶來再次搜索的次數和平均訪問深度等,以幫助系統管理者優化搜索詞庫、索引庫和相關算法等。

5.1.3 搜索詞多維度分析

系統可圍繞用戶輸入的搜索詞提供熱度分析、增長率分析、相關分析、終端分析等多維度統計,并支持按時段查看,使網站管理者深入了解用戶搜索需求,并進一步分析用戶的主要訴求,為網站的資源組織、信息發布和其他相關業務開展提供基礎決策支持,以優化線上辦事流程、引導社會輿論,從而有效提升政府治理能力。

5.2 搜索結果分析

系統可按照搜索詞和索引量進行統計,分析“0 結果”的搜索百分比、搜索結果“0 點擊”的百分比、搜索終端訪問量占比、搜索結果訪問趨勢等,為系統運維和運營提供客觀可靠的數據支持,并進一步開展熱詞、搜索排行榜及特定搜索詞的相關信息統計。

在未來的發展上,“交通智搜”還可以探索開展搜索結果的場景化服務,根據用戶歷史搜索情況和訪問轉化情況,為用戶整合與其搜索內容相關的服務、信息和互動內容,實現千人千面,針對不同用戶提供不同的搜索結果,以提高用戶的體驗感和獲得感,進一步提升用戶對數字政府治理能力的滿意度。

91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合