?

基于大數據技術的甘肅智慧旅游系統

2024-02-13 15:12郭亮楊裔秦炳峰曹建文李敏袁威李彩虹王軍濤
大數據 2024年1期
關鍵詞:甘肅景區智慧

郭亮,楊裔,秦炳峰,曹建文,李敏,袁威,李彩虹,5,王軍濤

1. 蘭州大學信息科學與工程學院,甘肅 蘭州 730000;2. 旅游信息融合處理與數據權屬保護文化和旅游部重點實驗室,甘肅 蘭州 730000;3. 甘肅省文化和旅游廳科技信息處,甘肅 蘭州 730000;4. 蘭州工業學院計算機與人工智能學院,甘肅 蘭州 730050;5. 甘肅省人工智能與算力技術重點實驗室,甘肅 蘭州 730000;6. 中電萬維信息技術有限責任公司,甘肅 蘭州 730000

0 引言

隨著大數據、物聯網和深度學習技術的發展,近年來智慧旅游平臺建設在全國范圍內掀起了高潮。人民生活水平不斷提高,人民群眾旅游出行模式不斷發生改變,傳統的服務、管理和運營模式已經明顯不能適應新的出行需求,因此智慧旅游平臺的建設成為推動我國文旅事業發展的戰略性舉措。為游客提供更優質的旅游體驗,進一步增強游客在旅游過程中的獲得感和滿意度,是實現全民旅游愉悅體驗的重要途徑,也是智慧旅游平臺建設的宗旨和目標。

2014年被原國家旅游局定為“智慧旅游年”。同年8月,國務院頒布《國務院關于促進旅游業改革發展的若干意見》。2015年1月,原國家旅游局印發《關于促進智慧旅游發展的指導意見》,推動了智慧旅游的建設。

隨著全國智慧旅游平臺建設的加速,各省市逐漸開啟了智慧旅游平臺的建設,并且隨著文化部和國家旅游局的合并,智慧旅游平臺建設也開始向文旅融合、縱向貫通、橫向融通的方向發展。2020年11月,文化和旅游部聯合十部委,發布了《關于深化“互聯網+旅游”推動旅游業高質量發展的意見》,提出當前重點任務是加快建設智慧旅游景區。2021年,甘肅省文化和旅游廳印發《甘肅省“十四五”智慧文旅發展規劃》,提出推動5G、大數據、云計算、人工智能、物聯網、區塊鏈等技術對全省文化旅游業全鏈條智能化提升,推動文化旅游創作、生產、消費、服務、管理全面智慧化,豐富數字文旅產品業態,拓展文旅消費空間,創新經營管理模式,著力構建數據支撐、科技引領、業態創新、跨界融合的智慧文旅生態。2023年4月,工業和信息化部、文化和旅游部聯合印發《關于加強5G+智慧旅游協同創新發展的通知》。在此背景下,智慧旅游越來越受到重視,智慧旅游平臺也由建設投入向運營造血方向開始轉變。

甘肅省文化旅游資源富集,文化旅游產業也是甘肅省十大生態產業之一。2018年,甘肅省人民政府辦公廳印發《關于加快全省智慧旅游建設的意見》,在全國率先提出了省級智慧旅游平臺建設的頂層設計和規劃,提出要著力打造“一平臺、一中心、三體系、三朵云”的重點工作。其中,“一平臺”為“一部手機游甘肅”綜合服務平臺,以“金牌導游、貼心管家、文化導師、全能導購”為目標,實現全省4A級和5A級旅游景區智能導游導覽、線路規劃、語音講解、VR全景、分時預約、門票預訂、數字閱讀、數字展覽,以及酒店預訂、導游預約、網絡約車、特產訂購、旅游投訴等功能?!耙恢行摹睘楦拭C文化旅游大數據中心,以“互聯互通、多元融合、精準分析、全面共享”為基本思路,縱向貫通了市縣旅游部門及景區、酒店、旅行社數據,完成旅游景區視頻監控信號接入。

1 相關工作

智慧旅游系統建設的關鍵在于數據的融合處理、預測分析、關聯處理、因果分析。目前,多源、異構旅游數據的動態抽取、清洗、關聯、存儲、融合處理過程仍面臨諸多挑戰。本文匯總了旅游行業在大數據方面的相關研究工作。

旅游業是一個由交通、住宿、餐飲、游覽、購物以及文娛六大環節構成的綜合性行業。每一個環節都會產生大量的數據,如在搜索引擎上搜索旅游景區、攻略以及特色小吃等產生的數據,游客在OTA(online travel agency)平臺上的消費數據、評論數據,游客分享在社交媒體平臺(微博、博客、推特等)上的圖片攜帶的地理位置信息和運行軌跡數據等。這些數據有游客主動分享的數據,也有服務商和運營商獲取的隱性數據。通過查閱文獻和資料,本文將旅游大數據的來源歸為以下7個方面(如圖1所示):①網絡搜索引擎產生的數據;②運營商的基站數據;③游客分享在社交媒體上的數據;④OTA平臺數據;⑤廣告營銷數據;⑥客流量數據;⑦經濟數據和氣象數據。

圖1 旅游大數據的來源和應用

Bi等人[1]基于LSTM方法使用搜索引擎數據,提出了適用于預測我國兩個著名旅游景點(九寨溝和黃山)的游客流量數據的模型。Li等人[2]提出了一種基于百度搜索引擎數據的客流量預測模型,并取得了較好的預測結果。鄧寧等人[3]通過對YouTube視頻數據進行分析,比較了目的地營銷組織和國外游客在北京目的地形象建構上的異同。Figueredo等人[4]使用Facebook、Instagram和谷歌Plus 3個社交媒體上的圖片來檢測游客的隱性偏好并推薦景點。Xiao等人[5]利用游客分享的旅游目的地照片,從構圖場景、視覺審美品質和視覺獨特性3個方面分析圖像,開發了一套整合旅游目的地多項指標的客觀形象投影方案,以改善目的地營銷。águeda等人[6]挖掘分析了Yelp平臺上的14 000條與不同旅游產品相關的評論,從中找出主要的潛在主題和用戶情緒。Guizzardi等人[7]使用OTA大數據提高了動態價格的預測性能,為智能決策提供了參考。Arici等人[8]基于TripAdvisor上的酒店評論數據,分析了10個國家在評論數量和客戶滿意度評分方面的差異。Salas-Olmedo等人[9]則指出使用單一數據源并不能很好地挖掘游客的空間行為,他們同時使用3種數據源(Panoramio(觀光)、Foursquare(消費)和Twitter(聯網住宿))的數據進行分析,發現這3種類型的數據是部分互補的。Law等人[10]利用香港入境人數預測了日本赴港游客人數。Bi等人[11]結合每日天氣狀況數據,挖掘景點的游客流量和天氣狀況之間的關聯關系。在旅游大數據輔助運營方面,貴向泉等人[12]提出了一種基于區塊鏈的旅游積分通兌系統,利用區塊鏈技術去中心化、難以篡改、安全可靠的特點,實現積分在用戶間的自由流通。這些研究工作為智慧旅游平臺的建設提供了理論支撐。

上述數據多源異構,量大且復雜。從結構上來看,大約20%為結構化數據,80%為圖片、文本、音頻等非結構化數據。對于異構數據,Jimenez-Marquez等人[13]提出了一個既可以用于結構化數據,也可以用于非結構化數的兩階段數據分析框架,包括數據集成和挖掘分析階段。Bin等人[14]提出了一種異構旅游數據集成方法,以下載的游記博客、旅游屬性和電子地圖數據為基礎,構建興趣點(points of interest,POI)知識庫和海量結構化的POI訪問序列。

2 甘肅智慧旅游系統

甘肅智慧旅游系統由“一平臺、一中心、三體系、三朵云”構成,即“一部手機游甘肅”綜合服務平臺,甘肅旅游大數據中心,智慧旅游服務體系、管理體系、營銷體系,以及智慧旅游支撐云、內容云、功能云。圖2所示為甘肅智慧旅游系統的總體架構。其中省級文化旅游大數據中心主要面向游客、行業以及政府,通過基于深度學習的多源、異構旅游數據與游客行為關聯映射技術,挖掘海量的多行業旅游數據的關聯信息,構建更加精準的游客畫像,為游客提供更個性化、精準化的服務,為旅游從業者提供提質增效的數據依據,為旅游管理部門提供動態精準的決策支撐。其可促進甘肅旅游公共信息服務水平顯著提高,旅游在線營銷能力全面提升,行業監管能力進一步增強。

圖2 甘肅智慧旅游系統的總體架構

2.1 甘肅旅游大數據中心

甘肅旅游大數據中心主要面向政府旅游管理部門,接入電信、移動、聯通、公安、公路、鐵路、民航、氣象、環保、景區、OTA平臺、微信、其他網絡平臺13類數據,對行業數據進行信息化加工,構建相應的數據模型,從客流分析、客源地分析、游客屬性分析、客流目的地分析、游客畫像分析、車輛交通分析、網絡輿情分析、宣傳統計分析八大類數據維度出發,實現旅游相關數據的實時統計分析。甘肅旅游大數據中心主要服務于甘肅省文化和旅游廳以及下級旅游部門,為相關部門的數據統計、發展規劃等工作提供依據,并且為游客流量預測、景點管理水平評價、交通擁擠程度分析、應急態勢分析與處理提供數據支持和保障。圖3所示為甘肅省景區和場館分時預約數據的景區畫像,包括預約入園人數、入園時間分布、游客年齡分布、客源排行分析、相關旅游路線圖譜、旅游目的地影響力指數等信息,可為景區運營提供專業數據支撐。

圖3 甘肅智慧旅游大數據中心

甘肅旅游大數據中心的構建包括以下關鍵部分:旅游數據與游客行為關聯映射分層架構、數據庫群構建及多元數據融合計算邏輯框架,以及旅游數據與游客行為關聯映射技術處理構架。

2.1.1 旅游數據與游客行為關聯映射分層架構

通過數據采集技術采集互聯網旅游開放數據,在不同場景時效性和規范性的要求下,將采集到的數據通過數據緩存層進行統一緩存。通過數據清洗層進行統一處理,結合數據映射方法,基于用戶的互動行為研究行為畫像構建,包括用戶消費特征和出行偏好等,生成用戶畫像和群體畫像基礎數據。如圖4所示,旅游數據與游客行為關聯映射分層架構分為數據采集層、數據緩沖層、數據清洗層、數據映射層、數據導出層。

圖4 旅游數據與游客行為關聯映射分層架構

2.1.2 數據庫群構建及多元數據融合計算邏輯框架

依托采集的移動通信涉旅數據、互聯網涉旅開放數據、智慧城市涉旅數據(物聯網、視頻、監控等)、城市旅游信息與靜態數據等大數據資源,規劃設計一套大數據支撐系統及其規范。通過分層技術增強數據復用率、檢索效率、存儲效率,為系統提供標準統一的數據出入口徑,構建支持數據清洗、數據去重、數據脫敏、數據轉換、關聯映射、數據融合、數據接口等服務能力的數據計算中臺,提供交互良好、性能穩定、安全可控的管理功能及數據服務,為智慧旅游大數據中心提供高質量的數據服務和先進的計算框架。研發統一的數據接口,通過安全策略、訪問控制、日志審計技術實現權限可控、調用留痕的數據服務能力。圖5所示為數據庫群構建及多元數據融合計算邏輯框架。

圖5 數據庫群構建及多元數據融合計算邏輯框架

2.1.3 旅游數據與游客行為關聯映射技術處理構架

通過對旅游數據進行采集與處理,研究旅游數據處理的方法、流程和實施規范,完善多源異構數據的關聯與融合應用方案,構建如圖6所示的旅游數據與游客行為關聯映射技術處理構架。研究旅游數據采集、標準化與批量導入技術,包括但不限于景區、街區、商圈等基于物聯網的旅游數據、客流歷史數據、城市旅游靜態資源數據等;采用分類模型、聚類模型、回歸模型、神經網絡和關聯規則等機器算法進行深度挖掘;研發數據采集工具,完成數據的整理與導入;研編采集數據的元數據標準、采集流程、關聯處理流程標準,為旅游客流動態感知與智能疏導提供精準的數據支撐;借助內容分析、空間分析等方法,研究游客時空行為規律及游客行為的關聯映射技術,建立游客行為主題數據集市。

圖6 旅游數據與游客行為關聯映射技術處理構架

2.2 “一部手機游甘肅”綜合服務平臺

“一部手機游甘肅”綜合服務平臺整體架構如圖7所示。該平臺主要面向政府、業態、游客,實現智慧管理、智慧運營、智慧服務。智慧管理體系旨在建立旅游綜合監管平臺,向上對接全國旅游監管平臺,向下建成省、市、縣三級互通的立體旅游應急指揮平臺,實時掌握景區人流量、景區周邊道路擁堵情況、天氣情況,對突發事件進行全方位、無死角的全程預警和應急處置。智慧運營體系旨在基于游客畫像,針對宣傳媒體畫像,精準產出宣傳運營內容、策略、方案和評價體系,提升行業運營能力。智慧服務體系旨在提供訂票、訂房、訂車、旅游線路定制、線上線下互動交流等一體化功能,面向游客提供無縫化、即時化、精確化、互動化的旅游服務;開發電子導游導覽系統,為游客提供生動有趣的導游講解、導游推薦等導游導覽服務,建立面向公眾的電子導游庫,開展游客選擇導游服務;開設一批甘肅旅游營銷服務品牌專區,向游客提供酒店客房、景區人流、交通車流、天氣等涉旅信息查詢服務,協助游客制定、完善目的地行程。

圖7 “一部手機游甘肅”綜合服務平臺架構

本節以3個不同角色為例,基于數據能力的代表性模型(高速公路自駕車流量預測模型、旅游目的地形象代表的圖片選擇模型以及旅游評論情感影響因素分析模型)進行詳細闡述。

2.2.1 高速公路自駕車流量預測模型

高速公路自駕車流量預測模型主要面向政府管理服務部門,準確預測高速公路自駕游游客的入省規模、甘肅自駕旅游者行為模式,為甘肅省自駕旅游產業的發展提供決策建議,對發現旅游供給存在的問題以及提升甘肅旅游目的地形象具有重要意義。

高速公路自駕游車流量預測模型主要使用BiGRU(bidirectional gated recurrent unit)來構建模型,用于預測在不同旅游時區中的高速公路自駕游旅游人數[15]。BIGRU是一種基于雙向門控循環單元(GRU)的多變量時間序列預測方法,它結合了雙向模型和門控機制,能夠有效地捕捉時間序列數據中的時序關系和多變量之間的相互影響。在甘肅省12個省界入境高速公路收費站的關口歷史數據的基礎上,基于BiGRU能夠有效地使用過去5天的車流數據預測未來1天的車流數據,從而得到甘肅省自駕旅游者短時的總體預測情況。

2.2.2 旅游目的地形象代表的圖片選擇模型

旅游目的地形象代表的圖片選擇模型主要面向游客,使用游客在互聯網分享的評論文本和照片圖像數據,進行興趣點選擇和分析,為游客推薦更合適的旅游目的地。

該模型首先使用LDA主題提取模型,分析旅游照片和評論文本數據;然后使用基于密度的聚類方法DBSCAN來獲取圖片地理信息,進行地理坐標的聚類分析,分析游客的興趣點;最終使用卷積神經網絡(CNN)對圖像進行特征提取,使用長短期記憶網絡(LSTM)模型,對圖像集生成關鍵詞描述,之后對關鍵詞進行聚類分析,得到不同景區最具有代表性的旅游圖片。

2.2.3 旅游評論情感影響因素分析模型

旅游評論情感影響因素分析模型主要面向業態。旅游評論文本內容直接反映了游客旅游過程中的實際體驗,表達了對旅游目的地的評價。根據游客對景區的評論文本數據,可分析出游客的情感傾向,挖掘出游客對景區建設滿意的方面和不滿意的方面,從而對相關旅游部門進行景區建設發揮指導作用。

使用CNN與雙向LSTM模型對數據進行特征提取和分類,再從正負兩個方向進行LDA主題提取,最后從密集度、開放形式、本身特色、地理交通、帶動效應等幾個維度對旅游評論進行分析,最終得到旅游評論情感影響因素分析報告,形成旅游目的地影響力指數。

3 應用成效

截至目前,甘肅智慧旅游系統已經建設運營6年左右。甘肅智慧旅游大數據中心,縱向貫通了市縣旅游部門及景區、酒店、旅行社數據,完成113個4A級和5A級旅游景區視頻監控信號接入。其中,5A級景區接入率達到100%,4A級景區接入率超過80%,位居全國前列,實現了對重點景區、重點部位的實時監控,解決了重點景區“看不見、呼不應、連不上、管不住”的管理難題,提升了國家和省市縣四級聯動應急指揮能力。圖8所示為甘肅智慧旅游大數據中心中旅游景區視頻監控接入的監測界面。甘肅智慧旅游大數據中心橫向對接了多類旅游數據,使數據統計更加精準高效。特別是在全國范圍內率先實現了公安住宿數據、民航客流數據與旅游數據的實時共享,使旅游住宿統計卡點由原來的6 391家擴展到14 782家,得到了更完善、準確的客流數據。目前已建成客流分析、客源地分析、游客喜好分析等數據分析模型100多個。通過這些模型,相關部門和人員基本能夠掌握各省份入甘游客人次和駐留時間、各市州接待游客人次和駐留時間,以及游客性別、年齡、喜好、住宿、交通等分布情況,為全省文化旅游產業發展科學決策提供了可靠依據?!案拭C景區(場館)分時預約系統提升適老化功能”入選文化和旅游部首批發展智慧旅游提高適老化程度示范案例。2020年6月,甘肅文化旅游大數據交換共享平臺被文化和旅游部評為年度文化和旅游信息化發展典型案例。

圖8 旅游景區視頻監控信號接入

甘肅智慧旅游系統中,“一部手機游甘肅”綜合服務平臺已接入全省113家4A級及以上景區導游導覽信息,包括景點介紹2 390個、講解視頻2 430條、精選照片1.3萬張、VR全景1 476幅,發布攻略涵蓋城市目的地15個、鄉村游26個、自駕游22個,推出游記1585 篇、宣傳短視頻865個,實現了6 843家酒店及家庭旅館、814家農家樂、573條旅行線路、63家景區門票、9 695名注冊導游的在線預訂和預約。圖9所示為“一部手機游甘肅”綜合服務平臺的主要功能界面。

圖9 “一部手機游甘肅”綜合服務平臺主要功能

自平臺上線以來,累計服務游客已超過1 500萬次。2019年5月,“一部手機游甘肅”綜合服務平臺獲得第四屆中國文旅產業巔峰大會突出貢獻獎、騰訊全球數字生態大會“數字文旅先鋒獎”;2020年6月,被文化和旅游部評為年度文化和旅游信息化發展典型案例;2021年,被新華社評為2021公共文化服務提升典范項目(案例);2022年,在新華社主辦的第九屆文化和旅游融合創新論壇上入選2022公共文旅服務創優推薦案例。在“一部手機游甘肅”綜合服務平臺的帶動下,全省文化旅游行業,特別是景區、博物館、文化館等一線文旅業態的數字化、網絡化、智慧化建設加快推進。

4 結束語

據文化和旅游部發布的2023年上半年國內旅游數據情況,國內旅游總人次為23.84億,比上年同期增加9.29億,同比增長63.9%,國內旅游收入(旅游總花費)為2.3萬億元,比上年增加1.12萬億元,增長95.9%。我國旅游業呈現出快速發展、規模持續擴大、質量不斷提升的特點,對于行業的運營管理提出了更高效、更精準的要求?;诖吮尘昂托枨?,利用大模型和生成式人工智能技術提升現有智慧旅游平臺能力,解決差異化、內容化、精準化、人性化的旅游出行需求勢在必行。筆者團隊未來將會在現有基礎上,開展基于大模型和生成式人工智能技術的交互式智慧旅游平臺建設研究,旨在塑造數字旅游內容生產與游客交互新范式,持續推進數字旅游產業創新,為旅游行業帶來顛覆性的變革,引導智慧旅游產業進入新的階段。

猜你喜歡
甘肅景區智慧
云南發布一批公示 10家景區擬確定為國家4A級旅游景區
行走甘肅
甘肅卷
大美甘肅,我們來了
『摘牌』
“摘牌”
甘肅卷
某景區留念
有智慧的羊
智慧派
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合