?

基于網絡搜索關注度的客流量預測研究

2020-01-27 02:25鄭蕙李慶玲
旅游縱覽 2020年12期
關鍵詞:關注度長沙市長沙

鄭蕙 李慶玲

基金項目:湖南省自然科學基金項目(青年基金)“基于網絡數據驅動的景區客流遷移建模與預測研究”(基金號:2018JJ3259);教育部產學研協同育人項目“數字孿生技術在旅游數據中心應用與人才培養實踐(2020年第一批次)”。

引言

21世紀后,我國旅游業開始邁入大眾化旅游時代,中國旅游市場更加蓬勃發展,中國成為世界最大的國內旅游市場、世界第一大國際旅游消費國、世界第四大旅游目的地國家,呈現出“國內旅游市場高速發展、入出境市場平穩發展”的態勢。使用搜索引擎查詢、規劃旅游行程已經成為越來越多人的選擇,并進行了大量實證研究。國外利用網絡搜索關注度指標數據進行預測的歷史最早可以追溯至2009年,研究者們通過對谷歌記錄的大量網絡搜索關注度指標數據進行分析,構建出基于谷歌搜索數據的監測模型。國內對于利用網絡搜索關注度指標數據進行研究的起步相對較晚,也逐步建立了百度指數旅游相關數據與熱點旅游城市客流量之間的數據模型,成功預測景區客流量??偨Y國內外的文獻后,可以看出雖然利用搜索引擎提供的網絡搜索關注度指標數據進行學術研究的起步較晚,但是已經發展得較為成熟,不僅相關研究數量眾多,更涵蓋了多個領域,其研究結果在多個領域得到了證實,具有一定的實踐意義。

一、網絡搜索關注度指標數據處理

本文確定旅游六要素“吃、住、行、游、購、娛”關鍵詞的取詞范圍,將關鍵詞地域限定于湖南省長沙市,取“美食、住宿、地圖、旅游、特產、景點”為基準關鍵詞,并在此基礎上加入“天氣”這一對旅游活動重大影響的延伸關鍵詞,在基準關鍵詞下拓展了“岳麓山”“橘子洲”“湖南省博物館”“長沙工藝品”“長沙臭豆腐”等一共12個關鍵詞數據,借助百度指數查詢與長沙市相關的旅游方面的關鍵詞,作為網絡搜索關注度指標數據,查詢、統計、分析相關數據的搜索指數。通過查詢2008—2018年長沙市統計局官網發布的多篇《長沙統計年鑒》可知此期間長沙市實際接待國內游客數量的年度數據,用Y表示,詳細數據如表1所示。

本文通過百度指數平臺收集了2008年1月1日—2018年12月31日范圍內12個網絡搜索關注度指標數據的年度搜索指數。受平臺數據影響,2008年1月1日—2010年12月31日的搜索數據僅限于PC趨勢數據,2011年1月1日以后數據為綜合搜索指數數據。在對前文提到的12個網絡搜索關注度指標數據進行加總處理后,將美食、住宿、地圖、旅游、特產、景點、天氣、岳麓山、橘子洲、湖南省博物館、工藝品、臭豆腐12個關鍵詞分別記為X1,X2,X3,…,X11,X12,得到網絡搜索關注度指標數據。

二、網絡搜索關注度指標與實際游客數量相關系數

通過SPSS進行Pearson相關系數分析,對前文提到的網絡搜索指標數據與長沙市實際國內游客數量進行相關性分析(見表2)。Pearson相關系數有衡量線性關聯性程度的功能,相關系數的絕對值大小體現了變量之間的相關性強弱,相關系數的絕對值越大,相關性越強。相關系數越大,說明網絡搜索關注度指標數據變化趨勢與長沙實際國內游客量變化相似程度之間越接近且相似。

將X記作網絡搜索關注度指標數據,Xi(i= 1,2,3,……,n)記作時間序列數據,用以表示每一年的網絡搜索關注度指標數據,X—為網絡搜索關注度指標數據,每年數據的平均值數據,Y記作長沙市年度實際國內游客數量,Yi(i=1,2,3,……,n)記作時間序列數據,Y—

記作Y每年數值的平均值數據,rXY記作X、Y的Pearson相關系數。rXY絕對值越大,表示X與Y之間的相關性則越強,rXY為正時,X與Y之間為正相關,反之則相反。0.8~1.0極強相關;0.6~0.8強相關;0.4~0.6中度程度相關;0.2~0.4弱相關,但相關系數的取值總是在-1.0~1.0。顯著性記為sig,sig=0.000說明顯著性水平p值小于0.001,即相關系數在0.001水平顯著,水平越小,判定顯著性的證據就越充分。數據說明,選定的網絡搜索關注度指標數據與長沙市國內游客量具有一定的相關性,相關系數越高則相關性越強,相關系數可在一定程度上反應長沙市國內游客量狀況;景點(X6)、特產(X5)、橘子洲(X9)占據相關系數的前三,呈現出極強的相關關系;工藝品(X11)、地圖(X3)相關系數為負,說明這2項數據與長沙市國內游客量相關性極弱,難以從這兩項數據判斷長沙市國內游客數量。

三、長沙市年度國內游客數量預測研究

本文采用主成分-逐步回歸分析法,結合長沙市2008—2018年國內游客數量數據以及根據百度指數搜索總結得出網絡搜索關注度指標數據,進行數據分析后建立預測模型,利用長沙市2019年實際國內游客數量數據對預測模型進行檢驗,證明網絡搜索關注度指標數據與長沙市實際國內游客數量有相關關系,且能夠基于網絡搜索關注度指標數據預測游客數量,利用ARIMA預測模型對長沙市未來5年內的國內游客數量計算預測值,做出2008—2024年長沙市國內游客數量變化趨勢圖,并進行相關分析。

(一)主成分分析

主成分分析指多個指標經過降維處理后轉化成少數幾個綜合指標的方法,利用主成分分析能夠達到在確保數據信息損失最小的原則下,達到壓縮指標個數、簡化數據的目的。降維處理后的綜合變量依舊保留原始變量的眾多信息,且能夠使變量之間互不相關。本文一共收集了12個網絡搜索關注度指標數據,由于原數據之間具有一定的相關關系,為了避免具有相關關系的變量數據太多而導致研究結果的信息重疊,本文將通過主成分分析處理原先的所有變量數據,根據比較影響系數大小,得出綜合變量數據。

(二)逐步回歸分析

回歸分析是進一步檢測變量之間相互依賴關系程度的一種統計分析方法。從相關分析的結論中得出,運用SPSS軟件中的多元回歸分析方法對各重要指標自變量與因變量進行回歸分析,采用了較為常見的逐步回歸法,通過觀測所有變量順序進入回歸方程式中,以期觀測各變量對回歸模型的影響是否顯著。

逐步回歸的基本思想是:一個一個引入變量,每引入一個變量時,要對已選入的變量進行逐個檢驗。當原引入的變量由于后面變量的引入而變得不再顯著時,則剔除該變量。這個過程反復進行,直到既無顯著的變量選入方程,也無不顯著自變量從回歸方程中剔除為止,使最后得到的解釋變量集為最優。

在逐步回歸模型運算中,以各個X為自變量,Y為因變量做線性逐步回歸,得到逐步回歸方程的檢驗結果。利用SPSS進行逐步回歸分析,計算結果如表3所示。

在表3的模型摘要中,主要計算了R,最主要是做R檢驗,R檢驗表示:在模型擬合度檢驗中,調整后的R2=0.984,說明自變量可以解釋因變量98.4%的變異度,R2越接近1,則說明模型的擬合效果越好,說明在引用X6變量引用至回歸方程時,網絡搜索關注度指標數據與長沙市國內游客數量的擬合程度較高,網絡搜索關注度指標能夠很好反應長沙市國內游客數量。

(三)基于AMIRA預測模型的長沙市國內游客數量趨勢

根據長沙市2008—2019年實際國內游客數量進行AMIRA預測模型,預測長沙市未來5年內的游客數量,得到長沙市2020—2024年國內游客數量預測值,如表4所示。

根據長沙市200—2019年實際國內游客數量,基于AMIRA模型預測長沙市2020—2024年國內游客數量預測值,形成2008—2024年國內游客數量變化趨勢圖,如圖1所示。

由圖1可以看出,在2008—2024年,長沙市國內游客數量正處于不斷增長的發展趨勢中,增長勢頭良好,長沙市旅游產業依舊具有較大的發展空間。

四、基于長沙市游客數量預測的旅游發展對策

與長沙市國內游客數量相關系數較高、聯系較為密切的是長沙景點、長沙特產、橘子洲、岳麓山、長沙美食、長沙臭豆腐、湖南省博物館、長沙天氣這些網絡搜索關注度指標,相關系數越高表示旅游者在搜索旅游地相關信息的搜索頻率越高,體現了旅游者對此類旅游信息的關注程度和消費需求。從旅游六要素的類型看,這些網絡搜索關注度指標數據主要涵蓋了游、購、食3個方面,說明旅游者尤其關注長沙旅游產業以下幾個方面:①加大旅游景點建設力度,提升旅游服務卓越品質;②關注旅游購物市場,完善旅游購物消費機制;③推動長沙美食營銷,扶持長沙特色美食發展。

本文收集了長沙市2008—2018年國內游客數量的數據,并收集了相同年度范圍內部分與長沙旅游有關的“長沙景點”“長沙美食”等網絡搜索關注度指標數據,利用Pearson相關系數對這兩類數據進行研究分析后發現,網絡搜索關注度指標數據與游客數量之間具有較強的相關關系。實證發現,以長沙市網絡搜索關注度指標數據為自變量,利用主成分-逐步回歸預測模型能夠預測出長沙市國內游客數量的實際值,且預測效果良好,相對于利用傳統數據進行的傳統預測模型結果準確率更高,且時效性更強。

(作者單位:湖南工商大學旅游管理學院)

猜你喜歡
關注度長沙市長沙
長沙市望城區金地三千府幼兒園
長沙之旅
我眼中的長沙
雄安新區媒體關注度
全國兩會媒體關注度
暴力老媽
長沙市控編減編工作的實踐探索
“王者”泛海發布會聚焦百萬關注度
多姿多彩的“長沙窯”
簡述長沙市三種不同邊坡支護方式
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合