?

游客情感傾向的地理差異及特征分析
——以成都和重慶為例

2022-03-26 07:48白剛
關鍵詞:符碼目的地成都

白剛

桂林旅游學院 旅游管理學院,廣西 桂林 541006

隨著互聯網技術的高速發展,旅游者越來越傾向于利用互聯網進行旅游產品預訂、點評、社交等活動,在各類平臺產生了海量的數據.其中,游客點評或評論數據是一類非結構化的文本數據,在各類社交網絡中大量產生和存儲.文本評論數據具有非結構化、碎片化的特征,是游客經過思考和語言組織表達的思維內容,情感比較穩定,文本中包含了游客對旅游目的地的情感傾向,而情感傾向表達了游客的旅游體驗感知[1].

對游客情感傾向的提取和分析有助于發現游客感知的旅游目的地形象維度和具體影響因素[1].情感傾向的特定維度,例如擁擠感知存在顯著的地理差異[2],游客的情感特征與時間地理學相關[3].文本評論的情感傾向亦是了解旅游者游后行為意圖[4]的高效來源.

評論文本數據的情感傾向提取方法目前以基于情感詞典的方法[5-7]、基于機器學習和大數據的方法[8-14]為主.基于情感詞典的方法準確率受到詞典顆粒度和學科分類準確性的高度影響[15],但應用簡單;基于機器學習和大數據的方法在監督學習后可獲得較高的準確率和效率,但需要以大量的人工標注訓練集為基礎.

2021年“五一”小長假期間,國內旅游人次達2.3億,按可比口徑恢復至疫前同期的103.2%,實現國內旅游收入1 132.3億元,其中32%的游客采用了互聯網預訂等方式(新華網http://www.xinhuanet.com/2021-05/05/c_1127410778.htm),成都、重慶等城市成為熱門旅游目的地,游客量分別超過390萬和280萬(中國互聯網資訊網http://www.199it.com/archives/1242394.html).游客量的增加帶來了高旅游收入,但同時也可能引起旅游體驗的波動,對網絡評論文本情感傾向的地理差異及其特征分析有助于發現游客情感的時空變化[16],可為旅游目的地理解旅游者行為產生重要的決策支持[3],并可發現各類因素對游客情感的影響[11],了解游客感知的目的地形象[17],判斷游客忠誠度的影響因素和作用機制[18].

本文選取成都和重慶為研究目的地,以2021年“五一”期間新浪微博評論文本為研究對象,結合情感詞典和機器學習的方法對評論文本進行情感標注和打分,對情感評分結果進行定量分析,同時對評論文本進行定性分析,以探求游客情感傾向的地理差異及特征,明確影響因素.

1 研究設計

1.1 研究目標

本文通過對評論文本包含的情感傾向進行分析,理解旅游者游中或游后的情感評價行為,進一步探索游客情感傾向的地理差異性及情感傾向的具體指向特征和維度,并尋找影響情感傾向的主要因素.本文研究的核心問題是:① 對完成情感傾向打分的評論數據進行定量分析,從客源地距離、游客量等變量入手,發現游客情感評價的地理差異;② 通過對文本內容的符號逐級編碼和概括,探索游客對目的地情感評價的具體指向維度,并通過符碼關聯性分析等方法進一步解讀影響情感傾向的具體因素.

1.2 研究方法

本文采用定量和定性混合的研究方法.

采用統計分析和空間分析等方法對評論數據集進行定量分析,具體流程為:① 爬取對應目的地微博評論數據.采用Python語言構建爬蟲程序爬取2021年“五一”期間目的地為成都和重慶的評論和相關用戶信息,獲取記錄13 352條.② 數據清洗.對爬取的數據進行有效性處理,去除無效和重復數據,并對廣告、非評論等數據進行人工去除,由于微博用戶群體原因,港澳臺數據不完整,手動去除后最終得到有效數據11 064條.③ 情感打分.采用筆者提出的混合情感詞典和機器學習情感標注方法對評論文本數據進行打分.④ 統計分析和空間分析.定量分析中去除量綱,采用Z-Score對數據進行標準化處理.在定量分析的基礎上,對成都和重慶的情感得分進行排序,選取情感積極和消極分值各前200的評論文本進行定性分析.采用三級編碼的方法對文本數據進行分析,逐級概括出游客對目的地情感的指向維度及影響成都和重慶游客情感傾向的核心因素.

2 地理差異分析

2.1 情感評價總體差異

對旅游目的地為成都和重慶的評論文本進行自動情感評價打分,得分為正數的表示情感積極傾向或好評,得分為負數的表示情感消極傾向或差評,得分為0表示情感中性.成都積極、中性和消極評價占比為57%,31%和12%;重慶積極、中性和消極評價占比為54%,36%和10%.兩目的地游客情感評價比例近似,評價具有明顯的積極傾向.將打分后的數據按照客源地計算情感得分均值、情感得分離散系數和好評率,對數據進行標準化后的結果如表1所示.

表1 成都、重慶情感傾向

由表1可知,目的地為成都的游客情感評分均值高值客源地為青海、海南、安徽和新疆,其次為天津、上海、湖南和山西,低值客源地為福建、河北和山東;好評率高值客源地為青海、安徽和江西,好評率低值客源地為福建、甘肅、江蘇和河北;根據離散系數可知情感得分波動劇烈的客源地為四川、甘肅、江蘇、廣東和山東.目的地為重慶的游客情感評分均值高值客源地為安徽、新疆和福建,低值客源地為吉林、云南、貴州;好評率高值客源地為新疆、天津、海南、湖北、福建,低值客源地為黑龍江、廣西、青海、云南、吉林和貴州;情感得分波動劇烈的客源地為浙江、甘肅、四川和上海.

將表1數據導入RStudio軟件中,以目的地為分類變量對情感得分均值、離散系數和好評率分別進行方差齊性檢驗和獨立樣本t檢驗,p值均大于0.05,說明成都和重慶的情感傾向在統計學意義上沒有顯著差別.

對成都和重慶游客情感傾向的離散系數和好評率進行全局莫蘭分析[19],權重矩陣為客源地與目的地之間的歐氏距離,發現全局莫蘭指數(Global Moran’sI)的p值均大于0.05,表明兩目的地游客情感傾向的空間自相關性不顯著,且客源地與目的地之間的距離不是影響情感傾向的主要因素,需要通過定性分析評論文本進一步探討其他影響因素.

2.2 地理差異

按照4分位將情感積極得分比率(好評率)分為4個等級,取值區間為半開區間,分別為低值[0%~25%),中值[25%~50%),次高值[50%~75%)和高值[75%~100%),地理分布如圖1所示,白色表示未獲取到有效數據.

審圖號:GS(2019)1823號(中華人民共和國自然資源部監制).圖1 成都、重慶好評率等級分布

從圖1可以看出,目的地為成都的游客好評率得分高值客源地為青海和安徽,低值客源地為甘肅、江蘇、上海和福建;目的地為重慶的游客好評率得分高值客源地為天津、新疆、湖北、福建和海南,低值客源地為黑龍江、吉林、青海、甘肅、云南、貴州、廣西和浙江.成都和重慶好評率在高值和低值范圍內地理差異顯著,且均無空間集聚特征;次高值客源地均呈現出明顯的空間集聚特征,兩目的地游客好評率次高值區具有高度相似性,以華中和華南各省(自治區)為主要客源地.

3 情感特征定性分析

對成都和重慶游客評論情感傾向分值進行排序,選擇積極和消極情感得分前200的評論文本作為定性分析資料,采用三級編碼的方法進行逐級特征概括和提?。?/p>

3.1 編碼過程

3.1.1 開放式編碼

對成都和重慶評論文本進行匯總,導入MAXQDA 2020中進行編碼.進一步依據詞語/句子間含義相近的原則進行歸并[20],歸納為目的地、旅游主體、旅游目的、客觀感知、主觀體驗5個主類屬,其中包括多個亞類屬.

分別對成都和重慶的積極傾向、消極傾向文本進行編碼,開放式編碼過程和結果如表2-表5所示.

表2 成都積極情感文本編碼

表3 成都消極情感文本編碼

表4 重慶積極情感文本編碼

表5 重慶消極情感文本編碼

續表5

3.1.2 總體分析

成都和重慶的積極和消極文本編碼最終得到5個主類屬符碼數量總體比例分布如圖2所示.其中,主類屬“目的地”符碼占比接近;主類屬“旅游主體”占比均在10%以內,兩個目的地消極情感文本編碼以“我”為主要符碼,說明持消極態度的游客主要為單體游客.

圖2 主類屬符碼占比

成都和重慶積極文本主類屬“旅游目的”占比(21.1%和13.5%)均高于消極文本主類屬“旅游目的”占比(4.8%和4.5%).其中,成都積極和消極文本主類屬“旅游目的”所包含的亞類屬中,“美食”占比分別為92%和79%;重慶積極文本主類屬“旅游目的”所包含的亞類屬分別為粉絲(48.8%)、情感(29.0%)、觀光(17.5%)、美食(4.7%),重慶消極文本主類屬“旅游目的”所包含的亞類屬分別為觀光(64.8%)、粉絲(17.6%)、美食(17.6%).成都和重慶游客旅游目的差異明顯,重慶旅游目的較成都多元化,旅游吸引物更為豐富.

“客觀感知”和“主觀體驗”是編碼的核心部分.如圖3所示,“客觀感知”包含的亞類屬中情感積極文本編碼“視覺感知”和“形象感知”為主要亞類屬.成都積極情感文本編碼情感亞類屬中“時間感知”占比較大;消極文本編碼成都與重慶差異較大,成都主要亞類屬為視覺感知(31.9%)和體覺感知(43.8%),重慶為體覺感知(42.3%)和形象感知(37.8%).

圖3 客觀感知亞類屬符碼占比

由圖4可知,“主觀體驗”主類屬包含的亞類屬中,無論是積極還是消極情感文本編碼,情感體驗均占主要比例.

圖4 主觀體驗亞類屬符碼占比

3.2 特征分析

3.2.1 積極情感特征

在表2中,“旅游目的”主要指向“美食”,從“主觀體驗”中“味覺體驗”的開放式符碼可以看出游客對成都飲食的高度認可,進一步由代碼接近度(圖5)可以發現,“主觀體驗”中的“好吃”“便宜”等符碼與飲食有高度關聯.亞類屬“觀光”雖然占比較小,但在“客觀感知”主類屬中從視覺感知和形象感知角度,在風景、建筑、城市整體等方面將成都描述為“非常有小資情調,像江南溫婉雅致的煙火氣城市”,反映了 “觀光”仍舊是游客來成都的主要目的之一,且對城市景觀認可度較高.

圖5 代碼接近度

在表4中,重慶“旅游目的”的亞類屬范圍較成都更廣,“粉絲”比例最高,反映了重慶明星粉絲營銷、影視營銷的效果,其中符碼“肖戰”“何平”“拳擊冠軍”等高頻詞出現,偶像的吸引力和經濟帶動價值很高.在“旅游主體”的開放符碼中,“伙伴”“朋友”頻次大于“我”頻次,與他人同游重慶的意愿高于單人;“情感體驗”亞類屬的開放符碼包含強烈的正向情感,通過搜索引擎以關鍵詞“重慶 浪漫”進行搜索,有超過83萬條記錄包含最浪漫的10個地方、求婚圣地、浪漫地標、浪漫公園等結果,反映出重慶的城市形象中“浪漫”的輸出較為成功.

3.2.2 消極情感特征

盡管成都和重慶消極情感占總體評價的比例相對較低,但仍反映出目的地的“短板”.針對消極情感的文本編碼進行分析,能夠提取出旅游目的地具體的“短板”指征,可為目的地進一步提升城市形象提供參考.

在表3中,成都消極情感文本編碼主類屬“客觀感知”的符碼集中指向了“天氣熱”“人多/擁擠”“機器壞了”,與“主觀體驗”主類屬中“情感體驗”的“累得夠嗆”“心情糟糕”“絕不出來玩”有強代碼關聯.綜合觀察表2和表3發現,成都積極情感目的地符碼與消極情感目的地符碼完全不同,反映出旅游點本身對游客情感影響較大.表3景點中的“寬窄巷子”“九眼橋”等成都熱門旅游景點具有強吸引力,導致游客量暴增,“擁擠”的產生導致游客在評論文本中反應出較大的期望感知差距.表2中亞類屬“時間感知”高比例符碼指向“清晨”“傍晚”等溫度較低時段,進一步說明高溫對游客情感的消極影響較大.

由表5可知,重慶消極情感文本編碼主類屬“客觀感知”的亞類屬“體覺感知”和“視覺感知”包含符碼集中指向“熱”“人多/擁堵”“爬坡”,與亞類屬“主觀體驗”中“情感體驗”的符碼“累”“再也不來”及亞類屬“氛圍體驗”的符碼“爬不動樓”有強代碼關聯.亞類屬“形象感知”的開放符碼將重慶描述為“起伏不斷,彌漫火鍋味的5D魔幻山城”,整體為中性情感描述.在表4和表5中,亞類屬“景點”的符碼中“洪崖洞”“李子壩”“解放碑”都存在,表明熱門景點存在游客量超載等情況,但不同游客感知和體驗不同,可進一步對游客群體進行細分研究以發現消極游客群體特征,為景點提升游客滿意度提供參考.

4 結語

本文對2021年“五一”期間去往成都和重慶的游客在微博上評論文本的定量分析發現,兩地游客好評率均大于50%,好評率空間自相關性表現不顯著,但好評率次高值[50%~75%)客源地呈現出明顯的空間集聚特征,以華中和華南省(自治區)為主.成都和重慶的高值和低值范圍地理差異顯著,且均無空間集聚特征.

進一步對文本材料編碼進行定性分析,最終得到包含多個亞類屬的目的地、旅游主體、旅游目的、客觀感知、主觀體驗5個主類屬.將這些類屬與文本資料的內容進行關聯,發現兩地旅游主體在積極情感文本符碼中均包含多人群體和單體,消極情感文本符碼中則均為單體.成都和重慶的游客旅游目的有較大差異,成都游客以美食和觀光為主,重慶游客則以觀光、粉絲和情感為主,重慶游客的旅游目的更多元化.將主類屬核心“客觀感知”和“主觀體驗”與文本內容進行綜合分析發現,成都游客對成都的飲食和風景高度認可,部分景點的高知名度引發的擁擠、部分城市基礎設施的損壞及天氣炎熱是成都消極情感的主要來源.重慶的城市形象“浪漫”輸出比較成功,是旅游主體多為群體的主要原因之一,同時粉絲營銷效果明顯,吸引了大量明星的粉絲,在亞類屬“情感體驗”表達中呈現出強烈的正向情感.重慶的消極情感集中表現在天氣熱、人多和爬坡引起的疲勞等方面,在消極文本中城市形象感知符碼情感表達為中性.

通過對編碼的綜合及概括,成都形象描述為“非常有小資情調,像江南溫婉雅致的煙火氣城市”,重慶形象描述為“起伏不斷,彌漫火鍋味的5D魔幻山城”.成都和重慶地理位置接近,在旅游形象定位上卻有明顯差異.

盡管本文從文本資料分析中發現了游客積極和消極的總體特征,但由于微博數據本身的維度限制,缺乏足夠的游客人口特征,因此未能進一步對游客群體進行細分以探求人本維度情感特征的數據,今后尚需進一步通過實地調研等方式拓展數據,采集維度.

猜你喜歡
符碼目的地成都
戀愛中的城市
普利策新聞獎中的文化符碼呈現
——以2018、2019年批評獎作品為例
迷宮彎彎繞
向真而死——論《菲德拉的愛》的消費符碼與悲劇情感
符碼的游戲藝術
穿過成都去看你
符碼場
動物可笑堂
數看成都
成都
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合