?

基于電商平臺網購評論的云南鮮花物流服務質量評價研究

2024-02-01 02:16周常春
江蘇商論 2024年3期
關鍵詞:分詞詞典鮮花

楊 凡,周常春

(昆明理工大學管理與經濟學院,云南 昆明 650093)

一、引言

中國傳統鮮花貿易流通途徑主要集中在線下。通常,鮮花采摘下來后要經過諸多環節才能遠銷至國內中小城市,最后再到消費者手里。 商品流通環節過多,交易時間過長,鮮花在此過程中受到的損耗很嚴重,因此中間各層的鮮花批發商至少會提價15%至20%。 而花店則會在零售環節保證商店業務盈虧均衡的情況下,將價格至少提高60%,這些過程產生的額外成本都由購買鮮花的消費者承擔。 但是現在隨著科技的發展以及電子商務平臺的出現,花農、花店和消費者之間的關系由于中間交易環節的減少變得緊密起來,線上鮮花電商沒有線下門店經營產生的成本壓力,同時也降低了區域局限對業務開發帶來的困難。

云南省作為中國最大的鮮切花生產基地,鮮花出口總量位居全國第一,市場涵蓋世界各地。 即使近年來遭受疫情的嚴重影響也沒有改變。 電子商務交易是其最主要的交易方式之一,昆明國際花卉拍賣交易中心擁有花加、花立購、鮮花嚴選等電商平臺,與京東、淘寶、抖音、拼多多等電商平臺有深度合作,這些電商的花源70%都在云南。 同時,也通過對接云南花卉與全國消費者,實現了融資水平的大幅提升。 因此,本文選擇淘寶、京東平臺的產地、發貨地均為云南的鮮花網購見網評進行研究,以期產生指導效應。

二、研究現狀

(一)物流

Mentzer 等在物流工作中結合SERVQUAL 模型,提出時間性、可得性、完好性為實體分銷物流服務質量主要的三個維度(1)。Mentzer 等通過分析發現,訂單流程、信息品質、人員溝通品質、貨物完好度、錯誤處理、 貨物準確率等都會對顧客的整體物流服務品質有積極或消極的影響, 因此將實體分銷物流服務質量與直接影響服務質量的各因素結合, 創建新的LSQ 量表(2)。 在國內學術界對物流服務質量的深入研究中,田宇認為,物流服務質量管理是物流企業營銷的基礎和關鍵環節, 因此從服務型企業的質量管理理論出發, 給出了物流服務質量管理研究的初步框架(3)。 鄭兵等以服裝行業為研究對象,采用問卷調查法對物流服務質量進行了實證分析, 最后確定時間質量、人員溝通質量、訂單完成質量、誤差處理質量、貨品運送質量、靈活性和便利性為中國本土物流服務質量評價指標體系的7 個指標(4)。 劉丹在總結文獻資料的基礎上,對物流服務質量各維度的組成進行分析,最終確定網上購物物流服務質量構成的8 個維度為網店的物流信息質量、 訂購質量、溝通回應質量、定制服務質量、交付質量、速度質量、個人信息安全質量、誤差處理質量,并對這些維度進行操作性界定(5)。 從上述文獻中可以看出,迄今為止, 國內外學者在這方面進行了大量且充分的研究,并根據各自的研究對象,對原有的SERVQUAL模型和LSQ 量表進行了借鑒和完善,為后續研究者進行物流服務質量評價方面的研究奠定了堅實的根基。

(二)文本情感分析研究現狀

1.基于情感詞典的文本情感分析。 最早的情感詞典構建來自于Whissell, 他在研究中聘請148 位參與者為研究對象,他們在數學、物理等領域中運用了5 個詞匯對該領域進行表達, 將它們與常用的情緒詞進行了比較,并進行了擴展和修改(6)。 在后續的研究中,研究者們不斷地擴展和完善情感詞典,目前使用最多的是英語詞典WordNet, 知網情感詞典Hownet 以及中國臺灣大學NTUSD 中文情感詞典。朱嫣嵐等以Hownet 為基礎創立了詞匯語義傾向性統計的新方法, 利用統計詞匯之間的相似度來確定詞匯的情感極性傾向(7)。柳位平等用TF-IDF 算法構造了一種中文情緒分析模型, 并用該模型對情感詞進行了權重計算和對基礎情感詞詞典的構建過程進行深入研究,提高了文本情感分類的精度(8)。 基于建立情感詞典的方法是利用詞匯的情緒傾向性, 將語言知識與統計相結合, 對文本的情緒進行多維度的分析,在此基礎上,如果情緒詞語的覆蓋率和準確率較高,則可以更準確地進行情感分類。

2.基于機器學習的文本情感分析。 機器學習實際上是對研究數據進行學習, 使用機器學習算法對統計語言模型加以練習, 最后通過使用練習好的區分器對新文本情感類型進行識別。 1990 年,Hafner提出一種以規則為基礎的文本內容解析方法(9)。Fersini 等(2014)在貝葉斯分類模型的基礎上,引入了一種綜合的文本情感分類算法, 并加入了一個貪心算法對分類器的準確性進行評價(10)。Xu 等為了解決情緒分類中數據不均衡問題, 提出一種以詞嵌入為基礎的采樣方法,以獲得有意義的均衡訓練數據(11)。Khan 等建立了一種基于多目標模型選擇(MOMS)的半監督模型,并與SentiWordNet 相結合,采用支持向量機(SVM)進行文本特征加權,最后使用建立的半監督模型提高情感分類效果(12)。 機器學習的重點是如何在描述層次上找到更好的情緒特性,并在相應的模型中合理地運用。 從上述研究結果可以看出,不同的機器學習方法在文本情感處理中得到了很好的應用,各研究學者通過大量的研究推動了文字情感處理技術的發展。

(三)指標體系

在上述學者研究的基礎上, 本文建立基于電商平臺的云南鮮花物流服務質量評價指標體系(表1)。

表1 基于電商平臺的云南鮮花物流服務質量評價指標體系

三、研究設計

(一)數據來源

京東、 淘寶等網站上有大量的鮮花電商企業入駐,這些鮮花企業在淘寶、京東上的網購評論非常豐富。因此本文選取產地、發貨地均為云南地區的線上鮮花花店, 運用八爪魚采集器對店鋪網購平臺在線評論進行爬取收集,總共獲取了26521 條評論。

(二)物流專業詞匯詞典與停用詞詞典的構建

獲取評論文本數據之后首先需要對文本進行分詞處理, 分詞的目的是去除文本中的語氣助詞、標點符號、數字等無意義的文本數據。 同時,將一句話或者一個段落拆分成許多獨立個體的詞,方便數據進行聚類、提取關鍵詞等工作。 分詞需要構建物流專業詞匯詞典和停用詞詞庫。 本文構建的物流專業詞匯詞典來源于搜狗細胞詞庫的 “物流詞匯大全”以及國家行業標準《快遞服務第一部分:基本術語》,將二者從網絡下載后整合為一個文檔,作為分詞的物流專業詞典。 停用詞詞典依次下載哈工大停用詞表等表、詞庫并進行去重、整合,作為本文分詞使用的停用詞詞庫。

(三)數據的清洗

在評論數據分詞之前要先進行篩選, 排除無效評論和評論字數少于5 的評論。剔除評論中空白、字母、表情、不規范語氣詞以及不文明用語等無用文本數據,清洗后剩余的文本數據為23827 條。

(四)研究方法

首先通過八爪魚爬蟲軟件收集淘寶和京東平臺上發貨地、 產地均為云南的鮮花店鋪網絡在線評論數據, 采用數據處理與挖掘技術對物流關鍵詞進行提取, 并將之映射到本文所構建的物流服務質量指標體系中。其次,使用word2vec算法對每個指標對應的物流關鍵詞較少的部分進行擴展, 增加每個指標評論數據的豐富性, 然后對每個物流關鍵詞進行TF—IDF 值計算,以每個指標所對應的物流關鍵詞的TF—IDF 值的總和作為該指標權重值。最后,以每個物流關鍵詞為條件, 提取對應的網購評論, 利用snowNLP 進行句子級情感分析, 記錄每句句子的情感得分值。 本文最終從6 個方面結合不同維度下出現的問題1即可靠性、經濟性、移情性、時間性、新鮮性、保證性六個維度。,提供針對性的管理措施和解決的辦法。

四、網購平臺云南鮮花在線評論數據情感分析

(一)高頻詞提取

本文采用python 軟件里的jieba 分詞模塊對清洗后的數據進行分詞并統計詞頻。首先編寫分詞代碼程序,依次將要處理的文件、物流專業詞匯詞典、停用詞詞典加載到代碼中。 運行代碼后得到分詞結果;然后編寫詞頻統計代碼,將分詞之后的文本文件加載到該代碼中, 得到詞頻統計結果。 本文選取詞頻最高的150 個詞進行下一步研究分析(見表2)。

表2 網購平臺云南鮮花評論高頻詞

(二)構建物流關鍵詞庫

根據表2 統計出的高頻詞, 選取與“物流”“質量”“快遞”“服務”“滿意度”相關的物流關鍵詞作為初始關鍵詞, 并將選取出來的關鍵詞與評價指標進行映射,得到表3。

表3 物流關鍵詞指標配對表

從表3 可以看出, 由于高頻詞只取了前150 個, 導致有的指標對應的關鍵詞較少。 為使指標數據更為完善,本文使用python語言編寫程序利用Word2vec 對較少指標的關鍵詞進行拓展。 再人工篩選出相應的物流關鍵詞,確保每個指標對應的關鍵詞不少于5 個,以方便進一步研究(見表4)。

表4 拓展后的物流關鍵詞指標配對表

(三)TF-IDF 特征詞權值計算

TF-IDF 作為一種統計算法, 常常用來評估在語料庫中某個詞對于某份文檔的重要性。 TF-IDF的基本概念是:在一篇文章中,一個詞的使用頻率較高,并且在其他文章中出現頻率較少,對該篇文章來說可以認為該詞有很強的辨別性,能被用來分類。本文用python 編程計算指標配對表里每個物流關鍵詞的TF—IDF 值,每個指標的權重值等于該指標對應的物流關鍵詞的TF—IDF 值總和(見表5)。權重值越高的指標,說明越受消費者重視。

表5 指標權重表

(四)基于snowNLP 的情感打分處理

以往學者采用構建情感詞典的方法對網絡評論進行評分,這種方法陳舊、耗時,并且在構建詞典和分配單詞的過程中比較隨機, 影響評分結果。snowNLP 內置了一個功能強大的能對中文文本進行情感分析的模型,編寫好python 語言程序后,可直接調用對本文獲取的評論數據情感進行打分, 使用十分方便。 本文將運用以下步驟對snowNLP 鮮花商品評論情感打分的準確性進行檢驗:第一步,人工挑選出一百句正向鮮花網購評論和一百句負向鮮花網購評論,作為檢驗語料庫。第二步,編寫好代碼,將檢驗語料庫加載入代碼中進行情感打分。第三步,對打分結果進行記錄,人工判斷準確性(見表6)。

表6 情感得分檢驗表 (單位:%)

從表6 可以看出, 直接調用snowNLP 進行情感打分準確率不高, 因此, 必須先對snowNLP 進行優化,才能進行下一步研究。 本文查閱了相關資料后作出以下更改:(1)把snowNLP 中分詞的handle 函數改為jieba 分詞的load_userdict 函數并設定常用詞庫,針對鮮花這一商品的屬性添加常用詞特別是否定詞,增加分詞對否定詞的識別率。 (2)重新爬取大量鮮花的評論數據,替換其原有語料庫,作為機器學習情感打分的依據, 本文共準備了35744 條好評評論和5356 條差評評論。 (3)由于語句中含有大量程度詞,比如:很、超級、非常等詞,去掉之后會改變原有語句的意思,因此停用。詞中只設置標點符號、數字和英文字母,最大限度地保證句子的完整性,提高機器判別準確率。 (4)編寫python 代碼使snowNLP 重新學習,并保存相應數據,下次使用時可直接調用。 在完成上述步驟后, 本文重新對情感打分準確性進行檢驗,檢驗語料庫不變(見表7)。

表7 優化后的情感得分檢驗表 (單位:%)

從表7 可以看出, 判斷準確率已經大大提升,正向評論準確率由原來的87%提升到現在的93%;負向評論準確率由原來的64%提升到現在的88%;總準確率由原來的75.55%提升到現在的90.5%。 優化后的情感判斷結果較好,可以進行下一步的研究分析。

在完成關鍵詞庫構建和snowNLP 情感打分優化的基礎上,進行情感打分準確率檢驗:第一步,以各指標對應的關鍵詞為條件, 利用excle 軟件篩選出含有關鍵詞的在線評論,作為各指標的情感打分語料庫(見圖1)。 第二步,編寫好代碼,將各個指標對應的語料庫加載入代碼中進行情感打分。 第三步,對評價結果進行整理,情感得分大于0.5 的評論為好評,小于0.5 的為差評,得到各指標情感得分匯總表(見表8)。

圖1 篩選語料庫

表8 各指標情感得分匯總表 (單位:%)

其中各數據的計算公式為:

好評率:

其中:Praise_rate 為好評率,h 為好評數量,m 為評論總數量。

差評率:

其中:Poor_rating_rate 為差評率,l 為差評數量,m 為評論總數量。

總評價得分:

其中:Total_score 為各指標總評價得分,score為每個句子的得分,i 為單個句子的排列序號, n 為該指標對應的評論總數。

情感平均得分:

其中:Average_score 為各指標情感平均得分,Total_score 為各指標總評價得分,n 為該指標對應的評論總數。

(五)電商平臺云南鮮花服務質量情感評價結果

將前文得出的數據進行匯總,得到指標權重與情感得分匯總表(見表9)。

在表9 中,各維度權重值的計算公式為:

其中:Total_weight 為各維度權重值,weigthi 為各指標權重值,i 為各指標的排列序號,k 為各維度對應的指標總數。

各維度情感綜合得分的計算公式為:

其中:Eve_score 為各維度情感綜合得分,Average_score 為各指標情感平均得分,i 為各指標的排列序號,k 為各維度對應的指標總數。

各維度情感平均得分的計算公式為:

其中:Average_scoreDimension為各維度平均情感得分,Eve_score 為各維度情感綜合得分, u 為各維度對應的指標總數。

從表9 中可以看出,6 個維度權重值從高到低依次為:可靠性(1.188647)、保證性(0.696026)、新鮮性 (0.273857)、 時間性 (0.240993)、 移情性(0.125802)、經濟性(0.114361)。 從權重值來看,消費者對于網購云南鮮花的可靠性關注度最高;保證性其次;關注度最低的是經濟性。

6 個維度的情感平均得分從高到低依次為:經濟性(0.8540)、新鮮性(0.8459)、可靠性(0.8204)、時間性(0.8086)、移情性(0.7829)、保證性(0.6413)。從情感得分來看,消費者最滿意的是網購云南鮮花的經濟性;其次是新鮮性;情感得分最低的是保證性(0.6413)。

五、研究總結

本文采用數據處理與挖掘技術進行句子級情感分析,從情感分析的最終結果來看,消費者對云南鮮花電商在工作人員的專業性、物流服務人員的態度、物流服務人員的操作規范性以及配送速度這4 個指標感到非常滿意, 情感評分均在0.89 以上。云南鮮花電商企業在這些方面要繼續保持,并在此基礎上突破,提供更好的服務。 與之相反,消費者對是否丟少件、個性化服務能力以及運輸速度這3 個指標表示較為不滿, 情感評分分別為0.2331、0.5596、0.6317。 從本文建立的16 個具體指標來看,有11 個指標的情感評分在0.8 分以上,這表示消費者對于云南鮮花電商企業物流服務質量是較為滿意的,這對于成功打造云南鮮花品牌,提高消費者對云南鮮花的良好印象十分有幫助。

猜你喜歡
分詞詞典鮮花
分詞在英語教學中的妙用
預訂60年的鮮花
米沃什詞典
結巴分詞在詞云中的應用
結巴分詞在詞云中的應用
這一首,五月的鮮花
評《現代漢語詞典》(第6版)
詞典例證翻譯標準探索
五月的鮮花
五月的鮮花
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合