?

網絡輿情事件演化分析

2019-10-18 02:41牟馨憶陳亞寧
新媒體研究 2019年16期
關鍵詞:租客聚類女童

牟馨憶 陳亞寧

摘 ?要 ?隨著互聯網技術的發展,微博、微信、知乎等社交平臺成為廣大網民針對現實生活中的熱點、焦點問題表達觀點和情感的地方。網絡對社會監督起到重要作用,認識和分析網絡輿情事件的演化,能夠發現輿情發展的潛在風險,避免群眾的過激行為。以杭州女童失蹤案為例,選擇知乎作為研究平臺,使用網絡輿情“六階段”模型,結合“百度指數”可視化工具進行發展階段劃分。通過爬蟲、關鍵詞提取、主題聚類等方法獲得每個階段公眾關注的主題,分析這一網絡輿情事件的演化,了解其產生的效應并提出建議。

關鍵詞 ?網絡輿情;輿情演化;突發事件

中圖分類號 ?G2 ? ? ?文獻標識碼 ?A ? ? ?文章編號 ?2096-0360(2019)16-0020-04

1 ?背景

隨著互聯網技術的發展和完善,網絡成為人們生活中不可缺少的部分,網絡輿情也逐漸在社會輿情中占據重要地位。由于網絡的虛擬性和開放性,網絡輿情的傳播存在反復波動的特點[1]。公眾的討論內容往往隨時間變化,輿情演化的每個階段呈現不同的特點。這是由于剛開始人們獲取的信息是不完整、不全面的,隨著相關人員介入調查,更多真相公布于世人面前,人們能挖掘出更多信息,而其中不乏與最初的報道相悖的,網絡輿情的焦點也會隨之轉移。

隨著微博、微信等App的廣泛應用,網絡輿情的傳播變得越來越迅速,用戶的觀點和情感不僅能夠影響輿情的傳播速度,還能感染其他用戶的情緒導致輿論的爆發[2-3]。研究網絡輿情事件的演化過程,能夠幫助公眾更清晰、全面地了解整個事件的真相,對于突發事件的應急管理和輿情引導具有重要意義。

2 ?相關研究

不同學者對輿情演化的階段有不同的看法。目前的研究主要有兩個角度:一是基于關鍵詞分析,通過分析關鍵詞的變化來了解整個事情發酵的過程;二是考慮時序特征,按時間軸劃分固定階段,對各段文本進行分析,再進行合并[4]。對于階段的劃分,不同的學者也選擇了不同的指標。目前,大多數文獻把話題的生存周期描述為三個階段:產生(提出)→發展(熱議)→消退(趨冷)[1]。微博數量和轉發、評論量是許多學者關注的指標,蔣知義[5]等人依據微博數量將輿情事件劃分為5個階段。油永華[6]則依據關注度和關注度增量兩個指標,將網絡輿情發展階段分成三個階段。崔鵬[7]等建立了輿情發展生命周期“六階段”模型,并根據演化特點設置了5個關鍵點。

3 ?輿情事件演化分析

3.1 ?研究方法

本文基于網絡爬蟲和主題提取等方法,對突發事件在網絡平臺上的主題演化進行研究。本文選擇知乎作為研究的網絡平臺,選擇杭州女童失蹤案進行分析,爬取用戶對于事件的觀點,進行主題抽取,把握輿情演變規律,提出有針對性的輿情管理建議。

1)網絡爬蟲。網絡爬蟲能夠按照一定的規則,自動爬取網絡上的數據。本文使用Gooseeker網絡爬蟲軟件,編寫規則對知乎上相關問題的回答進行抓取。選擇了“如何看待杭州千島湖9歲女童被租客帶走,且租客后續自殺一事?”等幾個知乎話題,爬取問題下面網友的回答、用戶名、時間等信息。

2)關鍵詞獲取。TF-IDF是一種統計方法,TF是詞頻,IDF是逆文檔頻率,TF-IDF能夠評估一個詞對一個文檔的重要程度。其主要思想是:一個詞在一個文檔中出現頻率高,而在其他文檔中出現頻率低,則這個詞具有很好的區分能力,能夠體現該文檔的特點。

3)主題抽取。本文采用Word2Vec+Kmeans的方法訓練聚類主題。對于主題提取這個任務來說,對關鍵詞聚類是一種合理的方法。Word2Vec是一種利用神經網絡將詞進行向量化的工具。得到詞向量后,可以基于詞向量之間的距離或者相似度來進行聚類,從而獲得聚類主題。

3.2 ?研究流程

本文的研究流程如圖1所示,包含數據獲取、數據預處理、輿情演變分析、可視化分析4個階段。

4 ?杭州女童失蹤案演化分析

4.1 ?數據獲取及預處理

微博、微信等平臺除了有網民的觀點表達以外,還有大量的媒體對事件的報道和相關新聞,存在一定的干擾,而知乎全是網友的觀點表達和看法分析,所以本文選擇了知乎作為研究平臺。選擇“如何看待杭州千島湖9歲女童被租客帶走,且租客后續自殺一事?”“杭州9歲女童失蹤事件透著哪些不合理之處?”“杭州千島湖9歲失聯女童遺體被找到,案件真相如何?”這幾個問題,爬取問題下面的所有回答,一共獲得數據7 582條。爬取的維度包括用戶名、回答內容、回答時間、贊同人數等。獲得數據后需要對重復和缺失數據、無關數據等進行刪除,處理后剩余數據7 576條。

4.2 ?主題演化分析

本文根據杭州女童失蹤案事件的性質和特點,采用崔鵬[7]等提出的輿情演化的六階段模型進行分析,采用Word2Vec+Kmeans進行主題聚類,對六階段模型進行話題的分析。

本文使用“百度指數”這一可視化工具來進行分析。通過“百度指數”搜索2019年7月1日至2019年8月1日期間關鍵詞“杭州女童”的情況,對結果進行描述分析,總結該事件的輿情傳播階段特征。搜索指數的結果顯示7月10日前沒有此事件的搜索,而實際上7月8日開始已有網友在其他平臺討論這個事件,這是知乎、微博等平臺的某些討論內容沒有進入到百度指數的統計中導致的,于是本文考慮了其他平臺的討論后對此模型的時間進行了修正。

結合“百度指數”的可視化結果和崔鵬等學者提出的輿情演化六階段模型,此次事件的生命周期過程可以表示為圖2。依據時間把爬取的語料進行劃分,使用TF-IDF算法為每個階段篩選出100個關鍵詞,手動刪除其中的無關詞,用Word2vec訓練詞向量后,使用Kmeans對詞向量進行聚類后通過歸納得到各階段主題,如表1。由于Kmeans聚類需要提前確定聚類數,可用Bcubed精度和召回率等外在方法和輪廓系數等內在方法來評估不同聚類數時的聚類質量,以確定最優聚類數。本文為了本文為了簡單并能夠說明主要內容,對每個階段都選擇聚類數3為例來進行實驗。

醞釀階段:此事件的嫌疑人兩名租客在6月29日進入女童家中,預謀將女童帶走,在7月8日前該事件并未在網絡上曝光。7月8日淳安縣公安接到女童父親報案,公安和救援人員動身。這個階段的信息披露還不多,可以歸為該事件的醞釀階段。

爆發階段:兩名租客在寧波東錢湖自殺身亡而女童仍未找到是本次事件的危機點。事件由此進入爆發階段。女童祖父母同意租客將孩子帶走的原因被披露,女童父母婚姻關系信息曝光,租客帶走女童的動機疑點重重,女童失蹤的原因在網絡上引起熱議。

擴散階段:爆發點在7月12日,此時女童仍未被找到但搜尋到了其市民卡的線索,案情相關監控視頻曝光,犯罪嫌疑人兩名租客的基本信息、活動軌跡以及抖音等社交賬號也被披露。從爆發階段開始該事件也在不斷的進行擴散,影響也在不斷的擴大。最典型的是犯罪嫌疑人兩名租客的相關信息曝光表明其疑似崇拜“三山國王”,這引起了眾多網友的指責和猜想,公眾開始懷疑嫌疑人動機的不合理之處,網友紛紛提出自己的見解,認為這與非法宗教組織有關而非普通的拐騙拐賣。輿情發酵達到第一個峰值。

反復階段:此次事件的反復階段伴隨著越來越多的信息補充,使得真相逐漸浮出水面。相關新聞媒體報道女童父親與租客的聯系、與女兒的通話內容,女童祖父母得知噩耗后的悲痛,女童遺體被發現等重要信息再次引起輿論的爆發。

消退階段:隨著警方發布此次案件的警情通報,警方回答了公眾對該事件嫌疑人自殺動機、兩人殺害女童的動機等六大疑問,關于此事件的輿情才逐漸消退。這個階段公眾的關注重點是反思家長對兒童安全的監管問題,同時呼吁社會關注留守兒童的生活和安全防范教育,避免類似悲劇再次發生。

長尾階段:在案件調查結束后,此次事件的熱度基本消退。有部分與女童接觸過的網友在知乎等平臺分享與女童及其祖父母的相處經歷,也有部分當地網友分享當地人的生長環境和淳樸性格,解開了部分網友對女童祖父母的誤解,網友均表達對女童家人的同情和祝福。

4.3 ?可視化分析

使用“百度指數”工具對輿論主體搜索用戶進行用戶畫像分析。

從搜索用戶的地域分布來看,搜索較高的用戶集中于廣東和浙江兩個省份。這兩個省份均與本輿情事件有緊密聯系。一方面,從事件發生的地點來看,失聯女童來自杭州千島湖,也是從此地被租客帶走,這樣的突發事件必然牽動著當地人的心。而由于此次事件的特殊性,帶走女童的租客反常地帶女童到浙江、福建、廣東多個省份的海域,網絡爆料的其曾發布的相關照片和視頻,成為了尋找女童的線索,許多網友擴散信息,致使這一事件在這些地區迅速升溫。此外,兩名租客均來自廣東,且在此次輿情事件的擴散階段爆出租客疑似信奉廣東潮州等地的“三山國王”,有網友由此猜測此次事件與宗教信仰有關,也有當地的網友解釋這僅是當地正常的民間信仰而非邪教,再次激發了輿論,使廣東省的討論熱度上升。

從搜索用戶的人群屬性來看,關注此事件的用戶年齡集中在30~49歲的中年人,性別差異不大。一方面,相比于年輕人,這個年齡段的用戶更加關注社會事件而非娛樂熱點;另一方面,這個年齡段的用戶大多正是為人父母的階段,杭州女童失蹤一案牽動著他們的心,也給他們對待兒童的安全問題敲響了警鐘。

5 ?建議

杭州女童失蹤案這一網絡熱點事件不僅給公眾對兒童安全防范帶來了警示,其中的輿情發酵也值得思考。反轉新聞、謠言傳播等都是在輿情發展中需要關注和控制的。針對這些問題,本文提出以下建議:

1)官方媒體和意見領袖要預防謠言的散播。本次事件中有部分自媒體用戶和網友針對不完全的信息就指責女童的祖父母不愛孩子、虐待孩子、重男輕女,并誤導了其他網友在網絡上對女童祖父母破口大罵。這不僅對案件調查毫無幫助,甚至給受害者家庭帶來了二次傷害。在這個網絡時代,“大V”或者營銷號等擁有影響力的用戶應該意識到自身的責任,不輕易散布未經證實的消息。

2)普通民眾要做到不信謠、不傳謠,不要依靠不完整的視頻片段或者網友的猜測就著急“站隊”,要做到“耳聽八方”,對官方媒體保持信任。

參考文獻

[1]陳福集,馬梅蘭.網絡輿情事件的話題演化分析[J].情報雜志,2016,35(5):58-64.

[2]紀雪梅.特定事件情境下中文微博用戶情感挖掘與傳播研究[D].天津:南開大學,2014.

[3]張鵬,蘭月新,李昊青,等.基于HAYASHI數量化理論的網絡謠言分類應對策略分析[J].情報雜志,2016,35(1):110-115.

[4]任中杰,張鵬,李思成,等.基于微博數據挖掘的突發事件情感態勢演化分析[J].情報雜志,2019,38(2):140-148.

[5]蔣知義,馬王榮,鄒凱,等.基于情感傾向性分析的網絡輿情情感演化特征研究[J].現代情報,2018,38(4):50-57.

[6]油永華.大數據環境下網絡輿情發展階段分析[J].價值工程,2017(35):177-180.

[7]崔鵬,張巍,何毅,等.突發公共事件網絡輿情演化及政府應對能力研究[J].現代情報,2018(2):75-83.

猜你喜歡
租客聚類女童
淺談我校女童健康教育現狀
用愛守護,寶山二中心開發女童保護課程
基于模糊聚類和支持向量回歸的成績預測
基于流形學習的自適應反饋聚類中心確定方法
基于密度的自適應搜索增量聚類法
背影有點像你
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合