?

考慮興趣偏好和多事件影響的網絡事件推演模型研究

2022-02-08 12:58潔,任
關鍵詞:元胞辟謠謠言

臧 潔,任 旭

(遼寧大學 信息學院,遼寧 沈陽 110036)

0 引言

隨著互聯網的快速發展和手機等智能設備的普及,互聯網已成為我國民眾日常生活中必不可少的信息獲取渠道和交流方式.民眾通過互聯網發表和傳播各種觀點情緒,其中流行于互聯網上對于某些事件不同看法的總和,稱為網絡輿情.網絡輿情是由于各種事件的刺激而產生并通過互聯網傳播,人們對于該事件的認知、態度、情感和行為傾向[1].互聯網信息的傳播方式極大地縮短了社交距離,如何準確捕捉網絡輿情動態、掌握相關規律并及時進行應對,成為眾多學者的研究熱點.

同時,隨著計算機建模仿真技術的發展,越來越多的學者嘗試將其應用到網絡輿情研究中.盡管網絡輿情的傳播是一個整體過程,但是從模型仿真角度對其進行研究,需要同時兼顧社交網絡結構不同、網民特征屬性不同、事件特征屬性不同和傳播過程的隨機性等諸多因素;并且每一項因素的變化都會使最終的網絡輿情傳播結果產生變化,對于這樣一個復雜系統的仿真難度可想而知.針對此現狀,學者們提出了各種有針對性的模型進行仿真,其中Bolzern等[2]提出了一個動態的隨機多智能體模型,研究社交網絡中群體行為存在的特征;趙磊等[3]采用BP神經網絡的理論構建模型,使得模型能夠對輿情事件熱度變化趨勢有更精確的仿真效果;蘭月新等[4]采用多維函數構建出網絡輿情演化高維模型;Wang等[5]在輿情傳播模型中引入博弈論,提出基于一對多博弈的輿情傳播模型;馬宇紅等[6]建立了基于BA無標度網絡的謠言傳播模型,對網絡謠言的傳播規律進行仿真分析;魏德志等[7]將博弈論與傳染病SIRS模型相結合,探尋熱點話題傳播過程中的規律;Chen等[8]使用SIRS模型對信息擴散過程中的輿論極化現象進行研究;何英等[9]使用Matlab構建網絡輿情擴散方向估計模型,可以提高網絡輿情突變擴散方向的判斷精確度;秦濤等[10]采用排序學習的方法實現了對網絡輿情事件演化態勢的評估;董靖巍[11]、索琪等[12]著重于研究復雜網絡結構下的輿情演化;曹海軍等[13]、哈達等[14]應用系統動力學理論構建輿情傳播模型.上述研究中所采用模型以及研究對象的多樣性,也印證了網絡事件傳播研究內容的廣泛程度.

但是在這些研究中,大部分模型弱化事件區分,將模型構造的關注點落在用戶影響力差異化以及社交關系中.首先,模型忽略了用戶的個體興趣偏好對網絡事件傳播的影響,根據網絡輿情的特點,整體網絡用戶的興趣偏好對于網絡事件的傳播會產生不同的影響;其次,忽略了不同類型事件在互聯網中受關注的程度,模型中僅能容納單一事件,但是根據研究發現互聯網中各種事件共享同一網絡空間,這些事件對于民眾的注意力呈現競爭關系,對于網絡事件的傳播會產生影響.因此,本文在以上研究的基礎上,考慮用戶個體興趣偏好和多事件影響,采用元胞自動機(Cellular Automata,CA)原理,首先提出兼顧平臺總體用戶興趣特征與個體偏好差異性的CA矩陣;其次在經典SIR傳染病模型的基礎上,針對多事件容量改進得到多重SIR狀態轉換關系,構建了適用于網絡事件的傳播推演模型,并通過實例進行了驗證,仿真實驗驗證了模型的有效性.

1 基礎理論

1.1 CA模型

因其上述特征,多年來眾多學者將其應用于社會學、生態學和計算機科學等領域.網絡事件的傳播過程可以看作網民所代表的網絡節點間對于事件信息的交換過程,在CA模型中體現為元胞間進行信息傳遞、改變自身狀態的過程.Alves等[15]于2002年將CA理論應用于自由選舉輿情分析;王根生等[16]也在CA網絡輿情應用中進行了一系列研究.近年來,CA在網絡輿情方面的應用更加細化,毛乾任等[17]關注于網絡輿情觀點聚合,后續還針對導控策略影響下的網絡輿情傳播[18]進行了研究;姚翠友等[19]提出基于用戶屬性的微博輿情演化CA模型;滕婕等[20]將CA模型應用于群體辟謠信息的擴散效果預測.上述研究從不同角度均取得了一定的成果,展現出了CA應用于網絡輿情研究的潛力.

但對于網絡輿情的元胞矩陣構建,在個體差異化的表現形式上,重點區分普通用戶、輿論領袖、政府等個體屬性影響力[18-19],或者是將元胞區分為傳謠個體和辟謠個體[20].這兩種方式都存在自身不足,首先元胞矩陣容量不足,過于區分普通用戶、輿論領袖等個體差異化元胞,會過渡放大輿論領袖以及政府賬號的傳播作用,非普通用戶元胞的數量稍有變化就會對推演結果產生較大影響.而且,在當前網絡社交平臺中,不良事件傳播很少經過已有輿論領袖進行,都是網民之間自發傳播造成影響力.對于傳謠辟謠用戶,在不清楚信息是否真實的狀態下,普通用戶無法確認事件真假,所以并不能給予普通用戶屬性上的認定,對此,本文構建了具有個體偏好差異化的元胞矩陣用以改善上述問題.

1.2 SIR傳染病模型

SIR模型是傳染病模型中經典的模型之一,由Kermack與McKendrick在1927年用動力學方法構建.其原理為,假設總人數N不變,將總人數分為S(Susceptible)代表易感者、I(Infective)代表感染者、R(Removal)代表移出者等3部分.易感者S會受感染者I影響,依據傳染率β變為感染者I,感染者I在依據恢復率γ被治愈后,會變為移出者R不會再被感染,如圖1所示.因傳染病在人際中的傳播過程與網絡事件在網絡空間中傳播的過程類似,網民在整個過程中對于事件的感知也可以劃分為對應狀態,所以近年來SIR模型在網絡輿情方向有諸多研究.Zhao等[21]將SIR模型應用于新型傳播網絡中,使用數值分析法進行動力學分析;王謝寧等[22]對SIR模型應用平均場理論以及小世界網絡,進行有針對性的假設,并對社會化網絡中的規律進行探究;陳波等[23]提出SEIR(Susceptible Exposed Infected Removed)傳播模型,考慮到傳染病存在一定潛伏期,用狀態E表示潛伏,對SIR模型的網絡輿情應用進行了擴充;丁學君[24]在研究了微博平臺網絡輿情傳播過程及其特點之后,增加了接觸狀態,構建了基于SCIR的微博網絡輿情話題傳播模型;Kumar等[25]增添了謠言緩解者以及反對謠言概念,提出SMIR模型,用于對社交網絡中謠言傳播過程的模擬;田世海等[26]結合信息生態理論對SIR模型進行改進,通過構建網絡輿情信息生態群落的橫向和縱向衍生模型,探尋輿情信息衍生規律.上述研究雖對SIR模型各自進行了有針對性的改進,但是并未脫離模型最初只針對單一傳染病推演的本質,全程圍繞單一事件進行研究.

圖1 SIR狀態轉換規則

經過研究發現,同一時刻內網絡空間中存在眾多事件同時進行傳播,這些事件整體共享網絡空間,但彼此之間存在對于用戶關注度的競爭關系.各類網絡平臺熱點榜單從側面反映出了事件在經過傳播競爭后所受關注度的情況,這種多事件共存關系已有研究但并未得到具體體現,對此本文改進SIR模型以增加模型事件樣本量.

2 改進的網絡事件傳播推演模型

2.1 考慮用戶興趣偏好的個體差異化元胞矩陣構建

對網絡用戶個體進行合理描述是模型合理性的基礎,CA模型應用于網絡輿情研究,需要通過構建元胞矩陣對真實網絡空間進行微縮來描述用戶間的社交關系.但是矩陣所包含的元胞數量有限,既要體現出不同用戶所具有的個體差異,又要在有限數量的元胞之間構建起合理的用戶比例,這需要對元胞矩陣進行重新構建.現有研究多基于用戶權重對該問題進行研究,本文將用戶個體興趣偏好作為個體差異化指標進行元胞矩陣構建,提出了考慮用戶偏好的具有個體差異化的元胞矩陣.

初始元胞偏好的構建不隨后續事件推演發生變化,不同用戶對于不同事件具有不同的偏好排序,首選偏好類型,元胞感知度強,次選偏好類型的感知度弱.個體元胞偏好受整體矩陣元胞偏好比例限制且隨機分布,該特征具有平臺通用性,如新聞資訊服務平臺、社交網絡平臺、網絡文化平臺、綜合性社區等,可根據不同平臺自身用戶畫像進行比例重構.以微博為例,根據微博平臺給出的2021上半年微博熱搜榜趨勢報告,2021年6月熱搜統計中,26%為娛樂熱點,36%為社會熱點,38%為垂直熱點.其中垂直熱點涵蓋眾多垂直話題,如企業、美食、科技、文化等,根據此比例可以逆推微博用戶偏好比例.應用于個體差異化元胞矩陣中首選偏好構建的比例為:社會36%、明星13%、綜藝13%、美食8%、文化、軍事、科技、情感、財經各6%;次選偏好比例相同,且保證同一元胞中首選偏好與次選偏好不同.

根據上述比例構建的初始元胞矩陣,宏觀上表現出整個矩陣用戶群體興趣比例,微觀上體現出每個元胞自身興趣偏好不同,充分展現了元胞代表的用戶個體間存在的差異化特征.

2.2 考慮多事件影響的多重SIR狀態轉換

為了體現多事件的競爭關系,使得事件容量更大,本文將多事件傳播情況考慮在內,重構了多重SIR狀態轉換.單一用戶可以同時暴露在多個事件信息的影響之下,根據個體偏好不同決定后續受到哪一具體事件影響進行傳播或免疫.而且,針對辟謠信息的推演,改進后的多重SIR狀態轉換,能夠將謠言信息與辟謠信息同時作為信息源放入網絡空間中進行傳播.

圖2 改進后的多重SIR狀態轉換圖

表1 改進后的狀態轉換關系及參數

離線用戶狀態S0表示對當前所有信息免疫,當元胞進入在線狀態S1之后變為事件信息易感者,暴露在不同的事件傳播空間之中,會受到鄰域內其他元胞狀態的影響.當在線用戶鄰域內出現首選偏好事件a的信息傳播者時,系統生成隨機數,將其與首選偏好感知度閾值P12進行比較,判斷狀態是否轉換為受首選偏好事件影響但未傳播狀態S21.S21狀態為過渡態,處于此狀態的元胞會在下一推演時刻進行選擇,選擇過程系統生成隨機數與受首選偏好傳播閾值P2I以及首選偏好免疫閾值P2R進行比較,決定后續狀態轉換為受到首選偏好事件影響并傳播狀態S22或事件免疫狀態S23.進入事件免疫狀態S23后元胞對事件a不再關注,重新對其他類型事件易感,專注度參數PConcentration大小決定元胞能否被其他類型事件所感染.

重構后的多重SIR狀態,上述以首選偏好事件分支為代表的單一事件傳播過程與傳統SIR狀態相吻合,有向轉換不可逆.但對于在線用戶狀態S1,因其可能同時暴露在多個事件影響下,即鄰域內存在首選偏好事件傳播元胞以及次選偏好事件傳播元胞,因此后續狀態存在多條分支及競爭關系.具體關系表現為,在線用戶狀態S1受偏好排序優先級影響,以P12、P13概率感知首選或次選偏好事件影響,進入對應分支,此部分在后續實驗推演中會控制推演矩陣變化,作為整個模型的動態參數.

2.3 基于個體差異化元胞矩陣與多重 SIR狀態轉化的網絡事件推演模型

本文考慮用戶個性化興趣偏好與多事件對網絡事件發展趨勢的影響,在改進的網絡事件推演模型中,使用的元胞空間是二維空間元胞矩陣A,其中A={C1,1,C1,2,…,C1,j,C2,1,…,Ci,1,…,Ci,j},為二維有限元矩陣,以橫縱坐標i,j確定矩陣中每一個元胞個體的位置.采用Moore型鄰域對初始時刻矩陣中在線用戶比例Dt0進行控制,在此基礎上構建基于用戶偏好的個體差異化元胞矩陣,作為模型初始化狀態,如圖3所示.

圖3 元胞矩陣示意圖

通過上述過程最終得到改進的網絡事件推演模型,通過對每次迭代后不同事件、事件不同狀態個體數量進行統計,繪制全過程元胞狀態變化曲線,展現不同事件推演結果、量化事件覆蓋范圍與整體傳播趨勢.

3 實驗

3.1 實驗環境

本文構建的模型開發工具為Matlab,運行環境為Windows 10 20H2版本64位操作系統,計算機采用2.30GHz,Intel(R)Core(TM)i7-10 875H處理器,16GB內存.

本文3.2、3.3節所使用的有效元胞矩陣大小設置分別為200×200和300×300,元胞偏好比例如2.1節所示,初始元胞在線狀態密度為Dt0=0.70.

3.2 模型事件趨勢擬合

基于本文提出的網絡事件推演模型,對網絡事件擴散趨勢進行研究.案例選取為2021年11月23日發生的網絡熱點事件:甲——“中演協公布網絡主播警示名單”,乙——“譚詠麟發生辟謠網傳消息”.模型轉換參數設置依次為:P01=0.001;P10=0.000 5;P12=0.2;P13=0.1;P2I=0.8;P2R=0.2;P3I=0.7;P3R=0.3;PConcentration=0.5.模型進行2 000次迭代推演,以求得長時間跨度下事件擴散趨勢.其中,事件甲包含社會與明星復合屬性,初始信息源為政府,爆發點數量為4;事件乙為單一明星屬性,初始信息源為明星個體,爆發點數量為1.兩事件同時放入模型中進行同步擴散推演,統計事件擴散過程中的累計傳播范圍,結果如圖4所示.

圖4 事件甲乙傳播推演曲線

為了驗證本文模型合理性,參照第三方輿情監測平臺“知微事見”所給出的事件七日聲量走勢曲線,對量化曲線進行歸一化,然后與本文提出的推演曲線放入同一坐標系中進行比較,結果如圖5所示.忽略前200次迭代結果作為事件擴散潛伏期,對不同類型事件處于同一網絡空間擴散過程進行推演.從圖5中可以看出,本文提出的模型表現出了較好的性能,曲線中前期事件處于爆發期,曲線變化幅度與整體曲線趨勢相比較大,模型推演與實際聲量走勢存在一定誤差,但針對不同類型事件同時期擴散程度對比指標表現良好.

圖5 事件擴散歸一化擬合曲線

3.3 辟謠情況推演

為了進一步驗證改進的網絡事件推演模型的有效性,對辟謠信息也進行了推演.辟謠信息擴散具有特殊性,即網絡謠言與辟謠信息發生時間點不同,各自可以被看作是單獨事件同時進行傳播,但辟謠信息的傳播可以對謠言分布區域產生覆蓋作用,受到辟謠信息影響的用戶觀點會產生變化.對于這種情況,本文提出的網絡事件推演模型需要作出具有針對性的調整,即將先發生的網絡謠言作為普通事件進行推演,辟謠信息延遲出現且在擴散過程中對于已有謠言傳播用戶有較大強度影響力.在謠言信息與辟謠信息整體存在競爭關系的基礎上,辟謠信息也作為謠言信息傳播的后續狀態,修改后能夠將謠言信息與辟謠信息放在模型中進行同步推演.實驗分為不同辟謠方式推演和辟謠時間差推演兩部分.辟謠信息轉換關系對應參數如表2所示,調整后的元胞狀態轉換如圖6所示.

表2 辟謠信息狀態轉換關系及參數

圖6 辟謠信息傳播狀態轉換圖

假設謠言為事件甲,辟謠信息為事件乙,甲傳播起始時刻先于乙.具體模型轉換參數設定P23=0.9,其余參數值與實驗3.2節相同,謠言爆發點數量為2,每次實驗模型進行1 000次迭代.以謠言初始傳播時間t0為參照,辟謠信息發布時間為推演開始300次迭代后.

辟謠方式分為當事人辟謠、第三方辟謠以及當事人和第三方混合辟謠3種.當事人辟謠表現為謠言初始傳播點發布辟謠信息,第三方辟謠表現為謠言信息與辟謠信息初始傳播點不同,混合辟謠為上述兩種辟謠方式共同作用.辟謠時間差實驗,以謠言初始傳播時間t0為參照,辟謠信息發布分別延后150、300、450次,模型迭代開始進行混合辟謠,統計每次迭代謠言覆蓋范圍并繪制曲線.通過模型推演,觀察不同辟謠時間差效果,結果如圖7、8所示.

圖7 辟謠方式比較結果

圖8 時間差推演結果

根據模型推演可知,圖7中所顯示的3種辟謠方式中,混合辟謠效果最優,第三方辟謠效果最差.通過具體模型推演過程中元胞矩陣各狀態分布變化可知,當事人辟謠過程以對受謠言影響區域進行覆蓋為主,能夠及時對謠言信息傳播產生影響;第三方辟謠過程主要對未受謠言影響區域進行保護,在與謠言傳播區域接觸過后再對其進行覆蓋,有效干擾時間延后,在及時干預謠言傳播方面表現不佳;而混合辟謠方式則結合兩種單方面辟謠方式的優點,既有對已受影響區域的覆蓋,也有對未受影響區域的保護,對于限制謠言傳播范圍以及數量具有最優效果.同時,圖8中通過控制變量對比不同辟謠時間差推演實驗部分的結果可以看出,采用混合辟謠方式可以及時對謠言擴散程度產生影響.謠言曲線的不同變化幅度以及峰值差異,體現出在辟謠信息發布前,謠言信息會隨著時間推移發類指數增長方式進行傳播.辟謠信息發布時間越晚,謠言信息傳播程度越難以進行及時控制.盡管推演后期謠言傳播均得到了抑制,但傳播峰值差異極大體現了謠言所造成的負面影響程度,因此,及時采取有效的辟謠方式,能夠有效限制謠言傳播量,使謠言造成的負面影響降到最低.

4 結語

針對目前在網絡輿情建模領域研究中存在的模型事件容量小、忽略個體偏好差異性的問題,本文提出了一種關注于網絡用戶個性化偏好差異性、可容納多事件共同傳播的網絡事件傳播推演模型.通過實驗,本文提出的模型對于不同類型事件共同擴散方面具有良好效果,并且模型能夠將謠言信息與辟謠信息放在模型中進行同步推演.本文對于事件類型劃分略顯粗糙,僅通過理論說明模型具有不同平臺通用性的問題.在未來的研究中,會收集更多真實數據對模型進行改進,發揮模型自身優勢以適用于更多網絡輿情應用場景.

猜你喜歡
元胞辟謠謠言
基于元胞機技術的碎冰模型構建優化方法
中國使館駁斥荒謬謠言
“最強辟謠101條”引發質疑
澄清事實 明辨是非——溫州新聞網辟謠舉報平臺建設之探索
當謠言不攻自破之時
基于元胞自動機下的交通事故路段仿真
基于元胞自動機下的交通事故路段仿真
謠言π=4!
謠言
基于元胞數據的多維數據傳遞機制
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合