?

政務新媒體互動內容分析及訴求回應研究*
——以人民網留言板數據分析為例

2024-03-02 03:08熊思斯
情報雜志 2024年3期
關鍵詞:議題框架話語

熊思斯 滕 宇 胡 珀

(1. 華中師范大學計算機學院 武漢 430079;2.國家語言資源監測與研究網絡媒體中心 武漢 430079)

0 引 言

隨著智媒時代的到來,數據民主化進程日益加速,常見的問政方式逐漸從現場座談問政、廣播電視問政等傳統方式轉向政務新媒體問政。新媒體問政方式相比傳統方式具有平臺渠道多樣、互動直接高效等優點,但同時也存在互動延遲的缺點。政務新媒體為民眾提供了更多訴求表達機會,逐漸成為民眾參與政治過程的重要途徑之一,對新型政民關系的建構以及推進政府治理能力的科學化、精準化和高效化發揮著重要作用。

當前,各級政府部門越來越重視政務新媒體建設,使其成為搜集民眾訴求、解釋公共政策、解決各類問題的常用平臺。隨著政務新媒體的廣泛應用及全國范圍內網絡問政的普及,由政民互動自然產生的數據給政府治理帶來了新的機遇和挑戰。一方面,政民互動數據為從“網絡問政”到“網絡理政”轉型提供了豐富的資源和必要的基礎條件,而對資源的深度理解、挖掘與應用將為提高政府的回應能力,提升政府的治理效率,調節國家社會關系發揮積極的作用;另一方面,因回應失語或回應遲緩所引發的消極社會影響頻繁發生,由訴求匯聚所致的信息碎片化、內容冗余化等現象也對廓清民眾期望與政務媒體績效間的關系提出了嚴峻的挑戰。而中部城市近年來發展迅速,武漢、鄭州、長沙先后突破常住人口1 000萬大關,成為我國城市規模劃分中的超大城市。人口的大量流入和產業的飛速發展使得超大城市的治理面臨更大的挑戰。

鑒于此,為了客觀了解我國政務新媒體在網絡社會治理中的角色及作用,本文以人民網留言板中武漢、南昌、長沙、鄭州四個中部省會城市2022年全年的市民留言內容和政府回復內容為研究對象,基于自然語言處理技術,對新媒體平臺的政民互動內容進行多維度的語義分析研究,從議題語義、情感語義等角度揭示民眾與政府在互動時的語言特征、內容特征及行為特征,為新時代民眾參政議政、管理者執政理政提供科學的參考依據。

1 相關研究

現有研究從不同層面和不同視角圍繞政民互動問題展開研究,旨在揭示政務新媒體環境下的民眾參與及政府回應的典型特征。其中,民眾參與指民眾借助政務新媒體平臺表達意愿和訴求。政府回應指在民眾參與的基礎上,政府部門就某議題做出回復,進行議程設置或解釋決策。聚焦民眾參與的研究包括:李莉等以某全國性網絡問政平臺民眾投訴信息為研究對象,采用量化研究方法分析了民眾參與議題的數量變化、分布差異及不同主體的訴求內容,重點討論了關于反腐類議題的投訴行為和特征[1]。徐緒堪等構建了基于BERT模型和Affinity Propagation算法的熱點追蹤框架,主要識別留言中的領域和各領域中的熱點話題[2]。胡吉明等基于Top2Vec主題聚類、TextRank抽取式摘要和結合覆蓋機制的Transformer生成式摘要,對政務微博互動內容進行挖掘[3]。聚焦政府回應展開研究的工作包括:常多粉等采集了人民網留言板近十年的環保話題留言內容,運用有監督機器學習和統計分析,從政府層級和機構類型維度分析了政府對環保議題回應的話語模式[4]。邵鵬等根據框架理論,基于次生災害防控的政務微博網絡話語進行分析,討論了政府網絡話語框架及其傳播效果[5]。師碩等根據框架理論,采用案例分析法,對政務微博與政府網站文本進行編碼與統計,分析了政府網絡話語的特征[6]。

在傳統的政治動員中,信息傳遞具有單向傳播性,而新媒體環境下的政民互動則具有典型的雙向交互性。Hassid等認為民政參與民政互動既可能有利于媒體議程設置,也可能激化社會矛盾[7]。翁士洪等分析了網絡參與對政府決策的影響機制,并通過大量實證研究,提出四種網絡參與下的政府決策回應模式[8]。孟天廣等采集了2010—2016年全國地市級政府發布的微博,統計分析了政務微博傳播的內容及功能[9]。杜明曦等對美國北卡羅來納州政府部門在颶風“佛羅倫斯”期間的2 121條推文與1 776條評論數據進行了內容分析,發現美國地方政府已具備運用政務新媒體進行對話的意識,能及時預警并幫助民眾了解災情[10]。Mossberger等從社交網絡和其他新媒體互動工具的使用角度展開了調研,也得出了與之類似的結論[11]。更多研究開始探究民眾參與和政府回應間的關聯性,代表性的工作有:許鑫等選取了1995—2015年間的300個網絡公共事件,通過案例分析方法研究了議題特征、民眾參與和政府回應間的關聯性[12]。李鋒等以人民網留言板為研究平臺,采集了2008—2014年間的發帖內容,從身份認同和政治價值取向等角度分析了民眾的表達模式與政府的回應模式[13]。孫宗鋒等以青島市市長信箱為實驗平臺,統計分析了民眾訴求與政府回應的變化趨勢[14]。孟天廣等采用人工標注的方法對留言議題進行分類,通過統計分析研究民眾訴求的時間和空間特性,最后基于回歸分析考察了多個因素與政府回應的影響模式[15]。李少溫等基于人民網留言板的60 797條數據,使用LDA主題模型聚類,通過秩和檢驗研究了民眾行為特征對政府回應的影響[16]。張敏等基于政務話語框架和BERTopic模型對政務短視頻標題進行主題挖掘,并結合話題與用戶行為數據進行關聯分析[17]。張渝等采用問卷調查法,對政府回應策略與公眾滿意度之間的關系展開定量分析[18]。

當前相關研究雖然已經取得了豐碩成果,但仍存在以下不足:a.對民眾參與和政府回應在語義層面的內容理解尚不充分,缺乏從議題、情感等角度開展的深度定量分析研究;b.關于民眾參與和政府回應在內容和行為交互層面上的模式關聯仍缺乏系統研究及大規模的實證檢驗。鑒于此,本研究采用基于預訓練神經網絡模型RoBERTa的零樣本分類,深度挖掘留言和回復內容,結合話語框架理論從文本語義特征的角度來匹配不同的話語框架,揭示了政民互動中的語言特征、內容特征和行為特征,為政民互動內容分析和訴求回應研究提供了一種新的視角。

2 研究過程與方法

2.1 數據采集與處理

在選擇數據來源時,本文考慮以國家中部崛起戰略覆蓋的六座中部省會城市為初始研究對象。根據人口數據顯示武漢市城區常住人口已超1 000萬邁入超大城市行列。因此,在此時期研究武漢的政民互動內容具有典型意義和研究價值。為綜合考慮不同類型城市的覆蓋性和代表性,本文根據中國城市統計年鑒數據,對六座城市各項數據進行了聚類分析,得出的結果如圖1所示。

圖1 城市統計年鑒數據聚類

與國家統計局定義的城市規模接近,六座城市整體的數據也可劃分為三個類別,超大城市級的武漢,特大城市級的長沙、鄭州和I型大城市級的南昌、合肥、太原。因此本文選取了具有代表性的武漢、南昌、長沙、鄭州四座城市作為分析對象,研究其人民網留言板數據的互動特征。本文的數據來源是人民網留言板,通過編寫網絡爬蟲采集了2022年全年武漢、南昌、長沙、鄭州等四個中部省會城市的留言內容。其中公眾留言共計36 391條,政府回復共計31 951條,占留言總數的87.8%。為了探究影響政府回應的主要因素,我們分別采集了留言對象、留言類型、留言領域、留言內容、留言標題、留言時間、回復組織、回復內容、回復時間等字段信息。

2.2 研究方法及選擇

基于36 391條留言文本數據,本文采用自然語言處理技術,先對文本進行預處理和數據清洗,然后對文本進行情感分析,挖掘其中包含的情感特征。從議題語義角度,使用Sentence-BERT詞嵌入并基于社區發現算法挖掘文本中隱含的議題語義。為了進一步識別文本內容相關的話語框架,本文從數據中抽取關鍵詞和最長公共子序列,編碼每一類話語的標簽,采用RoBERTa模型進行零樣本分類,共從留言和回復數據中歸納出留言的四種典型話語框架及回復的三種典型處理類型及典型話語框架。

情感分析方法大致可分為兩類:一類基于傳統情感詞典,另一類基于機器學習。近年來,隨著大規模預訓練模型的發展,其對文本語義特征的挖掘性能獲得顯著提升?;诖?本研究采用基于預訓練模型的情感分析方法,使用ERNIE模型提供的開源API進行情感分析。

ERNIE是基于知識增強的多范式統一的預訓練框架[19],其中,自回歸和自編碼網絡被融合在一起進行預訓練。該模式在語言理解、語言生成及零樣本學習等任務上均獲得了優異表現。

RoBERTa模型是Facebook與華盛頓大學推出的具有良好性能的預訓練模型[20]。鑒于該模型在挖掘文本語義上的顯著優勢,本研究采用零樣本學習場景下的RoBERTa模型,利用語義特征和句子相似度對話語框架進行分析,其優點在于針對不同數據無需重新擴充詞典,泛化性能更好,而且基于語義向量的相似度分類模式也能更好地利用大規模預訓練模型的內在能力。

2.3 研究變量

為了從多個不同維度揭示政務新媒體互動內容的典型特征,我們對留言和回復內容進行基于自然語言處理的文本分析,從語言特征、內容特征和行為特征等三個方面展開研究,并針對民眾留言和政府回復定義了如下研究變量。

①針對留言語言特征的變量:

V1:情感傾向。對留言進行情感分析,提取出留言中包含的情感傾向,具體可分為負面、中性、正面三個大類。

V2:留言話語框架。已有研究將民眾訴求表達分為情感和理性兩類或無價值取向話語、賢能話語和民主話語三類[4]。本文從情感和法理角度將留言內容的話語框架歸納為如下四類,包括抗爭框架、弱者框架、個人權益框架、社會影響框架。其中,弱者框架表達自身弱勢困難處境,以求獲取領導關注,如“懇請咱們人民政府為我們做主”;抗爭框架表達對規則的失望不信任,發泄自身情緒以獲得關注,如“這到底歸誰管,什么時候管?”個人權益框架則指根據法律法規維護權益,如“該公司違反了《消費者權益保護法》,訴求內容是退賠費用”;社會影響框架是以社會群體利益和影響來說服管理者,如“嚴重影響祖國花朵的健康成長”。上述四種留言話語框架具體分類圖2所示。

圖2 留言話語框架類型

②針對留言內容特征的變量:

V3:留言領域。主要指民眾留言涉及的議題領域,分為城建、環保、交通、教育、金融、就業、旅游、企業、三農、體育、文娛、醫療、政務和治安等14個類別。

③針對留言行為特征的變量:

V4:留言類型。主要指民眾留言的訴求類型,分為建言、咨詢和投訴/求助三類。

④針對回復行為特征的變量:

U1:回復積極性。為同時覆蓋回復行為的速度和效率,本研究定義D為回復時間與留言時間之間的天數差值,單位為天,并依據D的范圍將回復積極性分為三類,具體定義如公式(1):

(1)

編碼-1、0、1分別代表7天之內回復、7~15天回復和15天之后回復。

U2:回復處理類型。為了更深入地挖掘文本中隱含的行為特征,本研究通過深度學習技術對回復內容進行自動分類,將回復處理類型具體劃分為三類:整改、協商和轉辦。其中,整改指回復組織與相關單位調查情況后做出整改,如“建設局工作人員現場核查并督促整改”;協商指回復組織為糾紛雙方搭建溝通平臺,通過協商調解的方式解決糾紛,如“市場局第二市場監督管理所立即聯系某公司,為您搭建友好溝通協商平臺”;轉辦指留言事項不屬于回復組織管轄區域或管轄范圍,需要留言群眾進行轉辦,如“鄂州紅蓮湖不屬于我區管轄范圍,建議您向該地所屬管轄的相關部門進行反饋”。上述回復處理類型具體如圖3所示。

圖3 回復處理類型

⑤針對回復語言特征的變量:

U3:回復話語框架。已有研究將政府回應公眾訴求時采用的話語框架按情感色彩和法治程度兩個維度分為描述話語、共情話語、規則話語和混合話語四種類型[4],具體如表1所示。描述話語主要指對民眾訴求進行事實層面的程式化回應,如“經核實,該處路口已有電子警察進行執法?!惫睬樵捳Z主要表達對民眾訴求的理解、關注和重視,如“您擔心環境污染問題的心情可以理解,請您放心?!币巹t話語主要指政府根據具體法律法規或政策文件進行回應,如“按照《信訪工作條例》屬地管理規定,建議您向江夏區相關部門反映?!被旌显捳Z則指在回復過程中聯合使用了多種話語框架。由于政府混合話語的占比過高,導致實驗數據區分度較低,因此本文不設混合話語這一分類,而根據回復話語框架的傾向分為共情話語、描述話語、規則話語三類。

表1 回復話語框架類型

3 研究結果

3.1 數據統計

本文采集了2022年全年中部省會城市(鄭州、武漢、長沙、南昌)的留言-回復數據,數據集基本統計如表2所示。

表2 留言-回復基本數據統計

3.2 語言特征分析

在挖掘政民互動內容的語言特征方面,本文對不同城市民眾留言和政府回復的語言特征進行了分析。

3.2.1民眾留言語言特征

表3呈現了不同城市留言的情感傾向分布情況,其中負面情感留言占比均超過80%。

表3 留言情感分布

表4呈現了不同城市留言話語框架的分布情況,占比由高到低依次為弱者框架、社會影響框架、個人權益框架和抗爭框架,民眾留言的話語框架使用存在著顯著差異性。弱者框架話語占比在四個城市中均顯著更高,這反映出留言民眾更傾向于將自身視為弱勢群體,并希望通過強調弱勢地位來獲取社會關注和支持。弱者框架也有助于激發社會關注和支持,政府和社會各界則應該重視弱勢群體的聲音和訴求,積極鼓勵和支持他們爭取合法權益,并采取具體措施來促進社會的公正和平等。

表4 留言話語框架分布

3.2.2政府回復語言特征

表5呈現了不同城市政府回復話語框架的分布情況,其中描述話語和共情話語在不同城市中占比較高,規則話語相對較低,這體現了政府在選擇回復時所使用的語言傾向,一方面傾向于使用描述話語塑造政府客觀、統一形象,另一方面適當使用共情話語來幫助政府部門拉近與民眾間的溝通距離,提升民眾的滿意度。其中,兩者占比的差異性也反映出政府對民眾訴求的態度和方式。使用共情話語的政府部門體現了對民眾的感受和需求的重視,通過情感連接增強了民眾的信任和支持,而使用描述話語的政府部門體現了對事實和邏輯的重視,通過理性的表述傳達了事件處理結果。建議政府為留言板增設回訪和滿意度的機制,為研究政民互動提供更立體的數據,從而得到有雙向數據支持的訴求回應模式,采取適當回應策略,提升民眾滿意度。

表5 回復話語框架分布

3.3 內容特征分析

表6呈現了不同城市留言領域的分布情況,通過統計分析可以發現:各個城市排名前5的熱門領域均為城建、交通、教育、就業和企業,僅在鄭州市數據中,環保取代了企業成為熱門議題。這與城市統計年鑒數據相吻合,鄭州全年的工業顆粒物、二氧化硫、氮氧化物排放量和細顆粒物平均濃度等多項數據均處于前列。值得注意的是:長沙城建領域留言相對較少,就業領域留言較多,其原因在于長沙城建用地面積顯著低于其他三市,2022年長沙人口增量位居全國第一,增長的常住人口帶來的就業壓力導致就業領域議題更受關注。通過計算教育領域留言比例與城市年鑒教育有關數據的皮爾遜相關系數得到表7,其中雙一流高校和教育支出與留言比例呈現較強的相關性。民眾留言內容特征的各項領域內容與城市統計年鑒相應數據存在關聯性,能夠客觀反映各城市不同領域存在的問題。

表6 留言領域分布

表7 教育領域留言比例與城市數據皮爾遜相關性

盡管政府留言板預設了14種留言領域類別,但現有方法對民眾留言的分類準確度并不理想,且無法反映具體議題的使用頻度。因此,本研究基于sentence-BERT模型[21]對基于語義相似度聚類后的各類進行命名實體識別,從中獲取每個類中出現頻率最高的實體,使用TSNE降維后的聚類結果如圖4所示,根據聚類各簇最長公共子序列和三元組,最終歸納出熱門留言領域的典型議題如表8所示。

表8 聚類熱點議題-實體表

圖4 留言實體信息聚類結果三維圖

通過分析內容特征,可以總結出以下幾點建議:第一,政府部門應當從議題中捕捉關鍵實體,迅速定位到關鍵問題并歸因;第二,對于熱點議題和高頻出現的實體,政府部門可將相似留言合并處理以合理規劃優先級、提升辦事效率;第三,現有留言領域的分類易混淆,如共享單車議題的留言往往也會同時出現在城建、交通和企業等領域,說明現有領域劃分對民眾而言較難辨別,領域設置不清晰、相互存在交叉不僅影響民眾問政,更影響政府辦事效率。在熱門留言領域下設置子議題、留言板提示各領域留言的詳細劃分范圍說明或使用自然語言處理手段挖掘內容中隱含的議題語義是提升政民溝通效率的可行方式。

3.4 行為特征分析

表9呈現了不同城市民眾留言行為特征的分布情況,武漢和長沙呈現出更相似的分布特征,投訴/求助比例明顯較高。本文對投訴/求助類型留言占比和城市統計年鑒數據進行了相關性分析,結果如表10所示,投訴/求助類留言占比與人均地區生產總值之間存在強正相關性。根據城市統計年鑒數據,武漢與長沙人均地區生產總值在研究對象中分列前二,隨著城市的較快發展,產業結構和經濟活力帶來的糾紛和沖突更多,這也為政府部門的管理者提出了更高的要求,人均地區生產總值較高的城市需要側重對于民眾投訴/求助類的處理。

表9 留言類型分布

表10 皮爾遜相關系數

表11呈現了不同城市政府回復行為特征的分布情況,政府回復行為在時效上呈現出占比由高到低的典型趨勢,依次為15天后回復、7~15天內回復和7天內回復。觀察發現,鄭州政府留言量龐大且回復積極性較其他城市明顯較高,其原因在于鄭州政府將人民網留言板平臺鏈接納入了鄭州市人民政府官網的互動交流板塊,而長沙、南昌兩座城市則沒有,武漢政府官網對人民網留言板平臺進行了宣傳推廣,同時也提供了長江網城市留言板平臺作為另一選擇。由此可見:政府部門一方面應當考慮各政務新媒體平臺的職能和特色,更好覆蓋民眾需求;另一方面應當處理好多平臺間的分工合作,根據平臺民眾訴求量適當分配資源。

表11 回復積極性分布

表12呈現了不同城市政府回復行為特征在處理類型上的分布情況,不同城市政府回復處理類型均以整改為主,武漢政府回復處理類型中協商比例較高,反映了武漢民眾留言中涉及第三方單位的議題較多,這意味著政府搭建平臺調解糾紛的能力將面臨更多考驗,武漢政府在長江網武漢城市留言板中已經推出了面向法檢及其他單位直接留言的渠道,為暢通政民互動渠道,減少溝通成本做出了積極嘗試。南昌政府的回復處理中轉辦比例較高,建議政府考慮打通部門壁壘,提升政民溝通效率,或者廓清責任歸屬,在網站中設置留言地區、部門劃分提示以引導民眾正確留言。

表12 回復處理類型分布

3.5 關聯分析

本研究還利用卡方檢驗和列聯表分析方法探究了不同特征間的潛在關聯性,具體如表13所示。

表13 卡方檢驗p值結果

卡方檢驗的結果顯示,民眾留言的內容特征對政府回應的影響最大,留言的語言特征對政府行為特征并無明顯影響。不同的議題領域往往需要政府采取不同的行動,從而在一定程度上會影響政府的處理方式和處理效率。具體而言,對教育、醫療、文娛等留言議題領域,政府部門往往采取協商的處理方式,三農、治安等政府直轄的議題則通常采取整改為主的方式。由此可見,當前政府回應行為主要關注留言的內容特征,相對較少關注留言的語言特征和行為特征。因此,系統研究政民互動內容的話語框架等語言特征,為網絡問政渠道完善行為特征的測度——如民眾滿意度、點贊數等,揭示這些特征并針對不同語言特征和行為特征采取不同的回應方式,將為政府部門提升回應能力,提高治理效率提供依據和抓手。

4 結論與建議

隨著政府的數字化轉型,數字政府已成為提高國家治理能力現代化的重要途徑,如何有效獲取并利用大量政民互動數據逐漸成為當前治理生態優化與創新的核心驅動力。本文基于2022年人民網留言板中36 391條政民互動內容數據進行了分析,綜合運用定量分析法和基于數據驅動的自然語言處理方法,結合政府回應話語框架類型學研究基礎,從語言使用、議題語義和情感語義的角度綜合揭示了政民互動內容的語言特征、內容特征和行為特征及其關聯性,并得出相應觀察或建議:a.民眾留言在語言特征上表現為負面情感和弱者框架類型占比較多,投訴/求助類留言占比與人均地區生產總值之間存在強正相關性,在內容特征上,城建領域的留言數量占大多數,各領域留言頻次與城市統計年鑒相關數據存在關聯,其中的熱點議題有拆遷、小區、建房等,在行為特征上的表現為投訴/求助類行為較多;b.政府回復在語言特征上傾向于使用共情話語和陳述話語,從行為特征角度,整改在各類處理類型中占較高;c.政府回復的行為特征與民眾留言的內容特征存在著潛在關聯性,其中政府行為的處理類型受民眾留言的內容特征影響最大。

本研究將為地方政府科學開展新媒體問政提供依據和支持。第一,建議政府部門采取扁平化的網絡問政模式,提供更多面向相關單位的留言途徑,暢通政民互動渠道,減少溝通成本,提升民眾參政的體驗感。第二,建議政府部門在處理留言時捕捉熱點議題,在留言板平臺熱門留言領域下設置子議題或提示各領域留言的詳細劃分范圍說明,便于民眾操作,減少跨區域/部門辦理和重復辦理。第三,建議政府為留言板增設點贊、回訪和滿意度的機制,為研究政民互動提供更立體的數據,從而得到有雙向數據支持的訴求回應模式,采取適當回應策略,提升民眾問政滿意度。

猜你喜歡
議題框架話語
框架
現代美術批評及其話語表達
例談群文閱讀中議題的確定
廣義框架的不相交性
科學議題歡迎君子之爭
WTO框架下
一種基于OpenStack的云應用開發框架
API China & PHARMPACK & SINOPHEX關注制藥企業環保議題
話語新聞
話語新聞
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合