?

大數據新聞的創新與困境

2021-01-16 21:58
湖南師范大學社會科學學報 2021年5期

萬 穎

隨著大數據、云計算等技術的發展,我國的數據新聞逐步轉向大數據新聞。在這個過程中,數據對象從結構化走向非結構化,新聞功能從單一的信息呈現向提供預測、幫助決策轉變,產品形態從文本為主到APP或數據庫平臺為主[1]。新冠疫情中以實時疫情數據地圖為代表的大數據新聞在新聞事件的梳理呈現與分析研判方面表現出獨特的優勢,也成為人們理解現實世界的重要窗口。關于大數據新聞的內涵,一種典型的理解是——一種依托于大數據技術與大數據分析思維的新聞報道。它承襲精確新聞——計算機輔助新聞——數據庫新聞——數據驅動新聞發展而來[2],甫一出現便受到新聞媒體的追捧與廣大用戶的青睞,但是其“阿克琉斯之踵”也備受爭議。值得我們思考的是何種創新讓大數據新聞展現出強勁的生命力?又因何困境,它總是充滿交鋒與爭議?面對被技術潮流裹挾的社會現實,我們應該如何認識大數據新聞?

一、生命力的由來:大數據新聞的創新

在數字文化轉型的語境中,大數據新聞已然成為社會新寵,并顯示蓬勃的生命力。其生命力從何而來?我們應以歷史的眼光去考量,追問相較于傳統新聞,大數據新聞產生了哪些變化,又具有何種新意。

(一)數據化敘事:從“數據”旁證到數據發聲

傳統新聞常常沿著故事化敘事的邏輯展開,數據(此時的數據一般指的是統計意義上的數字)在其中作為敘事的輔助工具對新聞事件的演進以及意義闡明進行旁證。大數據新聞依然以敘事為中心,只是敘事主體變成了數據,講述的故事也由數據驅動。換言之,大數據新聞在數據維度上反映現實并建構現實。大數據新聞中的“數據”不再限于基于純粹的數字統計量化數值的硬數據,也包括文字、音視頻、要素關系等不能簡單由數值表達的質化性質的軟數據[3]。大數據新聞的“數據發聲”主要表現在以下三個方面:第一,數據成為敘事內容的重要來源,新聞記者致力于通過數據挖掘與分析來尋找新聞線索、敲定選題、理清新聞事件的發展脈絡,并憑借數據來抽象事實和提煉事實;第二,作為核心的敘事話語,數據被再結構化,成為主體性的新聞語言,宏觀敘事成為常見的敘事模式;第三,數據間的邏輯關系成為新聞的敘事語法,新聞更多呈現立體式的敘事結構。滲透著數據量化觀念的大數據技術構成了大數據新聞的底層邏輯。

(二)可視化呈現:從文字敘述到圖像交互

在傳統新聞的實踐中,文字始終是承載新聞信息的主體,圖片與數據只是文字的注腳。而在大數據新聞中,數據是敘事語言,可視化是數據敘事的支持手段,推動新聞敘事從文字中心走向圖像中心??梢暬且环N訴諸視覺語言來呈現并傳播信息的方式,為用戶從海量且碎片化的信息海洋中串聯、提取信息鏈條,拼湊出完整的新聞畫卷提供了一條簡易路徑,有利于用戶匯聚信息,認知復雜情境。大數據體量大、價值密度高且紛繁龐雜,難以傳達出清晰且有價值的信息,而可視化技術將數據轉換成圖形或者圖像,并進行交互處理,將數據的內涵直觀地呈現出來,滿足了讓數據“開口說話”的要求。有學者曾將新聞可視化產品籠統地概括為靜態信息圖、交互式信息圖和動態信息圖三種形態[4]。動態信息圖是指動畫短視頻,這種形式在兩會報道中常常被使用。交互式信息圖由用戶驅動敘事,能夠展現數據的不同側面。只有用戶真正主動地參與到數據的分析與解讀中,才可能有完整意義的新聞敘事產生[3]。交互形式的可視化讓大數據新聞一改傳統新聞的“高冷”姿態,構建了“參與式文化”的情境。用戶不僅能通過點擊選擇按鈕閱讀最感興趣的信息,從不同角度理解數據,也能在交互閱讀中上傳個人數據,成為新聞的數據源。在可視化的“視覺框架”中,數據被重新排列組合,具有關聯性的數據被整合在一起,獲得了新的闡釋語境。概言之,可視化通過圖像敘事與交互敘事來呈現數據間的關系與數據分析的結果,創造、表征和傳遞意義。

(三)預測性報道:從事實挖掘到前瞻預判

長久以來,“新聞是對新近發生事實的報道”這一觀念深深烙印在新聞業中。在這種認知的引導下,記者被要求注重事實勘探,承擔起“船頭瞭望哨”的職責和使命。受限于現實條件,傳統的新聞報道主要是對已經發生或者正在發生的事情的記錄、梳理與闡釋,預測性新聞是其中的稀有品。而且,此時的預測性新聞多是建立在記者的經驗積累與新聞敏感基礎之上的直覺判斷,科學性與客觀性經常遭到質疑。

大數據技術加盟新聞業后,預測性新聞逐漸成長為一匹“黑馬”。維克托·邁爾-舍恩伯格在《大數據時代:生活、工作與思維的大變革》中指出:“建立在相關關系分析法基礎上的預測是大數據的核心?!盵5]在大數據技術的支持下,新聞從業者能夠通過數據挖掘與關聯分析對新聞事件的發生及其發展變化的規律進行預判。有學者指出,大數據在預測方式、時間與內容上重構了傳統預測性新聞的向度[6],超越了人類的經驗范疇,它以算法模型為基礎,預測是建立在對全樣本數據的相關性分析之上的。事實上,交通出行、經濟發展、賽事預判、疾病預防、天氣狀況等領域已經成為當下預測性新聞報道的“聚居地”。大數據的預測性有利于提升新聞媒體的環境監測能力,與風險社會的決策需求相契合,能夠幫助民眾進行風險規避,推動社會治理。從疫情中的大數據新聞實踐來看,預測性報道的生產也意在通過呈現事件的走向來引導并敦促人們改變自己的行為,紐約時報的《用圖表告訴你冠狀病毒將會惡化多少》一文,就引用流行病學家Ashleigh Tuite的話清晰地闡明了其目標——暗示人們去改變自己的行為,從而拉平模型的曲線[7]。

二、內在矛盾:大數據新聞的困境

大數據新聞在數據敘事、可視化與預測性方面表現出巨大潛力的同時,也存在其固有的軟肋。大數據自誕生起就是一個充滿爭議的對象,既有人把它當作“神話”來宣揚,也有人認為它有與生俱來的“原罪”。當大數據技術滲透新聞生產和傳播的各個環節時,我們不得不以爭議為起點去反思它所面臨的困境。

(一)數據呈現的背后:必然性的假象

大數據預測超越個體的直覺經驗,建立在海量數據與算法模型之上,由其呈現的規律常常被人認為是“自動”形成的,進而被視為一種必然的結果。實際上,必然性是一種假象,它代表的是一種或然的可能。

眾所周知,大數據的預測建立在數據分析的基礎上,而非結構化的原始數據必須經過結構化才能成為可分析的數據。成為結構化的數據,需經過篩選、清洗、處理等環節,并由算法模型來完成。然而,算法模型的運行都是由人操作的,包含著人的主觀意志,那么數據所呈現的也不過是一種帶有主觀色彩的結果,而主觀性與必然性顯然是矛盾的。并且,數據往往存在于特定的語境之中,也只有語境中的數據才具有價值。每一種語境都關聯著特定的社會文化背景,強調了意義發生的底層規則或外部環境,確立了闡釋的邊界,并作為一種生產性的元素參與意義的直接建構[8]。而大數據中被記錄與測量的數據常常是孤立的原子個體,缺乏與原初語境的有機聯系,背后的復雜性與矛盾性被消解。當它被置換、挪移、重新再結構化,拼湊在新的文本語境中時,其現實的表征能力已經大打折扣,由此推測出的結果也絕非必然。

況且,大數據預測的底層邏輯——相關關系,天生就帶有偶然的性質。兩個變量的相關可能只是表面相關,實際上并沒有必然的聯系,它們之所以產生一種相關的假象其實是中間變量在起作用。大數據的相關性挖掘基于海量數據的共同指向性,這種共同指向忽略了許多個性的因素,容易帶來過于武斷或簡化的誤判。同時,大數據遵循的歸納邏輯是經由過去的數據痕跡來推演未來,但未來原本就是開放的,是不斷發展變動的,我們根本無法用一種規律模型去精確計算。

大數據預測指向的是一種概率性事實,呈現的只是一個參考答案,既會有誤差,也會有風險。大數據新聞一貫只將數據結果呈現出來,數據獲取的手段和過程基本缺席,因而其傳遞的新聞信息常常是不對稱的,那么,隨之而來的預測是否會帶來信息風險?在大數據思維的引導下,基于新聞人物過往的行為軌跡來判定其接下來的行動,否認個體的自由意志,是否會形成新的媒介審判?大數據預測可能會影響公眾認知與公共決策,而基于不確定的相關預測來進行判斷,是否會激發不必要的社會恐慌?因此,面對大數據所帶來的預測結果,我們還是需要一種質疑精神,去分辨它們所呈現的究竟是一種信號,還是一種噪音。

(二)數據與人:回歸人本邏輯

新聞傳播體現了人對自身的生存狀態和生存環境及其變化發展的關注,不論是報道新近發生的事實,還是傳播有關新近發生的事實信息,新聞的中心都應是人[9]。換言之,新聞的根本邏輯是人本邏輯。然而,在大數據新聞中,作為科學技術手段的大數據“凌駕”于人之上,漸漸形成了一種數據中心主義,數據邏輯成為被追捧的對象。數據邏輯最早來源于古希臘哲學家畢達哥拉斯提出的“萬物皆數”理念,大數據將它推崇到極致,認為萬物皆可被抽象還原為數據并能被數據表征。

在胡塞爾看來,事物的側顯是無窮無盡的,不過,一旦它們走向數據化卻顯然會變成有限的。數據化的壓縮不可避免地要遮蔽與舍棄無法被量化的社會背景、個體情感與生命意義。新聞中有血有肉的生命存在被消解,時而出現的“曖昧話語”被驅散,事件存在的社會情境被裁剪,每一個具體的人及事件只能被籠統地認知,人及其社會關系被簡單化、機械化和物化。大數據新聞對新聞核心環節——采訪——的輕視與拋棄同樣加速了數據邏輯宰制地位的到來。從采訪整個過程來看,采訪者在還原事實的同時也在對一個人進行探尋,被采訪者的生活背景、心路歷程與個性特征都會被高度重視,正如杜駿飛所言,“采訪不僅是對事的還原,也是對人的抵達”。人的“具體性”在新聞采訪中被展現得淋漓盡致,新聞稿件的“血肉”也源于此。然而,大數據新聞強調從數據中挖掘信息并分析信息,這一行為在某種程度上將人自主地認識世界的權力移交給了數據,人們開始自然而然地相信被數據“中介化”的事實。但這種事實往往是被抽象、簡化的,其中人的差異性與具體性被抹殺,生命歷程與人生遭際無法被體察,新聞的人文關懷也很難實現。

數據邏輯有一種基本預設——數據是客觀中立且獨立存在的。把數據視為脫離人的存在物是一種對數據的烏托邦想象。數據從誕生之日起就攜帶著人的基因,哪些數據被收集、被選入、被呈現也都是由人在操控。數據的意義也不是自發形成的,它需要依靠人的解釋才能被揭示出來。大數據新聞生產中必不可少的四個環節——數據的獲取、處理、分析與呈現都有人的參與,人們通過對數據指標、計算模型以及數據解釋等植入自身的價值訴求來左右大數據新聞收受主體的收受活動,進而影響其認知與行為。只是這一系列勞動都被大數據的基礎設施——數據庫、分布式平臺與云計算所遮蔽。由此可見,大數據新聞并非如其標榜的那樣自主、獨立地運行并與價值無涉,而是深刻地潛藏著人的主觀偏好、認知圖式與價值模式。

事實上,數據與人的關系更本質上也是技術與人的關系。蘭登·溫納在《自主性技術——作為政治思想主題的失控技術》一書中提醒我們要警惕人類對技術的“反向適應”,如果我們總是透過“數據投影”去認識世界,或許會逐步陷入喪失主體性的危機之中——將數據所中介化的事實當作客觀現實,失去辨識本質領域的沖動,批判質疑的能力減退;逐漸習慣大數據新聞的敘事邏輯與呈現方式,思維與認知路徑與算法趨同,進而走向異化;迷戀于直觀認知,變得懶于思考,從而陷于探及表面真實的虛假滿足之中。

(三)數據新聞的局限:硬與軟的沖突

有研究者指出,“數據新聞是一種社會科學研究的論證”[10],冷靜客觀、公正無私、不偏不倚地通過數據語言、定量分析并以可視化形式直觀呈現新聞信息,擅長事實說明,非常接近邁克爾·舒德森在《發掘新聞:美國報業的社會史》一書中談及的“信息模式”的新聞報道。例如,澎湃美數課在《763例確診患者的故事,還原新冠病毒向全國擴散的路徑》中以流行病學的傳播鏈條進行分析,通過數據圖表展示武漢封城前后確診患者流動的路徑,清晰直觀地呈現出疫情初始階段病毒的傳播軌跡[11]。

然而,新聞不只是“堅硬”的技術寫作,像旁白一樣對事實進行冷靜客觀地陳述,它更需要“柔軟”的情感注入。情感是人們認知的重要手段,能夠增進新聞故事的可理解性,進行意義的傳遞。新聞擔負著實現人文關懷與價值引導的責任,新聞媒體也在對公民進行情感教育,喚起他們的同理心,創造哈貝馬斯所言的“我們—他人”視角,提供對群體的公共關切,促成群體理解,推動公共對話,凝聚社會共識,并進一步影響人們的判斷與決策,讓人們做出利他行為。然而,大數據新聞在情感注入方面明顯乏善可陳,新聞媒體是無法通過冰冷的數據來培育公共情感的。突發性公共衛生事件中人口的死亡、各地前赴后繼支援的醫護人員、不斷被運送的醫療物資在大數據新聞中變成了一連串龐大的數字,等不到病床的焦急、離開人世的悲傷、滿懷感恩的捐贈都被包裹在數據的“堅硬”外殼之中。這時,數據的“客觀”或許已經變成了平靜的疏離與漠不關心的忽視。在強調用戶體驗與共情的社交媒體時代,情感的共鳴能夠讓公眾產生分享的欲望,進而推動數據新聞的社交化傳播[12]。但大數據新聞以數據為中心的科學實證邏輯往往給人一種冷眼旁觀的疏離之感,無法滿足新聞讀者的情感需求,不能喚起他們的共情,影響了大數據新聞的二次傳播。

總之,從以上分析可以看出,大數據新聞的內在不足造成了其發展的困境,這既源于大數據新聞本身的特性,也與數據特性與新聞要求之間存在的裂隙與張力有關。那么,面對這種困局,我們自然需要進一步追問:怎樣正確看待還處在發展過程中的大數據新聞呢?

三、認知路徑:對大數據新聞的深度思考

大數據新聞的困境其實也呈現了傳統與現代、科學與人文、工具理性與價值理性之間的張力與沖突。為了厘清這些矛盾,我們需要借助米爾斯提倡的“社會學的想象力”,從社會與歷史的視角對大數據新聞進行全景透視與深度反思,從而錨定其在當下的位置并窺探其未來的發展方向。

(一)作為創新產品形態的大數據新聞

作為一種創新的新聞形態,大數據新聞是依托大數據技術,以數據為主體內容,以大數據思維為分析手段,以可視化形式來呈現的新興報道形態。它與傳統新聞之間存在差異,最關鍵的便是二者關于科學與人文的不同取向?!叭f物皆數”“量化一切”的數據觀滲透在大數據新聞中,促使其向科學與量化轉身。而傳統新聞希望通過報道事實實現人文關懷,反思社會發展,承襲了文學的“人學”根底,具有濃厚的人文傳統。不過,雖然原初取向不同,大數據新聞與傳統新聞之間卻并非取代與被取代的對抗關系,而是補充完善、相互促進的共存關系。大數據新聞對傳統新聞的補充完善表現在新聞生產傳播的多個環節。從生產前端的新聞源獲得來看,傳感數據是大數據新聞數據信息的重要來源。傳感工具依據當下事實創建數據,更能反映目前的事實,有助于推動大數據新聞向著實時報道的方向發展[13],同時其收集到的依靠傳統人力無法看到或聽到的信息能夠提供新的新聞線索與新聞選題。在新聞敘事方面,大數據新聞擅長宏觀敘事,能夠清晰直觀地展現事物的歷史沿革、規律、變化、對比及整體趨勢??梢暬暮啙嵵庇^與交互性還彌補了傳統新聞在清晰傳達意義與參與性方面的不足。

作為一種創新產品,大數據新聞有自己適用的范圍與擅長之處,但也有“鞭長不及”的地方。比如,在不能通過數據簡單展示的地方,大數據新聞往往顯得捉襟見肘。學者丁伯銓指出,數據表現不了復雜的事實內涵,如各種力量的暗中博弈或幕后交易[14]。而傳統新聞能夠捕捉微觀的人與事,善于表情達意、“見微知著” “以小見大”。同時,文字的會意性決定其有更強的表達能力,許多曖昧復雜的事實與意義往往藏匿其中。大數據新聞與傳統新聞都是新聞業的支脈,二者共存,整個新聞業才能枝繁葉茂。由此可見,大數據新聞與傳統新聞的某些優勢與劣勢恰好形成對照,這也推動雙方去“精進自我”,不斷創新。為了實現情感喚起,數據可聽化的聲音實踐便是一典型例證[15]。

(二)作為技術賦能產物的大數據新聞

大數據新聞隨著互聯網、物聯網、大數據、云計算、可視化等技術的發展與應用演化而來,是一種技術賦能的產物。新技術的運用為其帶來了數據化敘事的新格局,革新了新聞的表現形式,使其從抽象的文字文本走向直觀的圖像文本,并打破了新聞的現在時態,將新聞的價值延伸至未來。但從發展形勢來看,我國的大數據新聞目前還以描述性報道為主,存在著同質化的沉疴以及數據分析工具欠缺、數據積累與開發不足的困境,并對模板的依賴比較嚴重,又或者叫好但不賣座,偶爾還會從“新聞”淪為“舊聞”。

技術發展遵循著一種循環邏輯——為解決問題采用新技術,新技術引發了新問題,然后采用更新的技術去解決問題[16]。作為技術賦能產物的大數據新聞的發展也遵循此邏輯,這意味著大數據新聞未來必須以“技術之力”突破“技術掣肘”。

從技術發展的態勢與格局來看,人工智能與5G技術在新聞業中的深度應用將進一步強化大數據新聞的創新活力,幫助其破解當前存在的某些困局。李本乾指出,如果未來能充分應用人工智能技術,用人工智能的方法抓取數據、清洗數據、分析數據并進行內容推送,大數據新聞的時效性將得到改善。隨著數據資源的積累、數據挖掘與分析技術的升級,目前尚難以完成的預測性報道與解釋性報道或會有后續的突破[17]。5G技術的蓬勃發展也將為大數據新聞注入新的活力。5G大連接的特征將拓寬數據采集的范圍,進一步推動數據積累與開發;其低時延的特性將提升數據傳輸的及時性,從而提升新聞的時效性;5G帶寬環境下,更快的上傳下載速度、更智能的算法將為視聽數據帶來全新的生產方式和豐富多彩的產品形態,從內容、形式和復雜度上極大解放現階段受制于帶寬和網速的短視頻和5H類型的大數據新聞作品[18]。5G技術還將推動AR、VR在新聞中的運用,使得新聞的某些交互接近現實接觸,變得更真實可感。

隨著新聞業的數字化轉型,大數據新聞未來或將演化成為智能媒體的一部分,與機器人寫作、傳感器新聞、算法新聞等交織融合。不過,面對技術帶來的玫瑰色理想,我們同樣需要警惕跟隨數字化浪潮而來的新的信息霸權與數據資本權力的擴張。

(三)超越工具理性的大數據新聞

大數據新聞帶有濃厚的工具理性色彩,表現出技術偏向、量化導向與市場邏輯,缺乏價值引導、人文關懷與倫理道德觀照。在其中,媒體從業者也難以體認自身的價值與存在意義。如果工具理性一味擴張,大數據新聞將失去其“新聞”屬性,落入技術的“鐵籠”中。但是大數據的到來是不可逆的潮流,我們需要面對數據社會的新特點,在工具理性與價值理性的辯證關系中促進大數據新聞內容生產與傳播的合理性調適,在堅持新聞的人文關懷的前提下培養不同主體的媒介素養與創新能力。

對新聞從業者而言,他們要始終堅持人本精神,維護人的主體地位,避免對大數據過分依賴。不僅要在大數據新聞的生產中發揮人的主動性與創造性,堅持現場采訪與調查,探賾數據背后更深層的內涵與事件發生的因果,讓公眾知其然也知其所以然;也要始終貫徹人文關懷之要義,關注新聞人物的經歷與命運,體察他們的心態與情感,不斷拓展數據背后的人文內涵。比如,澎湃新聞推出的《疫情殉職者,他們是誰?》就將視角對準那些聚光燈照不到的平凡人物耙梳了在新冠疫情中殉職的387位民間英雄的數據,以職業種類對其進行群像劃分,并展現出殉職原因、殉職地點、年齡層等維度的數據信息,讓讀者穿透統計數據看到了一個個具體的人與鮮活的生命,呈現了更加生動的群體圖像[19]。這篇頗具溫度的新聞兼有傳統的人文色彩與數據新聞的清晰直觀性。除了堅持新聞人文性的“軟要求”以外,新聞從業者也需磨煉自身的“硬功夫”,提升數據素養與數據技能,著力彌補自身在挖掘、利用、分析和理解數據、對數據進行批判與反思以及運用數據進行決策方面存在的短板。在這個過程中,注重對“長數據”的積累,對歷史數據進行梳理與分析,將橫向數據放入歷時圖景,從持續性的數據中找到社會發展的趨勢。

在當下這樣一個時代,數據化顯然是無法避免的。因此,無論是新聞從業者,還是受眾都理應通過提升自己的數據素養來對抗數據風險,更好地維護“人”的主體地位。對于受眾來說,數據素養意味著對數據呈現的事實保持批判與質疑的精神,認識到“‘原始數據’是一種矛盾修辭”,數據分析有可能導向忽視歷史、理論與主體性的數字實證主義[20],從而理性地與大數據共存。

綜上所述,數據化敘事、可視化呈現與預測性報道賦予了大數據新聞蓬勃生機,但是必然性的假象、對人本邏輯的背離以及構成元素特性的內在沖突也使其發展乏力。對此,我們需要在時空的二維坐標系中,以一種聯系的、發展的、辯證的視角理性地看待大數據新聞的存在與生長。作為一種創新的新聞形態,它與傳統新聞構成了補充完善、相互促進的共存關系;作為技術賦能的產物,它在技術的加持下不斷實現新的突破;當然,它還需要在工具理性與價值理性的辯證融合中實現新聞內容生產與傳播的合理性調適。蒂姆·伯納斯·李曾預言“數據驅動的新聞代表著未來”,現在未來已來。大數據新聞的發展或將構建新的媒介環境,不僅給新聞業的發展帶來工具性的影響,或許還會培育一種新的文化生態。

91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合