?

“自動化新聞”如何推動算法撰寫新聞的行業趨勢

2017-01-03 21:40農毅慧
科技傳播 2016年16期

農毅慧

摘要2014年7月,“美聯社用機器人代替記者寫稿”的新聞引發討論熱潮?!皺C器人新聞”一詞以訛傳訛,實際反映了公眾乃至新聞從業者對新聞技術現狀的誤解。本文通過聚焦于最新發布的哥倫比亞大學研究報告,嘗試解讀算法撰寫新聞的行業趨勢與前景。

關鍵詞自動化新聞:算法新聞;分析性思維;責任與挑戰

1什么是“自動化新聞”

美國哥倫比亞大學下屬的數據新聞研究中心TowCenter于2016年1月發布的《自動化新聞指南》采用術語“自動化新聞”來概括這一媒體行業的新動向?!白詣踊侣劇敝冈诔跗谒惴ň幊掏戤吅?,不經人為干預,軟件或算法即可自動生成新聞故事的過程。因此,一旦算法生成,從收集和分析資料,到實際的撰寫和發布新聞,新聞生產的每個環節都可以自動完成。自動化新聞也可以被稱作算法新聞。自動化新聞適用于某類特定的新聞:這些故事以事實為主,且存在有效的、結構化的、可靠的數據可供使用。此種情況下,算法能夠生產大批量的新聞內容,并針對每個讀者做出個性化處理。算法比人類新聞記者更迅速、成本更低廉,而且很可能更少犯錯誤。

2自動化新聞的簡史與現狀

自動化新聞的概念看似新鮮,實則在新聞領域亦有跡可尋。該行業趨勢發源于近半個世紀前的天氣預報領域。一種能夠處理天氣預報模型數據(風速、降雨量、氣溫等)的軟件可將數據按照重要性排列(例如數值是否超過或低于某個閾值范圍),并使用事先寫好的約80個短語生產出一篇“措辭嚴謹的天氣預報”。另一個已經長期采用自動化模式的領域是以信息速度論高下的財經新聞。舉例來說,路透社和彭博社等機構都從新聞稿件中提取關鍵數據,將它們嵌入事先寫好的模板,為其客戶自動生成新聞提醒。近年來,福布斯、非營利性新聞調查網站ProPublica等紛紛開始采用自動化新聞技術,2014年美聯社使用Automated Insight創建的“語言大師”(Wordsmith)平臺來撰寫公司季度財報,這一消息更使自動化新聞前所未有地走進公眾視野。目前在全球范圍內研發自動化新聞軟件的11家公司,其中5家在德國(Ax Semantics:Text On:2txt NLG:Retresco:Textomatic),2家在美國(Narrative Science:Automated Insights),2家在法國(syllabs:Labsense),1家在英國(Arria),1家在中國(騰訊)。

3自動化新聞的意義與影響

3.1新聞記者:應當更關注那些算法完成不了的任務

自動化新聞經常被看作是針對傳統新聞業的威脅,因而也毫無意外地吸引眾多記者的關注。新聞記者通常認為自動化新聞產品的寫作質量較差、他們認為復雜的敘事能力是人類寫作的競爭優勢。首先,“講故事”原本不是新聞記者視為至關重要的職業技能。他們強調的恰恰是算法更勝一籌的那些能力,例如,客觀性、簡潔、速度。更重要的是,新聞記者的爭論忽略了以下事實:自動化新聞在重復性、常規化且基于事實的新聞故事中最為有用。在此類作品中,寫作質量并非至關重要。例如,在瀏覽財經新聞時,讀者傾向于快速獲取信息。此時復雜、精妙的寫作手法反而費力不討好,使得讀者理解信息更加困難。

新聞記者應當更關注那些算法完成不了的任務。未來,人類和自動化新聞可能會緊密結合,算法將負責分析數據,尋找有趣的新聞題材,撰寫新聞初稿。記者則負責為稿件增添深度分析,采訪關鍵人物,并在幕后進行報道。

新聞記者也將在自動化新聞生產流程中扮演新的角色。例如,美聯社近期聘請了一位“自動化”編輯,其工作為嘗試辨別出可以轉為自動化的生產流程。開發新聞算法的一大挑戰便是定義出算法應當遵循的條件與規則。此類工作要求記者具備分析性思維,創造性,并且對統計學有一定的了解。

3.2新聞讀者:新體驗。新訴求

首先,記者撰寫的新聞比自動化新聞在可讀性方面評分更高。其次,自動化新聞在可信度方面評分更高。最后可能也是最關鍵的一點是,受眾對人類新聞和自動化新聞的質量評估差異很小。盡管讀者受眾認為記者的文章的確比自動化產生的文章更有可讀性,但他們本來就不太喜歡閱讀該類新聞。

自動化新聞在常規化、重復性的新聞領域足以與人類記者的寫作質量抗衡。有些新聞議題不單單包含基本事實,此時記者通過提供解讀、推理和主觀意見來發揮己用。目前還沒有自動化新聞能夠處理如此復雜的問題。

在富有爭議的報道領域,例如,采用自動化新聞作品分析投票數據來分析候選人贏得選舉的機率,讀者或某些利益群體很可能會質疑新聞故事的基本事實,或者抨擊新聞故事采取的視角。與之相似,如果算法針對每個讀者生成個性化的新聞故事,用戶也許會希望知道算法有多了解他們的需求,或者他們看到的新聞與其他人有何不同。用戶是否對算法透明度有要求還尚未可知,畢竟很可能極少有讀者了解算法在新聞界所起到的關鍵作用。

首先,我們需要更好地理解用戶對算法透明度的需求,以及如何能使公開信息服務于公眾利益;其次,需要尋找不干擾用戶體驗的信息公開方式,特別是針對那些對此類信息不感興趣的讀者。

3.3新聞機構:責任與挑戰

首先,新聞機構不僅需要擁有修改和公布源數據的法律權利,而且要確保這些數據足夠準確。新聞機構需要執行數據管理和核查的流程,自動完成或者由編輯人工完成均可。其次,如果基本數據或算法存在錯誤,自動化過程可能在轉瞬間生成大量疏漏百出的新聞故事,從而對機構的名譽帶來災難性的影響。新聞機構因此需要在發布自動化新聞之前進行徹底的測試。專家建議最好在作品發布前由編輯事先進行核查。再次,針對最終的新聞成品,自動化新聞的寫作風格需遵循機構的官方風格指南,并且應當能夠針對不同的故事采取多樣的措辭。新聞機構也必須維持最起碼的透明度,表明某個新聞故事是算法自動生成的,比如添加信息說明數據來源,以及該內容的生產方式。最后,還需明確法律責任。如同其他任何數學模型,生成自動化新聞的算法也依賴數據和先驗的假設,兩者均可能存在偏差或疏漏。此類錯誤可能導致意想不到的結果,最終造成新聞故事包含不準確或錯誤信息。

出錯時,新聞機構也許會迫于壓力公開自動化背后的源代碼。至少,他們需要解釋這篇錯誤新聞是如何生成的。從法理角度看,算法不能對錯誤負責。責任應當由自然人擔負,可能是發布者,也可能是導致算法或數據出錯的具體員工。

3.4社會:公眾輿論的未來

自動化新聞很可能會使新聞的數量大幅度增加,使得用戶在尋找與自身最相關的信息時遇到更多困難。為了解決信息超負荷的問題,搜索引擎和諸如“谷歌新聞”的個性化新聞聚合應用,其重要性都會與日俱增。

自動化新聞數量增加和完善,要求未來的研究必須著手解決更加寬泛的議題。我們能否相信,算法這一機制能夠促進新聞信息的核查與平衡,辨別重要的新聞議題,并且為民主進程中公眾輿論的形成設立共同議程?更重要的是,今后的研究需要了解,如果算法替代新聞業成為政府監督者,這一趨勢對民主意味著什么。盡管將自動化新聞的普及還尚待時日,其擁護者認為該領域將會迅速增長。Alexander Siebert是研發自動化新聞技術的德國公司Retresco的創始人,他認為在五年內自動化新聞將與人類撰寫的新聞別無二致。美國公司Narrative Science的創始人之一Kristian Hanmmnond預測,未來10年內,超過90%的新聞將會走向自動化。

91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合