?

大數據時代下的計算傳播學

2022-02-27 20:05常佳夢上海交通大學媒體與傳播學院
環球首映 2022年12期
關鍵詞:網絡分析傳播學社交

常佳夢 上海交通大學媒體與傳播學院

一、計算社會學與計算傳播學

大數據時代來臨,數據成為寶貴的財富,社會科學也開始使用復雜計算工具進行研究,從而誕生了計算社會學(Social computing research)。

直至19世紀末期,社會科學才作為獨立學科被承認,當時的社會科學與自然科學相對獨立,然而在人類進入后工業化時期,即20世紀70年代后,信息革命來臨,自然科學和社會科學開始融合,每一門科學在意識到獨立性之外更意識到與其他學科的關聯性。1994年,第一次提出了“社會計算機”這個觀念,而 Schuler則提出了“社會計算可以是一種利用軟件為媒介進行社會化交流的任意一種程序?!敝袊闲》宓热税焉鐣嬎憬缍椤斑\用系統科學、人工智能、數據挖掘等科學的計算技術,把社會科學和計算技術有機地融合在一起,從而更深刻地認識社會,改造社會,解決政治、經濟、文化等領域復雜性社會問題的一種理論和方法論體系”。計算傳播學(Computational communication research)為計算社會學的一個分支。二十年前,提起大眾媒體,電視和報紙還是絕對的主角;而在二十年后的今天,社交媒體卻儼然成了大眾媒介中最值得注目的對象。隨著互聯網不斷發展,社會化媒體誕生,層出不窮的新技術與大數據時代背景耦合,傳播學進入了新時代,計算傳播學便是這樣一個智能時代下的新興學科。借用王成軍的定義:計算傳播(Computational communication)是指數據驅動的、借助于可計算方法所進行的傳播過程,而分析計算傳播現象的研究領域就是計算傳播學。

計算傳播據王成軍考證,計算傳播起源較早,在20世紀90年代就已經有應用。20世紀90年代,網飛公司以寄出的影片光碟作為經營方式,在此業務中,該公司使用計算傳播方法分析真實用戶數據來確定和調整倉庫的位置,從而使得公司獲得更高的經濟效益。

目前,計算傳播的應用領域十分廣泛,對現代人的日常生活產生了深遠的影響。例如在互聯網社交應用上分析品牌、話題等的影響力;YouTube、嗶哩嗶哩等流媒體按用戶偏好推送視頻內容;分析社交媒體用戶情緒、位置、行為等進行用戶畫像;計算數據以優化搜索引擎等。計算傳播為普通人賦能,豐富公眾日常生活,也提供了有利的數據工具,提高大眾話語權,同時也為科研人員提供了新的研究視角。但除此以外,計算傳播也催生出新型社會問題,例如信息繭房、大數據隱私泄露、大數據殺熟、群體去抑制化、算法剝削等等,對大眾而言是一個不容小覷的隱患,計算傳播的倫理與法律有待社會進一步重視與規范。

二、計算傳播研究所用數據類型

在計算機通信領域,應用大量的數據和數據的分析與處理技術是其基礎。大數據是指規模龐大,超過了傳統軟件和硬件的處理能力,需要依靠新的技術和模式來及時、高效地進行處理;大數據技術指的是對海量、異構、動態數據進行采集、清洗、存儲、分析、挖掘等處理,并從中快速高效地提取有價值的信息。

郝龍與李鳳翔梳理之后將計算傳播學所用到的數據大致分為3類:第一,網絡中通過人機互動所產生的數據,即為用戶生成內容(UCG,User Generated Content),如微博、豆瓣、小紅書等社交媒體平臺中的用戶發文數據,或者評論、點贊與位置簽到等數據;第二,傳感器所采集的物聯網數據,如頻射識別(RFID)和GPS定位的數據等;第三,對既有資料數據化或者對傳統數據進行關聯整合處理,如紙質書電子化后的數據、政府大數據等。

數字足跡、關系數據、文本數據和空間位置則是4種在計算傳播學中被應用最多的數據。

數字足跡(Digital Footprint,或Digital Traces)又稱數字蹤跡、數字痕跡、電子路徑、電子瀏覽信息等。某美國政客在2012年競選時便使用該數據進行分析,從而制定宣傳手段。

關系數據主要被應用對在社交媒體研究中。社會交往的數據化帶來大量關系數據,使得研究者可以更加精準地研究復雜的社交行為。如國外學者Lu與Brelsford利用日本地震與海嘯時期的Twitter數據研究極端事件下信息互動模式變化所引發的在線網絡結構演化過程;漢森等人通過分析推特中的情感因素對信息傳遞的影響,結果顯示,當新聞引起的消極情緒越強烈時,轉發的可能性就越大,而非新聞信息則恰恰相反;國內學者黃榮貴以“中國版 Twitter”微博為例,對新浪微博14個相關的賬號和超過5萬條博客進行了實證分析,結果顯示,社區互動方式與他們所關心的話題有明顯的關聯。

文本數據是大數據中占比最大的數據,本質上是一種非結構化數據。不同于數字足跡等結構化數據,文本數據蘊含的信息豐富,但分析與使用難度較大。文本數據中,谷歌圖書語料庫(Google Book Corpus)最具代表性。谷歌圖書語料庫是當前最大型的文本數據庫之一,截至2015年底已收錄英、法、德等多語言書籍2500多萬冊。

空間位置信息主要來源于各個硬件端所安裝的傳感器,在移動互聯網占據主流的今天,智能手機成為空間位置信息的最重要來源之一。2013年,Palmer等人發起了名為“人類流動計劃”(The Human Mobility Project)的研究項目。在這一國際項目中,研究者通過將一個 APP裝到世界各地志愿者的手機上來獲取實時 GPS和信號塔數據,進而推斷人口狀況,并探測人群的時空分布、種族分布,乃至生活質量等。2014年,一個跨國合作研究團隊使用手機基站數據進行了葡萄牙部分地區和法國實時人口密度地圖的繪制。

三、計算傳播學研究方法

計算傳播學目前已有較為成熟的研究方法,包括自動化內容分析(Automated Content Analysis)、情感分析(Sentiment Analysis)、社會網絡分析(Social network analysis)等。

(一)自動化內容分析

內容分析是一種從文字(或其它有意義的東西)中進行可重復的、有效的推理方法。自動內容分析是一種將算法和內容分析相結合的產品,目前已有的有監控的機器(SML)和語義網絡分析(SNA)能夠更好地完成自動化的內容分析。以韓剛等為例,運用語義網分析技術,對超過一百萬條 Twitter的推文進行了分析,掌握了社會和社會網絡中的健康傳播趨勢,并為衛生和衛生宣傳提供了有效的對策;金斯伯格等使用了45個與流感相關的關鍵字,以衡量民眾對流感的重視程度。根據這些關鍵字,他們對美國流感疫情的流行做出了精確的預測。目前,自動化內容分析是計算傳播內容研究方面被應用最廣的研究方法之一。

(二)情感分析

情感分析,也就是觀點挖掘,是目前計算機通信領域最為活躍的一個研究方向。在此基礎上,一些學者利用詞典和機器學習的算法,發展了一種新的情緒分析方法,并在Facebook上開發了一個用于搜索學生情緒的極性(正面、中性和負面)狀態和情緒的改變,其準確率高達83.27%。國外的一些學者利用機器學習來進行主題識別,并將現有的語義挖掘技術(hashtagify)和 sensebot等工具相結合,描繪了Twitter和傳統媒體中“棱鏡門”事件的語義網;張倫等人運用語義模型和情緒分析方法,對網絡信息結構擴散度的特征、測量指標和影響因素進行了研究。

(三)社會網絡分析

社會網絡是復雜網絡(Complex Network)的一種,社會網絡分析是計算傳播一個較新穎的、前景廣闊的研究領域。Kwak等人的研究利用社會網絡分析方法,發現信息在社會化媒體的擴散是廣度優先而非深度優先,即依賴單一信息源無法有效地在社交媒體上傳播新聞信息;韓運榮和高順杰利用社會網絡分析分析微博中的社會關系,通過分析不同個體節點、不同社交網絡與無限社會之間的聯系,從而達到“信息利益”與“控制利益”的目的;李彪運用社交網絡分析的方法,建立了“啞鈴”傳播的雙核型傳播模式,認為,網絡新聞傳播結構與普通的信息傳播結構相比,在傳播效率、傳播層次和結構扁平上有明顯的差別。

社會網絡是當前的一個研究熱點。網絡分析是一種獨特的研究方法,它被稱為“社交網絡”。社交網絡的研究與研究是一個緊密聯系的過程。社會化網站的分析將是一個更好的工具,它包含了大量的技術來搜集和分析這些信息。梳理好社交網絡的研究思路與理論,對解決現實中的問題具有重要意義。因此,社交網絡的分析有時候很復雜,并不緊密,其側向延伸的寬幅較大,而垂直方向上的分支較多,因此,在不同的地方,研究者的研究課題、方法及結果也不盡相同。

四、計算傳播學學科優勢

物聯網、云計算、社交網絡飛速發展,數據量激增,傳統的傳播學研究在解決一些新問題時顯得有些吃力,而在計算傳播則開始展露其獨有的優勢。

第一,數據收集優勢。網絡時代豐富的數字足跡使得對個體行為的研究有了第一手資料,對比自我報告式的問卷,數字足跡客觀、細致,更加可信。另外,數字足跡大多為結構化數據,方便進行各種研究分析,且大多包含時間信息,可以進行歷時研究,追蹤動態過程。再者,比起傳統問卷方式,利用計算機技術對數據進行智能化挖掘,可以獲得更全面、更多、更大規模的數據,比如使用 API和計算機語言,就可以方便地獲得 TB的完整數據。

第二,數據分析處理優勢。智能化大數據分析方法是傳統的勞動密集型分析方法所不能及的。采用計算機語言等數據采集技術,可以大大加快數據處理的速度。開發和利用各種算法,使得對全數據的分析成為可能,發現各因素間微弱的連接,找到發展的鏈路。

第三,自下而上的歸納優勢。受傳統研究方法的制約,無法收集和處理全數據,大多數研究只能使用演繹邏輯推論出結果,使用代表性樣本代表全體。在算力、算法大幅提升的今天,計算傳播學從給觀察出發,計算與總結模型和趨勢,進而提出假設并驗證,屬于歸納邏輯,可以更好地適應事物快速更迭的社會背景。

第四,非介入方式的優越性。傳統的影響分析方法主要采用控制性試驗方法,這是判定結果的最好方法。而互聯網就是一個很好的實驗平臺。由于干預方法會破壞樣品的原始環境,所以學術界對其真實性和可信度存在著爭論。而對于整體數據的分析,則是突破了以往數據采樣不完整所造成的桎梏,而智能技術則可以記錄觀眾的日常生活,并將其作為一種實時、細致的記錄,從而實現無創的觀察。

第五,數據顯示出的優勢。在資料分析與應用中,圖表與計算同樣重要。與傳統的數據分析方法相比,大數據技術將復雜的大數據以可視的形式呈現出來,以圖形、動畫的形式呈現出來,并通過可視化的方法,協助使用者了解、了解資料,如資訊地圖。

猜你喜歡
網絡分析傳播學社交
社交牛人癥該怎么治
基于ISM模型的EPC項目風險網絡分析
低軌衛星互聯網融合5G信息網絡分析與應用
聰明人 往往很少社交
計算傳播學:國際研究現狀與國內教育展望
社交距離
你回避社交,真不是因為內向
鐵路有線調度通信的網絡分析
2016年社交網絡分析
傳播學視角下的童書微信訂閱號分析
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合