?

文化大數據:驅動文藝融合研究的范式轉型*

2023-02-21 09:41徐劍錢燁夫
藝術百家 2023年6期
關鍵詞:范式研究者文藝

徐劍,錢燁夫

(1.上海交通大學 媒體與傳播學院,上海 200240;2.上海交通大學 中國城市治理研究院,上海 200030)

數字化的浪潮正從信息技術領域溢出,開始席卷人們社會生活的各個領域。就像“上網”不再是個動作,而成為人們日常生活的一種狀態,數字技術正在重塑人們對社會的系統認知和思維方式。與社會科學相比,數字化對人文藝術研究的影響雖沒有在學科體系內引起顛覆性的變革,但在近十年開始逐步滲透到研究的對象、議題、方法等層面,潛移默化地推動著一場范式的變革。被西方學術界稱為“下一個大事件”的數字人文(digital humanities),正是在這樣的時代浪潮下進入國內學界并迅速成為一個熱點概念。然而,作為一個新興領域,數字人文的發展始終在對人文研究計算方法的重組與批判性反思中艱難前行。[1]288-290安妮·伯迪克(Anne Burdick)認為:“數字人文不是一個統一的領域,而是更像一組相互交織的實踐活動。這些實踐活動探索在不以印刷品為知識生產與傳播的主要媒介的新時代出現的各種問題?!盵2]121盡管數字人文的邊界還有待商榷,但其作為實踐活動的底層基礎——數據,無疑已經成為這一領域不可或缺的生產性要素。[3]79-88

文化大數據,正是伴隨著數字人文實踐的不斷演進而逐步成熟的一個復合性概念。2022年5月,中辦、國辦印發的《關于推進實施國家文化數字化戰略的意見》將“統籌推進國家文化大數據體系”作為重點任務之一,明確了到2035年建成國家文化大數據體系的目標。政策層面的戰略布局表明,文化大數據已經成為文化數字化轉型過程中的關鍵推動力;而從學術研究的具體實踐來看,文化數字化與數字人文研究又有著千絲萬縷的聯系。智能時代數字人文研究的飛速發展再一次喚起了“文化”與“大數據”的會遇,一座連接理論概念與實踐路徑的橋梁正悄然浮現。那么,文化大數據究竟有何內涵,如何在數字人文的經緯中理解其概念、邊界及其與文藝研究的關聯,又能從何種意義上給予研究者以新的啟迪和思考,從而推動新時代的文藝研究在轉型中不斷前進?為了回答上述問題,本文基于對文化大數據的源起和發展歷程的梳理,著重考察了文藝研究領域的學者對這一概念的闡述和實踐運用,并嘗試提出一種數據驅動下的文藝融合研究范式,以此探討文化大數據推動數字時代文藝研究的可能方向。

一、文化大數據的概念及特征

數據體量和規模的龐大是“大數據”概念最直觀的特征之一,這同時也在數字時代海量的文化內容數據中得到了印證。數據顯示,谷歌圖書館掃描并編目了2500多萬本圖書[4]16-37;臉書(Facebook)的資源庫每周新增50億條內容[2]38。因而,“文化”與“大數據”的相遇,似乎是數據規模指數級膨脹趨勢下的一種必然,但又不局限于此。數據規模本身的增長,勢必會對提取、把握和分析數據的研究方法提出新的挑戰。因此,文化大數據作為一個獨立概念的出現,標志著對于海量的文化數據資源的技術運用進入了新的階段,呼喚著新的文化基礎設施和技術手段的到來。盡管技術變革與政策規劃的雙重語境已將“文化大數據”的概念推至時代前臺,成為近年來文化領域熱議的關鍵詞之一,但學界對于這一在大數據浪潮中孕育出的組合型概念卻缺乏系統的梳理與思考?;诖?本文嘗試從新技術背景下的文藝研究視角出發,通過一個金字塔結構框架(圖1),對文化大數據所包含的概念層次加以闡釋。

圖1 “文化大數據”概念的三層次結構

從作為底層基座的數據要素來看,文化大數據是數字時代文藝創作的本體與外延,這一本質屬性又嵌套在文化數字化的過程之中。隨著文藝創作的手段、工具、存儲和呈現方式越來越與數字媒介相互融合,數字媒介作為“元媒介”,展現出前所未有的“開放、迭代生長、(幾乎)無限變化和拓展”的特性,改變了文藝創作的底層機制。[2]14-15大數據不僅已嵌入文化活動的各個單元,并且也深刻地影響和改變了作品的創作方式、內容形式、存儲和呈現方式,甚至在某種意義上成為作品本身。如數字文學、超文本小說、數字影像藝術、互動藝術、虛擬現實藝術等數字文藝形態,基于數字化、網絡化、虛擬化的技術平臺,采用更加動態、多元、開放和非線性的敘事模式,將聲音、圖像、文本轉換為可反復讀寫和編輯的開放式代碼,這也意味著數字時代的文藝發展必然會生成海量的數據。畢達哥拉斯學派曾提出“萬物皆數”的本體觀,在數字媒介環境下,一切都可以被數據化,數據可以成為不同形式藝術作品的表征。即使是原本沒有通過數字介質存儲的藝術內容,也可以通過多種文化數字化的手段轉化為數據。同時,文藝作品通過互聯網、社交網絡的傳播也催生了海量的“相關數據”,即文藝創作的外延性數據,如作品在網絡空間的傳播、銷售、出版,讀者的閱讀、轉發、評論等等,這些數據經由網絡快速產生和不斷變化,使得文藝表達所承載的內容進入一個廣闊的、動態變遷的場域中,并且極大地拓展了文藝研究的范疇與邊界。

文藝作品和文化內容的數字化,在網絡空間形成了一系列連接性的網狀數據結構,但這種數據依然是獨立、分散的數據集,需要通過數據庫和數據平臺加以統籌、整合并建立連接。因此,從中間層意義上看,文化大數據是在文化數字化的基礎上,使數據進一步標準化并搭建形成的,可以有效服務于廣泛意義上的文化研究的復合型數據庫和開展數據管理及中轉的(云端)數據平臺,是一種大數據運行管理機制和數字文化基礎設施。數據庫建設是數字人文的基礎工程,數據全面、分類清晰、有效聯通、標準化的數據庫資源,是學術研究范式轉型和理論創新的必要準備。[5]1-11大數據的特性在于多種不同類型數據之間的關聯性。文化大數據并非一個單一的大規模數據集,而是一連串與文化相關且連通的數據庫的組合。弗雷德里克·開普蘭(Frederic Kaplan)用三個同心圓的結構闡述了文化大數據、數字文化、數字體驗之間的關系:文化大數據可以被視為一連串線性的大規模數據庫組成的集合,位于研究的中心;在其外圈的數字文化研究側重于討論不同類型的參與者或對象(如媒介話語、大型文本、網絡社群、數字軟件)之間的相互關系;而上述內容又都包含在數字技術所帶來的新的更大的數字體驗的語境之中。[6]1

文化大數據的數據庫建設是文化數字化戰略中的核心環節。我國文化大數據的搭建、整合和連接工作是一個在時代語境下階段性、漸進性發展的過程。早在2019年公開征求意見的《文化產業促進法(草案)》和科技部、中宣部等6部委發布的《關于促進文化和科技深度融合的指導意見》中,就已經將文化大數據體系建設工作作為一項重要的戰略任務。中宣部2020年發布的《關于做好國家文化大數據體系建設的通知》指出,文化大數據體系是新時代文化建設的重大基礎性工程。在這一框架下,我國的文化大數據作為一種標準化、結構化的數字基建,有其特殊的戰略意義。2021年以來,國家文化大數據體系建設的一系列相關標準陸續發布。文化大數據體系的建立,是面向“數據壁壘”、解決文化資源數據孤島化問題的重要舉措??梢灶A見的是,隨著文化大數據體系的完善,以及數據資源開放共享的不斷深化,海量數據勢必成為文藝研究中重要的分析要素和工具。

在文化數字化技術和大數據基礎設施的基礎上,文化大數據進入了第三個層次,即充分利用海量的文化數據資源,綜合使用數字技術分析和解決前沿研究問題的一種新的方法和手段。20世紀40年代,意大利學者羅伯特·布薩(Roberto Busa)將計算機技術引入人文研究,從而建立起一種新型文化研究模型,這種取向被稱為“人文計算”(humanities computing)。[7]1-19從人文計算到數字人文,其概念內涵與邊界不斷拓展,但始終沒有離開數據技術與計算方法的本質。今天,基于大數據的技術工具已經越來越多地應用到文藝研究的實踐之中,如文本挖掘、聚類分析、主題分析、社會網絡分析、語義建模、知識圖譜等方法和輔助分析手段,已在文學史、藝術史、文藝理論、藝術風格與流派、審美范式等不同領域的系統性研究中發揮了重要作用,并在更大范圍與不同學科、不同研究領域展開對話。

綜合上述定義闡釋不難發現,文化大數據是在信息傳播進入互聯網時代后,與文化相關的大規模數據共同催生的產物。在這一背景下,“文化”與“大數據”并非簡單的相遇或組合,而是演變為一種互動共生、互相形塑的關系。一方面,文化藝術對于數字媒介技術的使用不僅使得數據成為不可或缺的生產要素,導致相關數據的海量化,更催生了圍繞數據展開的新興藝術形式和表現樣式;另一方面,海量的生產數據和相關數據也為文藝工作者提供了豐富的礦藏,它既承載了規模龐大的數字文化資源,同時也蘊藏著從海量數據中挖掘新發現、助推文藝理論和內涵發展的巨大動能??梢哉f,文化大數據為文藝研究提供了多元的議題界面、基礎要素和研究工具,它不僅代表了一種底層數據意義上的變革——與文藝研究相關的諸多領域的文化材料、資源、內容都正在被快速地數字化,并進行系統性的整合和重構;而且在更深的意義上,它正在推動一種文藝融合研究范式的轉型——這種轉型不僅僅局限于技術手段的突破,而更在于一種打破固有研究規程與版圖壁壘的觀念更新、視野拓展及理論創新。

二、大數據時代文藝融合研究的范式轉型

在文化數字化浪潮的席卷下,數據已經滲透至社會生活和文藝生產的方方面面。以文化大數據為代表的新的文藝形式、技術工具和研究方法把研究者帶往了一個新世界,而這也為文藝研究的范式轉型提供了前所未有的契機。庫恩的科學革命理論詮釋了科學發現和技術進步在范式變化中的重要意義。這一理論能夠在一定程度上解釋大數據技術如何促使傳統意義上的文藝研究理論和方法的調整變化,以及數字人文作為一個新的領域的誕生與演進。這種變化并非一種激進的取代與顛覆,也非溫和的改良主義,而是重新提出了多維度、多角度的思考模式,幫助研究者在單一線性的研究取向之外找到新的視角。庫恩筆下的“范式”可以被視為科學共同體的結構、群體信念的集合、共有的范例,代表著某一類研究集合體的整體面貌。[8]237-254范式之變不僅僅是理論與方法的創新,更多的是一種思維框架之變,它既包含研究的視角與尺度,也包含工具與手段,提供了更加廣闊的研究視野和更加豐富的可能性。從這個意義上說,文化大數據所提供的范式變革的驅動力核心在于,以數據為牽引力而貫穿不同領域的研究版圖,有效連接宏觀與微觀視角,并通過更加直觀的技術手段對研究結果進行呈現,從而突破文藝研究中長期存在的圈層壁壘,實現研究范式的融合創新。

(一)視角融通:以數據為牽引的超學科方法論

盡管數字技術并未充分地從根本上改變具體的學科,但人文學科無疑已經隨著數字技術在各類研究中的應用而風云變幻。[9]3從歷史上看,現代學科概念經歷了一個不斷分化的發展過程,其形態大體上在20世紀40年代左右發展進入成熟期,[10]13-17+24這為現代性的發生提供了合理化的工具。但過度細分專業領域帶來的學科邊界也造成了不同研究領域互為壁壘的“孤島效應”。盡管文藝研究的議題日益多元,但對其他學科的影響,尤其是和社會科學、自然科學的交叉對話仍顯貧乏。而從文藝理論的內部視角來看,不同研究取向所造成的理論分野也如鴻溝一般阻隔了不同范式之間的對話與交融。艾布拉姆斯從文學理論的坐標譜系出發,歸納出著名的“四要素”論,即任何一件藝術品總涉及作品、藝術家、世界、受眾這四個要點,而“幾乎所有力求周密的理論總會在大體上對這四個元素加以區辨”[11]8。這一觀點對應了20世紀西方文學理論所經歷的從作家到文本、再到以讀者為中心的理論轉型。伊格爾頓將現代文學理論的發展史劃分為三個階段——“專門研究作者(浪漫主義和19世紀);專注于文本(新批評派);近年來明顯地把注意力轉向讀者”[12]91。朱立元將其歸納概括為西方文論研究重點的“兩次轉移”,即第一次是“從重點研究作家轉移到重點研究作品文本”,第二次則是“從重點研究文本轉移到重點研究讀者和接受”。[13]4但上述有關理論范式的劃分幾乎始終是圍繞著相互獨立的各元素展開,在作者、文本、讀者被明確為獨立的研究取向的同時,其相互之間也陷入一種自然的分野,如探討作品與世界的關系的存在主義、女性主義,分析作品與藝術家關系的表現主義、象征主義、精神分析,探討作品與讀者關系的閱讀現象學、讀者反應理論,以及討論作品本身的形式主義、結構主義、符號學等。20世紀以來西方文學研究形成的若干理論坐標由于其自身的取向具有根本性的差別,彼此之間很難實現跨領域對話,甚至難以在同一研究框架之下兼容共存,從而愈發擴大了不同研究譜系的割裂和理論之間的鴻溝。盡管也有研究者認識到需要發展對所有文學元素進行整體把握的綜合性研究,[14]5但卻因為缺少整體性的分析框架與研究手段而在具體實踐中困難重重。

理論的斷裂和互斥本質上源于缺乏共同對話的基礎。艾布拉姆斯說:“實際上許多藝術理論根本就不可能相互比較,因為它們沒有共同的基礎……這些理論之所以不能相互比較,或者是因為術語不同;或者是術語雖同而內涵各異;或者是因為它們分別屬于一些更大的思想體系,但這些思想體系的前提和論證過程都大相徑庭?!盵11]8而今,文化大數據提供了一種以數據為橋梁的文藝理論的連接融合范式,這種數據驅動下的連接具有天然的對話與整合作用,可以為彌合理論分野的鴻溝提供新的可能。在文化大數據牽引下,我們可以將艾布拉姆斯的四要素分析圖式修改為以下的錐形六面體形式。(圖2)首先,作品、藝術家、世界、受眾位于一個正四面體的各個端點,這意味著上述不同面向的研究盡管各自占據一種獨立的位置,但并不是孤立存在的,而是相輔相成、互為整體的。位于底層基礎位置的文化大數據為上述各元素的連接提供了橋梁,可以指涉作家、文本、讀者乃至更廣闊的文化世界,實現不同元素間的對話,同時又能夠通過數據賦予新的研究視野。事實證明,這種連接不僅是必要的,并且已經通過數字技術應用逐步變為現實。例如,王兆鵬團隊運用數字人文技術開發的唐宋文學編年地圖平臺,試圖在文獻資料集成化的基礎上實現文學編年史的時空一體化,將對作家活動、作品創作地理分布的考察與作家年譜、別集編年箋注之類的時間信息結合到一起,不僅能夠幫助實現古代文學研究“時空分離”的重新連接,更能以此管窺不同時期作家的社會活動空間特征,從更大的歷史文化背景下實現不同學科、不同領域的“異類關聯”。[15]108-129+206-207實踐表明,無論是文獻資料的分散還是理論取向的分離,其連接是完全可以建立在數據的基礎與功能之上的。這種連接能夠將長期以來相互獨立的學術分野以超學科的框架統一起來,實現超越學科邊界和理論分野的整合。換言之,文化大數據并非研究者聚焦的研究對象本體,而是以一種超學科視野中的融合方法論的形式服務于文藝研究,從而建構起具有實踐性和整合性的文藝理論體系。

圖2 文化大數據牽引下的理論分析圖式

文化大數據的本質是數字,它圍繞規?;臄祿归_,也聚焦于數據本身來進行自我的完善與發展,并未預設任何學科屬性與邊界壁壘,因此它天然具備一種超學科性。以數據為牽引,可以有效刨除學科話語體系自設的藩籬,將人文學科的研究土壤向社會科學和自然科學開放,從而推動理論的對話與范式的創新。這種超學科融合方法論并非簡單地將大數據或其他數字技術遷移或者應用到文藝研究領域,而是以一種更加廣闊的視野,推動數據與研究產生如錐形結構一般相輔相成、相得益彰的“兩級效應”。首先,是以文藝為“中心極”。所謂大數據研究并非以數據分析取代文藝史長期以來發展形成的傳統研究范式,而是立足于文藝之本,通過數據的滲透與挖掘去深入理解文藝與其他學科、其他文化活動之間相互影響的關系,而最終需要從外延的數據回歸到文藝研究的本體。其次,是以文化大數據為“牽引極”。作為一種整合性、連通性的系統,文化大數據不僅僅是簡單地將文藝作品數字化,而是連接更加寬泛的文化內容,可以幫助研究者以更加開闊的視角去平視文藝研究與“大文化研究”及其他相關學科之間的關系,揭示文藝的發生、表達、傳播、發展與更廣闊的社會文化現實的內在聯系及相互影響。例如,斯坦福大學文學實驗室(Stanford Literary Lab)的兩位學者萊恩·霍伊舍(Ryan Heuser)與龍萊克(Long Le-Khac)通過對2958部19世紀英國小說文本的規?;瘮祿治霭l現,在這一特定時期,英國小說中與道德約束有關的“抽象價值”語義場(如“謙遜”“尊重”“德行”等詞語)呈現出穩步下降的趨勢,而描述動作的動詞語義場卻呈現明顯的上升趨勢。[16]11-27而要想充分解釋這種趨勢變化,就必須將其置于該時期文學和文化史的整體背景之下,批判性地回歸到更加廣闊的社會經驗上來。進一步的分析表明,19世紀英國小說的敘事風格更加側重于物理細節的展現,這種具體化轉變的背后是小說中社會空間的普遍擴張,而這也對應了這一歷史時期英國現實社會空間的平行變化。[16]45

當大數據的分析技術與思維方式介入文藝研究的具體語境時,規?;瘮祿鶗匀坏亟衣对趩我晃谋局须y以洞見的特定變化趨勢,而這種變化趨勢又能夠驅使研究者進入更大的批評語境之中,與更多理論展開對話,從更廣闊的視角思考文藝作品中所隱藏的規律,這也即文化大數據不斷顯現的“連接”潛力。類似的探索反過來又會作用于文藝研究自身,實現理論范疇的兼容與互補。超學科融合方法論正是從文藝研究的本體出發,以大數據為牽引,在經歷一番漫溯式探索之后又回到文藝的本體上來。它不局限于文藝作品本身,而是以數據為強有力的證據,在更大范圍內揭示文藝研究與其他學科門類之間的內在關系,最終實現對文藝研究本身的反思與復歸,通過不斷豐富研究的理論體系與方法組合,在實踐中實現對自身的深化與超越。

(二)尺度放縮:“遠讀”與“近讀”的有機統一

自弗蘭克·莫萊蒂(Franco Moretti)提出“遠讀”(distant reading)的閱讀尺度以來,有關“近讀”與“遠讀”的爭論始終未有停歇。在新批評出現后,“細讀”(close reading,直譯為“近讀”)逐漸作為一種主要的批評策略被確立起來。[17]63020世紀以來的語言學轉向幾乎將文本細讀塑造為文學批評的核心范式。[18]114-124因此在相當長一段時期,這種基于對文本“精耕細作”的近距離閱讀方法一直占據著主導地位?!敖x”的實質是根植于特定文本,并對其細部內容進行具體分析,結合研究者的閱讀記憶和個體感知進行經驗性闡釋。然而,面對數字時代文藝創造的新形態和新規模,這種方法正暴露出越來越多的局限性。莫萊蒂認為,晚期資本主義時代尤其是電子媒介誕生后,文藝創作和傳播的速度空前加快,其內容體量以指數級的速度增長,批評者很難通過單一或少量的文本細讀方式去了解巨量的文本內容,從而產生了“大量未讀”(great unread),這意味著可能有99%以上的作品被研究者遺忘,而這恰恰是文學研究所需要正視的問題。[19]207-227同時,由于缺乏對海量文本的整體把控力,“近讀”的研究方法往往缺少歷史性的文本洞見與縱向的比較分析。隨著外部內容空間與形式空間的不斷放大,堅守固有思維的文藝研究在尺度上將會顯得越來越小,從而失去一種整體性的認知。

數字人文視野中的遠距離閱讀,是“一種關注更大單元和更少元素,并通過形狀、關系、模型和結構揭示模式和相關性的分析形式”[2]39。盡管“遠讀”概念誕生的原初語境并非圍繞著計算分析展開,但不可否認的是,簡化和抽象是“遠讀”本身最重要的特點,而定量分析則是在方法演進中所產生的一種必然。因為抽象模型需要宏觀數據的支撐,這正是“近讀”方法所不具備的。規?;暮A课谋緝热菀馕吨芯空咝枰鰡我晃谋镜姆h,用數據庫與計量技術去關注數字化的“宏文本”。[20]123-129正如莫萊蒂所說,“研究者對世界文學范圍大小的選擇與研究者到文本的閱讀距離成正比:項目所涵蓋的范圍越廣,那么研究者離文本的距離就應該越遠”[21]70-77。從這一視角出發,文化大數據能夠為遠距離閱讀提供兩個重要的研究工具箱:一是大規模文本分析。通過文本挖掘、主題建模、網絡分析等技術,實現對盡可能多的作品的整體性計算分析,從而將大量的“未讀”作品拉回到文學的整體性研究上來。這些設想在莫萊蒂關于歐洲小說(1800—1900)[22]141-197,英國小說(1740—1850)[23]134-158,《哈姆雷特》、《紅樓夢》人物關系網絡的研究[24]211-240中得以付諸實踐探索。類似的取向不僅能夠幫助研究者更好地理解數字時代單一閱讀難以獲取的海量文藝作品本身,還可以從社會、文化、歷史、經濟等角度透過作品觀察和分析更廣闊的非文藝范疇,從整體脈絡和系統認知層面拓展文學概念。二是協作性知識生產。數字人文視野中的文藝研究,可以擴大學術研究的范圍,并與普通大眾產生交集,使之成為一個“在世界范圍內可參與、相關聯的多人在線游戲”[2]27。通過文化大數據的連接性系統,文藝研究可以不局限于個人或少數主體的分析和解讀,而是通過數據接口進行集體協作,甚至實現人工批評與機器分析之間的協作。例如,愛爾蘭第一個公眾參與的數字人文項目“1916年的信件”(Letters of 1916)面向公眾收集1915至1916年間與愛爾蘭有關的書信文件,并通過數字化、轉錄、編碼建立大型數據庫,以更具復雜性的大數據分析手段展現這一特定時期的愛爾蘭歷史。[25]506-525此外,亞馬遜的眾包網絡平臺“土耳其機器人”等支持團隊工作的新技術模式,也為“大人文研究”提供了新的生產方式。[9]96

當然,也有批評者認為,“遠讀”方式始終無法擺脫機器與數據黑箱的制約,集中于對數據驅動的“工具性”問題的批判。事實上,對大數據技術在文藝研究中應用的批評,或對數字人文的指摘,本質上來源于將人文學科與科學技術的知識領域進行“二分”的思維慣性。[26]88-97+177莫萊蒂當然也意識到局囿于數據的定量研究的缺陷。他指出:“定量研究提供了獨立于闡釋的理想數據類型,但那也是它的缺陷:提供數據而非闡釋?!盵27]9我們認為,“遠讀”和“近讀”不一定非得是對立和互斥的,也可以是平行和互補的。遠距離閱讀可以幫助研究者發現大規模的趨勢、模式和關系,但對于個體性文本的具體特點、內涵的分析,依然需要通過“近讀”加以深究。應當引入一種“放縮法”,在“大”與“小”、“遠”與“近”中尋找一種平衡,使二者在數字人文的框架下有機結合在一起。有學者指出,應對由數字技術引起的大規模和小規模的調適方式之一是利用“顯宏鏡”(macroscope),它能夠“幫助我們綜合集成各種相關元素,發現各種隱藏的模式、趨勢和異常,同時也讓我們看到無數的細節”。[28]一個典型的例子是安德魯·派珀(Andrew Piper)和馬克·阿爾蓋·休伊特(Mark Algee Hewitt)在關于歌德(Johann Wolfgang von Goethe)小說《少年維特的煩惱》(theSorrowsofYoungWerther)的語言特征研究中,通過“拓撲閱讀”①的方式發現歌德早期和后期作品風格之間的連續與斷裂關系,從而在大量文本中發掘值得進一步分析的原材料,并使之接受傳統意義上的“近讀”分析。[29]11-20數字人文研究者正是通過這樣的方式,形成在“遠讀”與“近讀”間不斷切換的分析模式,從而實現二者的互補。類似的方法能夠啟示研究者,宏觀的模式規律與微觀的細節元素是不應被割裂開的,“近讀”與“遠讀”也應當在特定的運行框架下進行有機的統一與結合。這里的“結合”,可以是基于文本學分析、類型分析、作者風格或寫作模式的比較與基于對文本數據或語料庫快速、大規模的信息處理的結合。[2]18在這一過程中,定量主要解決“是什么”的問題,而闡釋則可以解決“為什么”與“怎么樣”的問題。[30]43正如庫恩所言,新現象的出現并不一定會破壞先前的研究,新理論的出現也可能只是將一系列舊理論重新聯系并組合在一起,而不會對其造成實質性的改變。[8]96“遠讀”所帶來的尺度之變并非從根本上拋棄傳統研究方式的細部和深度發掘能力,而是通過引入新的觀察角度與研究手段,與傳統的、根植于人文學科特質的研究表達方式進行有機融合,從而達到“宏微合一”的效果,在范式的相互補充中實現研究方式與手段的進步。

(三)方法更新:面向數據復雜性的可視化研究

文化大數據所蘊含的超大規模的數據體量以及多領域的數據資源導致其邊界呈現不斷擴張的動態彈性特征。而當若干可變的數據單元組合到一起時,勢必會形成一種新的復雜系統。對于計量語言學、計量歷史等常規意義上的計算人文方法而言,其計算的對象盡管也可能具有相當龐大的數據體量,但其類型依然是單一的文本對象。而在文化大數據的語境中,研究者需要面對的無疑是更加豐富多元、廣泛連接和相互嵌套的多維數據庫,因而文化大數據分析研究的對象更多地表現出多種數據規則之下的復雜性。顯然,這種面向文化大數據背后復雜系統的探索正逐步超越傳統定量方法的解釋力,呼喚著新的研究方法和研究工具的到來。從另一個角度看,文化大數據所形成的復雜系統天然具有“涌現”的特征。所謂涌現性,通常是指多個要素組成系統后,出現了系統組成前單個要素所不具有的性質,這個性質并不存在于任何單個要素之中,而是當系統由低層次向高層次構成時所表現出來的特質。[31]48-51當更多的數據彼此關聯起來時,面對多元數據的復雜性,研究者需要通過合理的分析手段將數據中隱含的某種趨勢或特定的表現機制直觀地呈現到研究界面之上,從一個更高的視角觀察復雜系統中的涌現性規律。近年來在數字人文領域快速發展的可視化手段則為應對大數據的復雜性特征提供了有效的工具。

圖表作為一種最樸素的數據可視化方式,早在中國古代的歷史實踐中就已得到體現。南宋鄭樵《通志·年譜序》:“為天下者不可以無書,為書者不可以無圖譜,圖載象,譜載系。為圖所以周知遠近,為譜所以洞察古今?!碧拼鷱垙┻h《歷代名畫記》:“記傳所以敘其事,不能載其容;賦頌有以詠其美,不能備其象。圖畫之制,所以兼之也?!盵32]3在古人看來,圖像不僅可以在遠與近、古與今的歷史尺度中體察全貌,還能實現“容”與“象”的統一,客觀呈現事物的真實樣態。而在大數據語境中,可視化有助于實現大量數據集的多維描述,為研究者提供以更直觀的方式呈現和分析研究結果的可能性。典型的可視化形式包括聚類樹狀圖、生命基線圖、詞匯速寫圖、日歷視圖、同心圓圖、文本可視化分析、歷史地理地圖等。[9]133對多數人來說,可視化并非一項新鮮的技術。從本質上說,可視化是視覺圖形對數據內容的一種轉譯。而在文化大數據語境中,可視化不僅僅局限于一種數據的表征方式,更可能成為推動研究范式創新的一股重要力量。正如克利福德·伍爾夫曼(Clifford Wulfman)指出的那樣,受眾通常認為數據可視化只是一種發現工具,但數據可視化不僅可以用于說明已經發現的結論,還可以用于改進提出的論點;數據可視化,已經成為數字人文的一個重要標志。[33]94-109

在文化大數據驅動下的融合研究范式中,可視化的重要性正日益凸顯。首先,可視化能夠幫助研究者在復雜的數據海洋中透視“涌現”。讀屏、讀圖時代的到來不僅在閱讀習性和文化慣性上引發了“圖像轉向”,而且影響到研究者閱讀信息和探索規律的方式。從神經科學的角度看,人類大腦對于圖像內容具有先天的敏感性。因而,可視化具有超越文字、數據本身的直觀性優勢。當快速增長的文化大數據不斷呈現出復雜性與動態性特征時,海量的數據代碼就像層層包裹的迷霧,往往會使研究者迷失在數據的海洋中。而數據分析與可視化技術的結合,為應對這種復雜數據集提供了有效途徑,能夠使研究者擁有在復雜數據中發現和把握宏觀趨勢的能力。這種方式通過對大規模數據的抽象提煉而作整體性考察,突破了傳統方法選擇性關注的局限,從而達到“既見樹木,又見森林”的效果,特別是在文學史研究中展現出了巨大潛力。比如在前文提到的斯坦福大學文學實驗室關于19世紀英國小說的研究中,作者總結到,“從數據中涌現出的可能是一個系統,一部具有明確形態的小說史,這才是最驚人的發現”[16]46。其次,可視化是一種表征文化大數據所形成的復雜系統結構的直觀方式。無論是作品中的人物關系網絡、作家的文學活動抑或是受眾對文藝作品的傳播行為,其在本質上都可以表征為一種復雜的網絡結構,而可視化無疑是幫助研究者洞察其中的關系特征和動態演變的最有效手段。比如芝加哥大學的霍伊特·朗(Hoyt Long)和理查德·索(Richard So)將20世紀初美國主要詩人在美國文學刊物的作品發表情況轉化為可視化的復雜網絡結構圖譜,并試圖借助社會網絡分析探究全球現代主義詩歌演變背后的協作網絡。[34]147-182目前,這種方法已經越來越多地應用于文本的敘事網絡及文學社會學的研究中。

此外,可視化也是將基于本文的歷史數據與空間要素相統一的一種重要手段。近年來,在數字人文視野中,以文學空間研究為中心的文學地理學正隨著研究技術的進步和研究視線的轉向而異軍突起。[35]122-136+160莫萊蒂在《圖表、地圖、樹形:文學史的抽象模型》一書中,將遠距離閱讀具體化為一種綜合運用圖表(定量分析)、地圖(空間分析)與樹形(形態分析)去研究文學現象的方式。[27]69其中,地圖這一要素不僅能夠將文字序列與空間要素聯系在一起,還能將大量未讀文本的空間結構展現在研究者面前,勾勒出文學構造空間模型的能力。[30]47在《歐洲小說地圖集》(AtlasoftheEuropeanNovel)中,莫雷蒂從文學地理的角度研究倫敦的空間結構,繪制了狄更斯(Dickens)小說中的人物住宅地圖和柯南道爾(Conan Doyle)筆下的犯罪地圖。[22]121-138馬修·威爾肯斯(Matthew Wilkens)在將美國小說文本(1851—1875)中的地名與特定的地理坐標關聯后發現,內戰前后出版的美國小說中超過40%的地理位置都在美國境外,呈現出跨越大西洋兩岸的空間分布特征。這些數據表明19世紀美國文學日益跨國化,同時也表明與移民和城市化相關的人口和經濟流動是這一時期文學發展的重要驅動因素。[36]803-840如今,以文學地理為中心的可視化研究正逐漸演進為開放式、可交互的大型數字人文研究平臺。比如斯坦福大學的“繪制書信共和國地圖”項目[37]59-64,中南民族大學王兆鵬團隊開發的“唐宋文學編年地圖平臺”,浙江大學徐永明團隊開發的“學術地圖發布平臺”等[15]108-129+206-207。

最后,文化大數據的動態呈現與可交互技術,賦予了數據以更加鮮活的生命力,將成為未來數字人文領域的重要發展方向。文化大數據的交互式可視化可以為用戶提供一種自由獲取視覺圖像和數據信息的方式,同時也可以為研究者提供更加動態且高度集成的一體化研究平臺。通俗而言,傳統的數據可視化手段所呈現的視覺內容是固定的、靜態的表征,而交互式可視化提供的是一個“活”的可交互、可實時反饋的信息圖像系統。比如浙江大學開發的學術地圖發布平臺,用戶不僅可以查看變量的各種屬性與數值,還能夠通過不同的索引檢索項分析各層數據之間的關系,通過不同類型數據層的交互發掘其中的內在關聯。[38]113在數字館藏、視覺藝術、文化遺產的圖像分析研究領域,交互式可視化無疑具有更加豐富的應用前景,已經被廣泛應用于數字館藏策展分析[39]159-183、大規模圖像藝術作品比較[40]249-278等具體研究之中。一個典型的例子是清華大學向帆等開發的交互式可視化項目“Award Puzzle”(圖3)。通過收集2276幅全國美展油畫獲獎提名及入圍作品(1984—2014),該項目建立了一個全國美展油畫作品圖像數據庫,不僅能夠幫助研究者辨別油畫作品中的同質化趨勢,還能讓研究者更加直觀地觀察藝術對象,從中發現集體趨勢和個體特征的關聯。[41]92-94

三、余論

在實踐與反思中前行的數字人文,正不斷啟迪研究者以新的視野、方式與手段應對數字浪潮的沖擊。在這一背景下,文化大數據作為一個多層次的概念網絡無疑將在文藝研究中發揮愈加重要的作用。如果說數字人文是使未來文藝研究枝繁葉茂的耕耘重點與前進方向,那么文化大數據則是其中最粗壯的枝干。本文初步闡釋了文化大數據對文藝融合研究范式轉型的驅動作用,但要想使文化大數據這棵樹苗茁壯生長,仍需要有更多縱深式理論挖掘與研究實踐。

在當前的現實語境中,文化大數據無論是從基礎設施還是從方法層面對于文藝研究的支持作用都尚未得到充分發揮,依然面臨諸多問題與挑戰。一個不可回避的問題是,以文化大數據為驅動的融合研究范式仍需直面數字人文領域長期以來的批判性論爭與學理困境,需要在實踐探索中尋求作為文藝研究新形式的合理性通路。應當意識到,與人文研究對于經驗主義和科學性的渴望相對應的,是其長期以來形成的內在的保守主義觀念。計算機技術與大數據賦予了文藝研究新的理論范式、技術工具及分析方法,但計算的思維方式所造成的局限與定勢無疑也需要研究者進行不斷反思。尤其是當數據和技術愈發成為一種潛在的研究綱領和研究的可能性條件后,如果我們單純或過度地依賴數據,將計算機視為“真理機器”,則不可避免地走向數字的暗面。近年來,已有不少學者從意識形態和主體性角度展開對數字人文的集中批判。[43]120-129我們認為這種反思是必要的,然而對于一個方興未艾的研究領域,更為重要的是如何在更加深入的實踐中不斷尋找批判性思考的新路徑。馬克思指出:“全部社會生活在本質上是實踐的。凡是把理論引向神秘主義的神秘東西,都能在人的實踐中以及對這個實踐的理解中得到合理的解決?!盵44]501事實上,我們可以將以文化大數據為驅動的一系列探索性研究視為數字人文視野中的一種實踐過程。以文化大數據為代表的實踐范式,恰恰提供了一種突破數字人文所面臨的定位困境,并在數字時代開放流動的對話范式中建立新的分析方法的路徑。正如前文所述,所謂的“轉型”過程并非是對傳統研究方式的根本性顛覆,而是通過不斷的互補與借鑒嘗試開辟新技術語境中的研究道路,并真正將數據所連接的一系列交叉性實踐活動的目標置于具有真知灼見的啟發性研究中。相比于數據所傳遞的信息本身,透過計算界面探索數據背后隱藏的、被傳統研究實踐所忽略的內容,從而不斷延展文藝研究的可能性則更為重要。在這一過程中,圍繞文化大數據的實踐性探索有助于建立起數字時代有關人類與非人類、人文與技術有效對話的理論體系,并不斷對其衍生的新理論進行檢視。

從關于實踐的討論出發,我們認為在文化大數據的牽引下,圍繞文藝“中心極”的超學科融合研究仍然有很大的空白地帶與發展空間。其中尤為值得關注和思考的問題是,如何在實踐中更好地發揮國家文化大數據體系建設的優勢,將文化大數據的數字資源優勢更好地轉換為立足于中華文化遺產的學術優勢,通過挖掘自身豐富多元的民族傳統與文化遺產以構建新時代的文藝理論體系。2021年以來,《文化遺產數字化采集技術要求》《文化資源數據與文化數字內容重構技術要求》等十余項國家文化大數據建設標準先后發布,中華文化的數字化內容和數據庫體系的羽翼正日益豐滿。在文化大數據體系的建設及應用層面,目前國家文化大數據體系已經形成以文物普查和高清圖像為基礎的中國文化遺產標本庫、以紅色紀念館和國家一級博物館藏品高精度采集和標注為核心的中華民族文化基因庫,以及整合不同類型文化資源的中華文化素材庫②等數據庫體系。但在紛繁浩大的數字化采集工作背后,從文化大數據到知識生產的通道及實踐體系還有待完善。以研究較為集中的中華古籍資源為例,當前工作主要集中于信息處理層面,如古籍數字化轉化、內容標注與識別、圖像庫與知識庫構建等,即文化大數據的基礎層次。而如何能夠將數字化文化資源的利用與前沿大數據分析技術相結合,如何從海量的傳統文化數字資源中挖掘出中國古代文論的批評傳統與理論傳承,孵化出具有漢語理論原創力的成果,還需要大量的探索與思考。最后,數字人文的不斷演進,勢必催生更多、更加豐富的文藝研究議題、目標、對象及方法。新時代的文藝研究,正在知識體系創新、學科交叉融合的浪潮中,呼喚立足于新的歷史階段與技術背景的研究范式和理論體系的創新。這種轉型浪潮不僅是研究層面的,而且同時也是研究者層面的。數字人文學者蘇珊·施賴布曼(Susan Schreibman)與霍伊特·朗都強調跨學科參與者的重要性,[45]14-28這也意味著研究者本身需要更好地了解和掌握一定的大數據知識和基于數字技術的分析研究手段,并且能夠將人文精神與文藝理念貫穿于研究始終。面對數字時代技術飛速發展變遷的趨勢和愈發多元開放的學術環境,研究者不僅需要深刻把握“新文科”戰略背景下數字人文實驗室等新型實踐空間對于交叉型研究團隊的支撐作用,而且更為重要的是,需要形成以文藝研究實踐為中心的超學科融合意識,真正突破傳統研究預設的學科壁壘,將文化大數據的牽引力充分滲入本土化研究的各個層面,推動更多具有中國特色文化身份的創新型研究,在以實踐為中心的范式中不斷延展數字時代語境中中國文藝理論探索的新向度。

① 拓撲閱讀方法是指基于詞頻分析的方法建立大量文本中特定高頻詞(組合)之間的拓撲關系,并繪制拓撲圖,由此可以發現不同作品在風格上的結構性差異。

② 中華文化素材庫包括高校、科研機構和文化企事業單位建成的一系列文化資源數據庫,如中華經典古籍庫、中國文物志、延安時期文獻檔案數據庫等。

猜你喜歡
范式研究者文藝
1942,文藝之春
以寫促讀:構建群文閱讀教學范式
范式空白:《莫失莫忘》的否定之維
高等教育中的學生成為研究者及其啟示
孫惠芬鄉土寫作批評的六個范式
假期踏青 如何穿出文藝高級感?
研究者稱,經CRISPR技術編輯過的雙胞胎已出生??茖W將如何回應?
管窺西方“詩辯”發展史的四次范式轉換
研究者調查數據統計
□文藝范
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合