?

哈金小說《等待》的讀者接受研究
——基于Python的情感分析方法

2024-01-18 10:51
閩西職業技術學院學報 2023年4期
關鍵詞:哈金評論者等待

黃 劍

(南昌大學外國語學院,南昌 330000)

華裔美國作家哈金的小說《等待》在美國聲名遠揚,引起學術界廣泛關注。根據余小梅對21 世紀以來CSSCI 及其擴展版期刊的統計,有關《等待》的研究論文主要涉及道德問題、作者的批判觀點、創作與批評、離散書寫、孔林形象、風格、主題、東方主義、語言、文化翻譯以及將就的婚姻觀等[1]。蔣東梅對哈金作品的研究總結發現,主要的評論范式包括后殖民主義批評、存在主義和形式主義[2]。然而,這些研究大多從文本角度出發,未將文學作品涉及的重要維度——讀者,納入考慮。讀者對作品的接受是文學作品實現其旨歸意義的關鍵,缺乏對讀者的研究可能使對作品的解讀顯得不完整。亞馬遜網站作為美國最大的電商購書平臺以其眾多的圖書信息、客觀公正的言論和全社會的廣泛參與享有盛譽[3]。同樣,好讀網站作為圖書分享型社交網站,已經匯聚了龐大的圖書評論信息,截至2019 年,注冊用戶已達到9 000 萬[4]。本研究的數據來源于這兩個網站,但由于信息量巨大,單純依靠人工檢索難以有效收集和處理。因此,迫切需要計算機技術介入以幫助用戶采集和整理相關評價信息。正如俗語所言,“工欲善其事,必先利其器”,情感分析方法是解決這一問題的良好途徑。以哈金的小說《等待》為例,本研究選取了亞馬遜和好讀網站上讀者對《等待》的評論進行情感分析,旨在探究讀者評論的特點和規律,試圖揭示本小說成功的秘訣,為中國故事走向世界提供參考。

一、情感分析的研究原理及可行性

情感分析(Sentimental Analysis),又稱意見挖掘(Opinion Mining)或情緒人工智能(Emotion AI),是一種運用自然語言處理技術對文本的情感傾向性進行分類的方法。本過程涉及對主觀信息的提取、量化和研究。情感分析的分類包括極性(積極、消極、中立),情感(喜愛、厭惡、傷感等),迫切度(迫切或不迫切)和傾向(感興趣或不感興趣)。其目的在于發現文本中的積極或消極情感因素,通常應用于商品評論信息和公共輿論的分析。在商品評論方面,生產者通過抓取商品評論數據可以了解消費者對產品的體驗和反饋,以生產更符合市場需求的產品。同時,消費者通過評論了解產品質量等信息,優化購買決策。在輿情監測方面,情感分析通過提取和分析社交媒體上的用戶評論,了解公眾對重大事件和公共政策的情感態度。[5]

情感分析目前主要采用機器學習和情感詞典兩種方式。機器學習方法利用未標記的語料和人類對語言的理解,使機器能夠有效識別文本的情感傾向。情感詞典方法則利用文本中帶有情感傾向的極少數詞匯對文本進行分類,通過構建樸素貝葉斯分類器等算法實現[6]。在構建情感分類器時,需要進行特征選擇、特征權值計算、分類器訓練和分類器測評等步驟。構建情感詞典時,需要人工標記文本的情感傾向,計算情感傾向通常取決于文本中的較為極端的詞匯,如褒義詞和貶義詞等[7]?;谇楦性~典的方法是在構建情感字典的基礎上實現的。由于Python語言開源性、可擴展性等特點,且網絡上有許多現成的標準庫,可以利用開源代碼平臺上的工具包和情感字典進行情感分析。TextBlob 是一個基于Python 的文本處理程序庫,可執行多種自然語言處理任務,如詞性標注和情感分析。

二、情感分析的實驗過程

利用Python 程序導入csv、time、requests 等庫向亞馬遜及好讀網站中哈金《等待》一書的讀者評論頁面發起訪問請求,進行數據爬取。筆者在亞馬遜網站爬取相關讀者評論共計346 條,在好讀網站爬取到1 199條評論。由于好讀網站默認只顯示300條讀者評論,且較長的評論用more 條件隱藏,故在抓取時將讀者評分(1~5級)和more隱藏內容作為篩選條件,成功抓取到全部讀者評論。抓取時保留評論者用戶名、評論日期、贊同數及評論內容等有效信息。獲取的讀者評論輸出為一個csv 表格文件。從抓取的總計1 545條評論中剔除亂碼、重復評論及無法判斷情感傾向的無效讀者評論33 條,余下1 512 條有效評論。

在任務管理器命令行運行清華大學pip源(地址為https://pypi.tuna.tsinghua.edu.cn/simple/),下載TextBlob 和wordcloud工具包并安裝。在Python中導入用于情感分析的工具包TextBlob。TextBlob 是用Python 編寫的開源程序庫,具有詞性標注、名詞性成分提取、情感分析等功能,在此調取其情感分析功能。隨后導入wordcloud 程序庫,從而以關鍵詞為單位更加直觀地呈現讀者評論的情感傾向。進而利用pandas 程序庫以便Python 讀取之前保存的csv 表格中的讀者評論并進行情感分析。接下來,筆者定義了函數get comments,用于獲取評論中的所有單詞;再定義函數get wordcloud,用于詞云的生成;再設置一個用于獲取情緒極性評分的函數get rating comments,計算每條評論的情緒極性評分,并劃定閾值將評論分類為積極、中立或消極。TextBlob 工具包返回的讀者評論數據情感極性值在-1 到1 之間,如極性值為正,評論被視作積極;如極性值接近0(區間為-0.05 到0.05),則視為中性;若極性值為負,則視作消極。所有搜集到的讀者情感極性值被輸出為csv表格文件,從而便于對讀者對《等待》一書的接受程度進行總體、直觀、定量的分析。

(一)讀者的總體評價

在對抓取到的1 512 條評論進行智能情感分析后發現,積極評價有1 096 條(占72.5%),正向情感極性均值為0.24,中性評價有219 條(占14.5%),消極評價有197 條(占13 %),負向情感均值為-0.22,讀者正負情感評論數量比約為5.5:1,故從網站讀者評論分布以及讀者評論量化分析來看,讀者對本書總體上持肯定態度。另外,就讀者的評分而言,從筆者抓取的2 個網站評論數據看。從總體評價看,好讀網站中《等待》一書的讀者評分為3.52 分(滿分為5 分,即5 星),顯得差強人意。其中,給出5 星評價的讀者有3 216 人(占16%),給出4 星和3 星的讀者分別為7 296人(占36%)和6 682人(占33%),打2星以及1 星的讀者也分別達到2 195 人(占11 %)和555 人(占2 %)??梢?,好讀用戶對本書的評價呈“中間大、兩頭小”趨勢,兩極化的評論相對偏少,而中等偏上的評論(4 星和3 星)占大多數。亞馬遜網站的446 名讀者對本書給出了4.1 分的總體評分(滿分亦為5 分)。其中,5 星評論占172 條(占52%),4星評論占143 條(占23 %),3 星及以下評論則只有131 條(占25 %)。相對而言,亞馬遜用戶給本書的總體評分較高,且評分多集中于高分段。網站的星級評價得分與本次實驗的情感分析結論結果一致,呈正比例關系。

將評論分數降序排列,選取其中情感極性值排名前10%且長度達到30 詞的前100 條評論,筆者發現對《等待》一書做出正面評價的讀者,大多提到以下幾點。一是對小說標題的隱喻性表示認同,引起多位讀者共鳴。多位評論者認為等待具有普適性,且具有多重指涉性,不僅指孔林為離婚而等待了漫長的18 年,而且喻指我們每個人的生存狀態。有的評論者指出,我們活著的每一個人都是在等待,等待死亡,不管你是盡你所能掌控人生,還是日復一日如機器人般重復日常生活。有的評論者指出,標題即是主題,發人深思,我們多少次在等待,我們等待過多少東西?標題就是我的感受,我一直在等待。有的評論者指出,只有讀到書的末尾,才明白真正等待的人不是孔林,也不是曼娜,而是淑玉,她的等待最終有了回報。根據哈金的設想,讀者也應該耐心等待結局。為何是“18 年”的等待,它喻指古代傳說故事,王寶釧在寒窯苦等薛平貴18 年,卻不知,后者已在軍中娶妻,哈金是在寫一個現代版王寶釧和薛平貴的故事?!兜却分械闹魅斯寄茉谕鯇氣A和薛平貴故事中找到對應者。二是對小說的哲理性有同感,引發出對人性的思考,發人深思。評論者認為從書中得到人生的教訓。多位評論者引用諺語“The grass is always greener than the other side”指出人總是覺得得不到的才是最好的,殊不知幸福往往就在身邊,而我們卻去追求很多沒有得到的東西??琢值慕Y局就是這樣,費盡心思與淑玉離婚,等到最后真正離婚了,卻發現淑玉的好,又想念以前的生活,故事令人意外的結局也更彰顯了此書對幸福真諦的探求。有評論者喜愛哈金以反思的方式描述已婚軍醫和護士純真但卻有違世俗的愛情故事。有評論者指出,這個關于愛情、人生和等待的故事越讀越有趣,也讓他越來越理解書中人物,結局具有相當的開放性,預示更多的等待。三是關注哈金的寫作,對他高超的英文寫作水平表示贊揚,為一個中國人用非母語寫作而能達到語言優美、地道而驚嘆不已。有評論者指出哈金有望復興美國極簡主義寫作風格,他柔和、不張揚的敘事風格讓我們了解了人物,節奏悠閑,時不時地用溫和的幽默給這部作品增添幾分趣味。

(二)詞云圖解析

通過Python 中導入的wordcloud 工具包篩選出讀者評論中出現頻度最高的關鍵詞繪制詞云圖,見圖1。其中出現頻率越高的關鍵詞字號就越大,視覺效果越突出。為更準確了解關鍵詞出現情況,筆者統計出關鍵詞出現頻次表格,見表1。據此,可以直觀地了解讀者最為關注的熱點及情感態度。讀者評論中出現頻次最高的主題詞大致可以分為三類:一是作品名、角色名及作者名等,如等待(waiting)、哈金(Ha Jin)、孔林(Lin Kong)、淑玉(Shuyu)、曼娜(Manna),其中等待出現452 次,哈金出現224 次;二是作品組成要素,如人物(character)、故事(story)及寫作風格(writing),其中故事出現613次,位居榜首,人物出現564 次,writing 出現165 次,可見評論者最為關注的還是小說講述的故事本身,故事中出現的人物和寫作方式也很受關注;三是讀者閱讀后的感受與評價,如有趣、好及享受,其中給予好的評價次數達到203。

表1 關鍵詞出現頻次表

圖1 讀者評論詞云圖

(三)讀者評論關注的作品特征分析

表1 可見讀者較多關注小說的人物、故事、寫作這三方面作品特征,經過Python分析,得出亞馬遜和好讀網站讀者對這三者的情感態度??梢钥闯?,故事的積極情感均值得分最高,讀者對故事的評價最高,人物、寫作其次。在亞馬遜網站,積極情感分值最高的為故事(0.1948),依次為人物(0.1788)、寫作(0.1780);在好讀網站,積極情感分值最高的為故事(0.2127),依次為寫作(0.1909)、人物(0.1822)。

1.關于故事的評論分析。在所有讀者評論中,關于故事(story)的讀者評論所占比重最大,共613條。在亞馬遜網站的共計346 條評論中,含關鍵詞story 的有182 次,其中積極的最多,占152 條。在相關評論中大多對故事情節進行概述,或進行積極的評價。好讀網站的1 199 條評論中,含關鍵詞story的有431條,其中積極的為最多,占348條,積極評論情感極性均值為0.213。故事的情感均值為0.230,在三者中分值最高,是讀者最為滿意的作品元素。小說本就是講故事的藝術形式,故事選擇得恰當,作品也就成功了一大半,多數評論者對中國20世紀60—70 年代的社會及人物故事好奇感興趣。有評論者認為選擇這段時期的中國愛情故事,像打開了另一個異國歷史的世界。雖然是小說,但是小說故事有可能是真實發生的事情。優秀的作家都是講故事的高手,哈金就是杰出的故事講述者。有評論者認為,哈金帶著憐憫與忠實,能夠編制一個有著復雜人物關系的故事。多位評論者提到故事精彩的開頭,稱其一下子抓住讀者,非常吸引人。也有評論者提到,小說以完美連貫的方式敘述了一個跨越18 年的令人傷心的愛情故事??梢?,打動人心的故事能跨越國界和語言的障礙。不少讀者對特殊年代下主人公孔林為了離婚進行的漫長等待感到惋惜,有評論者指出:根據中國當時的法律,如果沒有妻子的同意,男主人公只有18 年后才能與妻子離婚。他的生活是如此痛苦和無價值。也有人對當時制度和中國傳統文化中的包辦婚姻等因素對人們欲望的壓抑提出了思考——也許等待并不只是小說真正的主題,作者只是利用孔林的故事描繪20世紀70—80年代普通中國人的生活。這部小說的動人之處在于它反映了中國社會的劇烈變化。

涉及故事的消極評價中,有評論者指出,本書獲獎是由于符合西方大眾對舊中國陋習的指責,哈金旨在講述一個有異國風情的故事,他的偏見顯而易見,故事沒有什么發展,沒有深層次內涵,沒有喚起讀者同感,只是在意識形態方面極力展示中國的一些不好的風俗。有評論者指出,故事的無趣沉悶讓他想起日裔英國作家石黑一雄的風格;不同在于,哈金采用第三人稱敘述,而非第一人稱,但結局卻發人深思。讓人想起伊索的狗骨頭寓言,它總是想要不能擁有的東西,當它得到了它想要的一件東西時,它仍然想要另一件東西。

2.關于人物的分析。關于人物的讀者評論也大多持積極態度,以亞馬遜網站為例,168 條涉及人物(character)的評論,積極的有135 條,情感極性均值為0.179。好讀網站與人物相關評論則有396 條,其中傾向為積極的有306 條,情感極性均值為0.182。部分讀者認為男主人公孔林比較被動、軟弱,性格優柔寡斷,遇到難題就是視而不見,不做決定,抱著順其自然的想法。有些人則同情淑玉這一傳統女性的角色??琢值钠拮邮缬癫⒉皇浅鲇诮疱X等現實原因拒絕離婚,她只是一個樸素的傳統中國女人,這從她裹著小腳這一點可以看出。也有人從更深層次的時代背景和傳統文化角度出發,認為這些因素抑制了個人的情感。也有讀者為孔林對淑玉的所作所為哭泣,但依然擔心他,想質問他,知道什么是幸福嗎?盡管他只是小說中虛構的人物。還有評論者喜歡孔林,認為他是好人又謙遜,曼娜也是好人只是有點軟弱。

涉及人物的消極評價中,有評論者指出人物就像木偶,傳遞著沒有多少情感的臺詞,而且人物也不可信,他們的舉止和個性令人惱火??琢炙洑v的等待是懦弱的表現,得不到讀者的任何同情,淑玉的愛和等待逐漸變成一種可悲的渴望,她希冀實現沒有真正感情基礎的家庭團圓。

3.關于寫作技巧的評論分析。統計結果顯示,讀者大多對哈金的寫作技巧(writing)持正面態度。亞馬遜網站涉及寫作技巧的63 條評論中正向評論有53 條(占84.1%)。好讀網站相關評論有144 條,其中積極評論108 條,情感極性均值為0.191。其中不少評論都用了非凡及好這樣的形容詞來描述哈金的寫作,例如:“哈金的寫作風格十分出色。我很享受關于現代中國的故事,它揭示了生活的本來面目?!惫鹩煤啙嵉珔s美麗的語言,提醒文學創作的目的——讓讀者愛讀。有評論者認為其寫作讓人想起賽珍珠的小說《大地》。賽珍珠的《大地》的確與《等待》有一定的相似性。一是體現在兩位作家都未借鑒運用現代或后現代的寫作技巧。哈金曾表示,魔幻現實主義創作技巧在歐美早已失去市場,他也沒有試圖運用這些技巧以增加故事的怪異性。而賽珍珠對西方意識流小說的批判也可以看出她的詩學觀念。她指出西方小說中作者所做的各種各樣的實驗讓讀者覺得大多有些熟悉,用一些諸如人生的片段、意識流之類的陳腐語句來表述[8]。二是中文特色語言的直接英譯,未加注釋。在《等待》中文版中“世上沒有不透風的墻,在英文版中直接寫成“there’s no wall without a crack”,再如“不做虧心事,不怕鬼敲門”,也是直接寫成“If you had not done anything to be ashamed of, you would not be afraid of a ghost knocking at your door.”賽珍珠在《大地》中,用“fire dragon”指代“火車”,用“morning rice”“noon rice”指代“早飯”“中飯”。三是兩位作家都走寫實主義路線,敘述客觀自然,遵循人物命運的變化。在《等待》《大地》中多是極簡地運用白描手法,不重渲染。

為數不多的消極評論中,有人認為寫作過于簡化,另外哈金的寫作方式讓人感覺此書像翻譯糟糕的作品。有必要指出的是,本書哈金用英文寫成,再傳到國內由中國人翻譯成中文,書中關于有中國特色的詞匯等可能會讓母語非漢語的讀者產生理解上的困難。

三、情感分析的實驗結論

情感分析是量化海量網絡數據的有效方式,借助情感詞典及Python 技術,對網絡平臺不易直觀的讀者評論進行量化統計,得出情感評價趨勢及特征,是有益的嘗試,也是把文學與計算機科學結合的探索,為中國故事走向世界提供借鑒。人工智能技術能夠極大提高工作效率[9]。

在本次實驗中,發現讀者對哈金小說《等待》的積極評價占比最高,中性評價次之,消極評價最少。從熱門評論看,讀者關注小說標題的隱喻性、小說蘊含的哲理性和哈金高超的寫作水平。從特征情感看,讀者最為滿意的是故事,人物和寫作次之。這也提示我們,故事是讀者最為感興趣的部分,人物的塑造和寫作的方式也是讀者關注的地方。

《等待》講述的是中國20 世紀70—80 年代的愛情故事,故事發生的時空背景對于異國讀者都是陌生的,極具民族性,其中蘊含的卻是人類共通的情感,故事因而具有了世界性價值。哈金正是把富有民族性的一個中國故事,用英語講述出來,走向了世界。

由于本書是一本描述20 世紀60—70 年代東方國度的小說,他們中不少人是因為本書曾獲得國家圖書獎、??思{獎等獎項才對其產生好奇與關注。之后很多讀者在評論中會談及本書標題和內容的關系,有讀者認為標題恰如其分,高度概括了男主人公孔林——一個懦弱的醫生為了與包辦婚姻中的妻子離婚而做出的長久、無意義的等待。大部分在好讀網站給出3 星以上的讀者總體上給此書做出了正面評論,且許多讀者在讀書前后對本書的背景及中國文化是有一定了解的,愿意放下一些先入為主的觀點代入到故事情節,評論較有深度且獨到,對故事的時代背景和人物性格做出了精準的分析,體現了好讀與亞馬遜網站讀者的專業性。有相當部分的讀者認為本書足夠好或值得推薦,也有讀者夸贊哈金的英語寫作能力。

但是不少讀者(尤其是給出3 星的讀者)在總體肯定本書的同時,也指出了一些不足之處。有的讀者指出這本書僵硬乏味且滯澀。有的讀者認為這本書在其精彩的開頭之后,沒有能保持住這個勢頭,甚至感覺對全書有些五味雜陳,認為盡管這本書不壞,但卻不值得向他人推薦,并描述了眾多文學獎容易抬高讀者預期的情況。有的讀者認為本書所用語言過于簡單,甚至是欺騙性的簡單,僅有一些對風景的描寫勉強談得上美麗。有的讀者認為本書的標題和全書都十分普通,就如同這本書的主角孔林一樣乏善可陳,因為孔林是一個沒有真正生活目標、隨波逐流的人;同時認為本書也有可取之處,比如對夢境的描寫為本書增添了些許童話色彩,還有孔林對他的“第二自我”說話的樣子,就像一種對自己道德和價值觀的拷問。有的讀者提到自己對中國文化的不了解,強調書中描述的中國現實、政治與風俗習慣與自己作為西方人所經歷的都不同,認為這本書與自己通常閱讀的書都不相同,因此需要花費時間來達到沉浸式閱讀體驗。此外,書中的人名、地名,諸如林空、淑玉以及鵝莊,都給讀者帶來一種異域文化的沖擊。

猜你喜歡
哈金評論者等待
人工智能技術的電子商務虛假評論者檢測
你的過去在你臉上——哈金訪談錄
哈金
信封里的頭發
基于D-S證據理論的電子商務虛假評論者檢測
安靜的等待——觀《歸來》有感
在希望與絕望的旋律中交織
閱讀教學:“吻醒”文本的過程
“等待”讓學生擁有更多的出彩機會
基于情感特征和用戶關系的虛假評論者的識別
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合