?

網絡語料庫索引行信息在外語教學中的應用

2010-04-26 09:07趙曉臨東華大學外語學院上海201620
圖書館理論與實踐 2010年6期
關鍵詞:語料庫檢索語義

●趙曉臨(東華大學 外語學院,上海 201620)

20世紀80年代John Sinclair在英國伯明翰大學創建英語語料庫(Bank of English,以下簡稱BoE),開創了具有革命性的由語料庫數據驅動編撰詞典的時代。30年后的今天,除了詞典編撰外,語料庫語言學研究在其他領域也碩果累累,如語料庫數據驅動研究英語本族語者的語言特征、基于語料庫探討外語學習者的中介語特征、建立平行語料庫進行雙語對比研究等等?;诖髷祿恼Z料庫語言學研究成果揭示出許多已有語言學理論中未提及的真實語言的使用特征,如詞匯搭配的語義特征、語言使用的短語學特征,[1]等等。今天“語料庫語言學”這一術語似乎家喻戶曉,然而令人遺憾的是,該領域的許多研究成果并沒有被充分理解,許多重要發現和最新進展沒有應用到語言教學中。近年來中英文在線語料庫不斷涌現,它們為外語教師提供了豐富的真實文本語料,充分利用在線語料庫資源值得外語教學界研究。本文將探討外語教師如何提取網絡語料庫數據,如何分析數據并將結果用于課堂教學。本文討論的語料庫數據主要來源于克林斯在線英語索引行抽樣語料庫(Corpus Concordance Sampler,以下簡稱CCS),英國伯明翰大學由遠程登錄的BoE,以及北京大學漢語語言學研究中心的網絡漢語語料庫(以下簡稱CCL)。

1 索引行信息與外語課堂教學

在語言研究的核心問題上,Sinclair[2]提出的語料庫語言學與Chomsky的轉換生成語言學和Halliday的功能語言學有著很大不同。Chomsky轉換生成語法的哲學基礎是二元論,他將語言分為語言系統(compe tence) 和語言應用(performance),僅關注語言系統的研究;Halliday功能語法的哲學基礎是一元論,他認為語言具有社會性,因而語言研究的對象應該是在社會語境中實際使用的語言。雖然二者研究語言的哲學基礎不同,但他們研究的語言關系卻是相同的,即語言的聚合關系,譬如Chomsky樹形圖中可作為NP的成分,如we,they,I等之間存在聚合(paradigmatic)關系,Halliday的主位結構理論中可充當主位或述位的成分之間也存在聚合關系。而以Sinclair為代表的語料庫語言學家聚焦于真實語言,他們的研究基于大量的真實數據,以復現的語言形式、意義及其內在規律為研究內容,歸納、概括和描述形式選擇和意義實現的機制。[3]語料庫語言學家重視語言的組合(syntagmatic) 關系,認為一個詞的意義存在于它的結伴關系中。[4]他們認為,語言的組合關系更能反映真實語言中各成分之間的關系;同時,語言的組合關系又體現了形式與意義一體的語言內在機制。為說明問題,我們在CCS語料庫中檢索了GET v-ed(動詞過去分詞)型式,可以看到40行隨機索引行。由于版面有限,我們在表1中僅列出10行隨機索引行。

表1 CCS語料庫中GET v-ed的隨機索引行

索引行信息可以為教師提供課堂教學使用的真實文本資料。首先,教師可以根據講課需要自行檢索詞或型式(pattern)。索引行是以某個詞或某個型式為對象的檢索結果,如表1是對GET v-ed型式的索引行檢索結果,它提供檢索對象的組合關系信息,即動詞GET與動詞過去分詞搭配詞的搭配信息。其次,教師可以將索引行結果直接用于課堂教學,也可以將結果作為學生自主學習的材料,由他們總結GET v-ed的語用特征。我們下面將深入探討外語教師如何將表1所示的索引行檢索結果用于課堂教學,啟發學生掌握語言的組合關系。

2 索引行信息與詞匯意義研究

近年來基于大數量真實數據分析的語料庫語言學研究成果證實,自然語言中存在大量重復使用的詞匯搭配。研究表明,大多數日常詞匯沒有獨立的意義,它們形成的多詞型式(multi-word patterns) 構成了文本的重要組成部分。[2]108一方面,詞匯和其搭配詞之間相互依賴,所以在本族語使用的語言中,某些詞高頻共現,極端例子如kith,它只出現在短語kithand kin中。另一方面,更為重要的是,詞匯搭配與意義密切聯系,詞的意義因其高頻共現的搭配詞不同有所差異,而與某個詞高頻共現的搭配詞往往形成一定的語義趨向(semantic preference),從而具有一定的語義韻(semantic prosody)。Sinclair[5]將搭配 (collocation)、類連接(colligation)、語義趨向、語義韻及其之間的相互關聯性稱為擴展意義單位(extended unitofmeaning)。Sinclair的研究方法是從語料庫數據出發,根據上述幾個方面歸納總結出詞或型式的意義。我們仍然以GET v-ed的隨機索引行信息為例分析。對GET v-ed的40行索引行數據分析時,教師可以引導學生按以下步驟歸納該型式的意義。首先,整理語料庫數據。去除含有非動詞過去分詞搭配詞的索引行,如gotused to和got printedmenus共3行索引行。其次,分析GET的動詞過去分詞搭配詞的語義特征。GET的37個動詞過去分詞搭配詞中有15個具有明顯的消極語義特征,如 kicked,teased,bored,fired,fedup,disappointed, blocked, caught, wound, hurt, sidetracke d,frustrated,forced,roped,這些詞占搭配詞總數的40.5%;GET的動詞過去分詞搭配詞中僅有excited一個具有明顯積極語義特征,占搭配詞總數的2.7%;其余21個動詞過去分詞搭配詞本身雖然無明顯語義特征,但是觀察它們的語境意義卻發現,除了包含getstarted和getmarried的共計4個索引行外,其它17個索引行中GET v-ed都含有主語被動行事的意義,這類動詞過去分詞搭配詞約占搭配詞總數的50%,如“…youwere going to blow him up when you gotcoked to the gills on you heroin!”。再次,我們在BoE中檢索上述GETv-ed型式,可以按照頻數及互信息值MI分別檢索,用以檢驗CCS的檢索結果。按照頻數提取的搭配詞,頻數越高,說明它與GET共現的次數越多;MI值則提供兩個詞之間搭配力強弱的信息。MI為正值,說明二詞之間存在相互吸引。MI值越大,二詞共現的概率越高,故搭配力越強;反之,MI值越小,搭配力越弱。雖然按照MI值提取的搭配詞可能包含語料庫中詞頻很低的詞,但是它是反映短語中二詞間聯系的緊密程度的有用指標。結果發現在BoE中共有12313索引行,頻數值和互信息值排在前20位的動詞過去分詞搭配詞檢索結果如表2所示。

表2 BoE中GET的右1動詞過去分詞搭配詞

按照對表1索引行信息的處理方法分析表2數據,表2中的頻數和MI值數據說明,GET與具有消極語義特征和中性語義特征的動詞過去分詞搭配力非常強。觀察其語境意義也表明,GET v-ed具有消極和中性語義特征。

綜上所述,詞的意義不僅指傳統上的“詞典意義”,還應當包括與該詞有著組合關系的搭配詞的意義,以及搭配詞所產生的語義趨向和語義韻,或語義特征,即積極、消極或中性語義特征。語料庫語言學強調觀察的重要性,它以詞匯為研究的出發點,探討詞匯為中心的詞匯—語法(lexico-grammar),探討詞匯與語法的組合,以及詞匯—語法與意義和功能的密切關系。對于中國學習者而言,詞匯知識是他們學習的基礎,也是他們使用英語的難點。中國學習者往往以為掌握了英語詞匯,但是在與其他詞搭配使用時卻常常與英語本族語者的用法相去甚遠。中國學習者需要更多地了解英語本族語者的高頻搭配信息,網絡語料庫索引行檢索在今天的英語教學中可以發揮重要作用。

3 索引行信息與英漢詞匯意義對比研究

對中國學習者而言,詞匯之間的搭配使用是英語學習的難點之一。由于所蘊含的文化背景知識不同,英文和中文之間存在很大的語義趨向上的差異,這一點也給外語教師的課堂教學帶來了困難。英漢語料庫的索引行信息對比,可以為外語教學提供大量語言差異方面的信息。譬如教師可以提取同義詞或短語的索引行,分析搭配詞的語義特征為學生講解意義差異。我們下面以英語同義詞completely和utterly為例分析索引行數據如何應用于課堂教學。在CCS語料庫中分別檢索與上述兩個副詞與形容詞搭配的索引行,completely的形容詞搭配詞有:new,free,different,foreign,true,automatic,pleasurable,separate,harmless,unconscious,unresponsive等,搭配詞中既有褒義詞,也有貶義詞和中性詞;utterly的形容詞搭配詞中絕大部分具有消極語義特征,如inexcusable,ridiculous,impossible, bare, unfamiliar,miserable, wrong, ruthless等。因此,盡管completely和utterly都對應中文“完全地”,但兩詞的形容詞搭配詞卻反映出它們具有不同的語義特征。utterly吸引具有消極語義特征的詞匯,所以它高頻與貶義詞搭配使用;而completely與積極、消極和中性語義特征的詞都可搭配使用,語境意義相對復雜。

如何用英文表達中文的“問題”也常常給中國學習者帶來問題。我們在CCL中檢索“問題”,可以得到表3所示的索引行。

《九章算術》中。在第八章“方程”中,第一個方程,得到的未知數值稱為方程的解。許多實際最高冪數,稱為方程的冪次。在用方程解決實際紀,中國的《張丘建算經》中有一道著名的百雞他讓兩個資格、職位相同的候選人解答下面這個著人類社會實踐活動的增加,需要研究各種運動們同時從兩地起飛,幾天后相遇?這個有趣的我們的祖先是用比例方法解決這個問題問題問題問題問題問題問題問題是計算糧食問題:“今有上禾三秉,中禾都可以歸結為解方程問題,這使得方程用時,首要的是設未知數,然后根據條件列:“百元買雞百只,小雞1元3只,母雞3,誰先答出就提拔誰?!坝腥嗽诹种猩?,即對運動物體的數量關系進行刻劃,這就出自中國古代數學名著《九章算術》,書的,他們充分認識了比、分數、除數的相

中文的“問題”和英語的“problem”對等嗎?我們在BoE中檢索了“problem”,結果如表4所示。

觀察表3中“問題”和表4中“problem”的語境不難看出,中文的“問題”比英文中的“problem”語義寬泛,中文的“問題”可以意同英文的“problem”,指“困難之事”,也可以指話題或議題,即意同英文的“topic”或“issue”。所以,作為如何表達中文“問題”的課堂材料,教師應當檢索至少上述3個單詞的索引行,并比較這些索引行中檢索詞的搭配詞及其使用語境,使學生對它們的語義特征的差異有更加深刻的認識。

obvious.Ministersacknowledged the them?Whatdo ITHINKcaused the in theGulfhad complicated the whichhavenotyetencountered the theselectcommitteehasexposed the solving;wehaveidentified the They thoughttheyhadsolved the to6x4 inch.Sofar I’vesolved the problem problem problem problem problem problem problem problem sevenmonthslater,when full[P][P][h]Whatdo Ithink can.Hesaidhiscountry,whichisdue should commenceimmediate.Now itisup totheGovernmentto;weknowhow theproblemcanbe,butIwanted toshow them the byhavingselectivelycropped

4 結語

作為經驗主義學派,語料庫語言學探討實際生活中真實的語言。語料庫不僅為外語教師提供課堂教學素材,也為中國學習者自主學習提供參考。利用網絡語料庫的索引行信息,一方面,外語教師可以引導學生歸納檢索詞或型式的常用搭配,討論搭配詞的語義特征,從而更好地理解檢索對象的意義及其用法;另一方面,外語教師也可以引導學生對比英語索引行和中文索引行的差異,總結中英文用詞乃至謀篇方略的異同??偠灾?,如果外語教師更多地將本族語者的真實語料引入課堂教學,必將對中國學習者習得并表達自然、貼切的語言起到很好的作用。

[1]趙曉臨,殷耀.語料庫研究的課堂教學價值——評《從語料庫島課堂:語言使用和語言教學》[J]. 外語界,2009(3):88-92.

[2] Sinclair J.Corpus,Concordance,Collocation[M].Oxford:Oxford University Press,1991.

[3]衛乃興.John Sinclair的語言學遺產——其思想與方法評述 [J].外國語,2007 (4):14-19.

[4] Firth JR.Papers in Linguistics 1934—1951[M].London:Oxford University Press,1957.

[5] Sinclair J.Trustthe text:Language,Corpusand Discourse[M].London:Routledge,2004.

猜你喜歡
語料庫檢索語義
語言與語義
《語料庫翻譯文體學》評介
“上”與“下”語義的不對稱性及其認知闡釋
專利檢索中“語義”的表現
基于COCA語料庫的近義詞辨析 ——以choose和select為例
基于JAVAEE的維吾爾中介語語料庫開發與實現
語義分析與漢俄副名組合
國際標準檢索
國際標準檢索
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合