?

中國學習者英語標點符號習得探析
——一項基于中國學習者英語語料庫的研究

2015-11-04 07:15
浙江外國語學院學報 2015年1期
關鍵詞:連接詞句號逗號

于 洋

(中國地質大學(北京) 外國語學院,北京 100083)

中國學習者英語標點符號習得探析
——一項基于中國學習者英語語料庫的研究

于 洋

(中國地質大學(北京) 外國語學院,北京 100083)

文章以中國學習者英語語料庫為基礎,運用AntConc3.4.1w檢索工具,從分析標點符號誤用現象出發,對中國學習者英語標點符號的習得情況進行研究,并探討該研究對英語教學的啟示。研究發現:不同層次的學習者在標點符號習得上表現出一定的規律性,同時又有所差別。標點符號失誤隨著學習層次的提高而減少,不同層次學習者在標點符號習得上的難點是相似的,即逗號和句號。學習者的失誤主要是由于母語負遷移作用和英語連接詞使用的影響而形成的。

英語標點符號;標點符號習得;母語負遷移;連接詞;中國學習者英語語料庫

一、標點符號習得的提出

黃伯榮和廖序東指出:“標點符號是輔助文字記錄語言的符號,是書面語的有機組成部分?!盵1]對于英語和漢語這兩種分屬不同語系的語言來說,比較明顯的標點符號差異在于句號和省略號的書寫形式、頓號和書名號(英語中不存在)等。母語的負遷移作用使得中國學習者在英語書面語中常出現以下類似的錯誤:Last month Tom visited Beijing、Shanghai and Guangzhou. 該例句中,學習者在列舉事物時沒有使用逗號,而是根據漢語習慣誤用了頓號。Quirk等[2]認為,英語標點符號用來指明語法、語義或語用關系。標點符號與詞匯(特別是連接詞)、句法都密切相關,因此學習者對標點符號的習得直接或間接地影響他們對整個語言的習得。這就引發了我們對標點符號習得的思考。

就目前掌握的資料來看,有關二語標點符號①的研究主要包括三個方面:(1)二語標點符號使用失誤研究,例如呂巖借助語料庫分析了大學英語學習者的標點符號使用情況,探討了標點符號使用中的失誤及對英語寫作教學的啟示[3];(2)二語標點符號教學研究,例如Osborne研究了如何利用標點符號促進語法教學[4],Meloni探討了如何利用網絡資源進行以英語作為第二語言的標點符號教學[5];(3)二語寫作中的標點符號研究,例如Mugharbil[6]、Knoch[7]把標點符號與拼寫、首字母大小寫、分段一同歸為寫作技巧,他們的研究發現寫作水平越高,標點符號錯誤越少。

總結以上研究,我們可以發現,以往對于二語標點符號的研究大多沒有真正把標點符號的習得放在二語習得的層面上加以探討,也缺少針對不同水平學習者的研究。其中,Mugharbil的研究[6]雖然是二語標點符號習得領域較為系統的一項研究,但他沒有考慮研究對象的母語背景②??偟膩碚f,標點符號在一定程度上受到了忽視,標點符號習得研究領域存在著空白點。

本文以中國學習者英語語料庫(Chinese Learners’ English Corpus,以下簡稱CLEC)為基礎,從分析標點符號誤用現象入手,對不同水平的中國學習者的英語標點符號習得情況進行研究,并探討該研究對英語教學的啟示。

二、研究假設

中國學習者習得英語的過程是中介語的形成過程。中介語(interlanguage)指的是語言學習者在習得第二語言時所擁有的一種獨立的語言系統,這種語言系統在結構上既不是學習者的母語也不是目的語,而是介于兩者之間[8-9]。Nemser稱之為“近似系統”(approximative systems)[10]115,認為二語習得的過程是這一系統逐漸接近目的語的過程[10]。據此,本文提出:

假設1 中國學習者在習得英語標點符號時,學習層次越高,所犯錯誤越少。

劉重德[11]和連淑能[12]指出,漢語書面語中的長句一般用逗號把句子切開,英語句子由于連接詞的作用則顯得長而復雜,甚至中間沒有標點符號而一氣呵成。漢語重意合,句子之間經常依賴內部的邏輯關系聯系在一起,“形散而神聚”;而英語重形合,句子之間往往借助各種語言形式緊密結合,例如連接詞。因此,漢語中逗號使用較多??紤]到母語的負遷移作用,本文提出:

假設2 針對逗號——在不需要使用逗號時,中國學習者會過多地使用逗號,這就會出現較多的逗號冗余或句號誤用為逗號的情況。

假設3 針對句號——在需要使用句號時,中國學習者很可能不使用句號,而是使用逗號代替。

另外,冒號等標點符號在英漢兩種語言中的用法也有較為明顯的區別。如在表達“說話者說……”時,英語中多用逗號引出直接引語,而漢語中一般用冒號。鑒于這類標點符號在CLEC中的出現頻率較低,數據的說服力不強,本文在此不作深入的探討。

三、研究設計

本文采用基于CLEC的中介語對比分析方法,以AntConc3.4.1w為檢索工具。CLEC語料總量為107.0602萬詞,包含st2(高中生)、st3(大學英語4級)、st4(大學英語6級)、st5(英語專業低年級)、st6(英語專業高年級)五個子庫,它們的庫容分別為20.8088萬詞次、20.9043萬詞次、21.2855萬詞次、21.4510萬詞次、22.6106萬詞次。為了便于縱向研究,本文從CLEC中選取了st2、st4和st6這三個子庫。首先,用AntConc3.4.1w軟件檢索出所有標點符號使用失誤(桂詩春和楊惠中[13]在CLEC中將其標記為sn9);然后根據前文提出的假設,按照不同標點對失誤進行歸類,對它們進行進一步的標注;最后將標點符號使用失誤的頻數進行基數為20萬詞次的標準化計算,得出相對頻數,用AntConc3.4.1w來作數據的統計與分析。本文所作的標注包括各類標點符號的缺失、冗余以及它們之間的誤用,共計54種,每一處標點符號使用失誤都標有唯一的一個標注碼,例如sn910表示逗號冗余,sn911表示逗號缺失,sn912表示句號誤用為逗號?,F列出部分標注碼及具體示例,如表1所示③:

表1 部分標注碼及示例

編號標注碼失誤類型示例1sn910逗號冗余probablysay“no”.Tohelp,[sn910,s]thosepatientstogo2sn911逗號缺失Iflifeislikethat[sn911,s]It[fm3,1-]ismeaningless3sn912句號誤用為逗號free-medicalcareservice[sn912,s],Therefore,hastening4sn920句號冗余themainreasonisthat.[sn920,s-]people’squalityistoo5sn921句號缺失toreducesuchpossibility[sn921,s]CarWenmei,anassociate6sn922逗號誤用為句號women,buttoincreaseit.[sn922,-s-]for[sn8,-s-]thewomen

四、結果與討論

針對前面提出的三個假設,本文對數據作了統計,現將結果進行分析與討論。

(一)統計結果

在標注過程中,本文補充了存在于CLEC而為桂詩春和楊惠中[13]漏標的一些sn9失誤現象,同時忽略了一些存在疑義的CLEC原有標注。表2匯總了三個子庫的標點符號失誤頻數以及相對失誤頻數。

表2 標點符號失誤頻數總表

子庫st2st4st6失誤頻數977383406相對失誤頻數939360359

為了更清楚地反映整個語料庫的情況,現列出桂詩春和楊惠中[13]712提供的標點符號失誤頻數(表3)以作對比。他們認為,與st3和st4相比,st5在標點符號方面失誤較多,并由此得出結論:標點符號失誤不一定隨著語言能力提高而減少[13]。這與前面提出的假設1相悖,本文將在分析與討論部分對此作進一步的探討。

表3 CLEC各子庫標點符號失誤頻數表

子庫st2st3st4st5st6失誤頻數1083668408773395相對失誤頻數1041639383720349

針對假設2和假設3,本文通過圖1和圖2來分析逗號和句號的失誤類型與相對失誤頻數④。

圖1 逗號失誤分布折線圖

圖2 句號失誤分布折線圖

下面將對這些數據統計結果進行詳細的分析與討論。

(二)分析與討論

1.對假設1的檢驗及原因分析

表2顯示st4和st6的相對失誤頻數低于st2,經過卡方檢驗,st2與st4、st6的相對失誤頻數存在顯著差異性(見表4)。

表4 st2與st4、st6相對失誤頻數卡方檢驗

子庫卡方值P值st2-st4273.99<0.01st2-st6286.93<0.01

總體而言,學習者層次越高,所犯錯誤越少。這說明中介語的發展是一個不斷向目標語漸進的過程,這個結果和假設1吻合。但我們也應注意到,st4與st6的相對失誤頻數較為接近。特別是桂詩春和楊惠中[13]712提供的數據(表3)更是顯示出較高層次學習者(st5)所犯錯誤反而更多??梢詮膬蓚€方面解釋這個現象:其一,學習者提高的過程不是一個直線上升的過程;其二,高層次學習者隨著詞匯、句法知識習得的進步,寫作中所使用的句子結構更加復雜,有可能在標點符號使用中出現新的錯誤。

為了進一步檢驗假設1,本文對標點符號失誤作了分類統計(見圖3):

圖3 各類標點符號失誤分布折線圖

圖3顯示:各層次學習者在標點符號習得上的難點是基本一致的,失誤主要集中在逗號和句號的使用上。經卡方檢驗,分號、嘆號、引號、省略號的相對失誤頻數在三個子庫中具有顯著性差異,相對失誤頻數隨著習得水平的提高而降低。鑒于這些標點符號的失誤頻數較低,本文在此不對它們作深入的分析。統計結果顯示:st2水平的學習者逗號和句號失誤分別占其標點符號使用失誤總數的45%和47%,st6水平的學習者在句號上的失誤多于st4水平的學習者。

由圖2可知,st6子庫的sn912和sn920兩種失誤類型的發生頻數高于st4子庫。st6子庫的sn912失誤又可細分為兩種子類型:(1)不斷句;(2)由于連接詞的使用而將句號誤用為逗號(見表5)。

表5 st6中的sn912失誤分類

類型失誤示例不斷句livingcondition,mostpeoplearestillpoor[sn912,s],it[fm3,1-]isnoteasyforanomal[fm1,-]deathisnolongerahorriblethingtooldpeople,[sn912,s]theywouldliketochooseapeacefulway連接詞Chinese[wd3,-1]context,euthanasiaishumane,[sn912,-]However,sincetherearestillanumberfeewith-outthefree-medicalcareservice,[sn912,s]Therefore,hasteningthedeathofaterminally

為了進一步分析sn912和sn920兩種失誤發生的原因,我們重新檢索了這兩項失誤的標注情況。由此發現,英語連接詞的習得對中國學習者英語標點符號的使用有一定影響??傮w而言,CLEC中st6子庫使用連接詞的頻數高于st4子庫。以therefore為例,該詞在st4子庫中出現的相對頻數為51,而在st6子庫中則為111。這在一定程度上體現了連接詞習得的不完善有可能造成標點符號使用失誤,較好地掌握了連接詞的用法可促進學習者對標點符號的習得。因此我們不能把sn912單純地歸咎于標點符號習得方面的失誤。

同時,比較sn920失誤可以發現:(1)sn920失誤在st4子庫中的相對失誤頻數為8,在st6子庫中的相對失誤頻數為50。(2)sn920失誤在st4子庫中分布于若干語篇,而st6子庫中的sn920失誤則集中出現在同一語篇,即出自同一位學習者。仔細觀察表6中的例子,我們不難發現,st4和st6子庫中都出現了書寫過程中隨手加句點的情況,句號冗余的失誤和個人書寫習慣之間存在著較大的關聯,以上錯誤都是可以避免的。

表6 st4和st6中的sn920失誤示例

子庫失誤示例st4[fm3,-]?Butwhytheysay?HasteMakesWaste?.[sn920,s-]Ithinkifwedoathing,wemustdoyouwilldowrong[wd3,1-]withyourwork..[sn920,s-]mostofyourtime,youlivesanormaloutsidethecampus,andbythewaytoearnmoney.[sn920,-]forlivingbymyself.Ithinklivingbyto[wd3,-1]you,haveyouaskedyouself[fm1,-].[sn920,s-]"did[fm3,-]Imakemybest:[cc3,2-]st6roleinkeepingthebalanceofnature.Itcan.[sn920,s-]provide[vp1,-3]usqualitywood.[sn920,s-]can.[sn920,s-]provide[vp1,-3]usqualitywood.[sn920,s-]and.[sn920,s-]beautifyourenvironmentand.[sn920,s-]beautifyourenvironment.Itcan.[sn920,s-]also.[sn920,s-]shield.[sn920,s-]offtheSomecountries.[sn920,s-]spraytoo.[sn920,s-]muchpoisonand.[sn920,s-]fertilizer.[sn920,s-]

然而,我們不能簡單地根據sn912和sn920失誤頻數的高低來推斷st6水平的學習者對標點符號的掌握程度不及st4水平的學習者。比如,由圖3可知,st4水平的學習者冒號的相對失誤頻數要高于st6水平的學習者。

2.對假設2的檢驗及原因分析

各層次學習者在逗號方面的失誤都是集中在sn910、sn911、sn912和sn922,即逗號冗余、逗號缺失、句號誤用為逗號、逗號誤用為句號,詳細統計見圖4。假設2指出,中國學習者sn910和sn912這兩類失誤會較多,這已被圖1中的數據證實。

圖4 逗號主要失誤類型統計圖

研究發現,在st2和st6子庫中,sn911的相對失誤頻數高于sn910,這與假設2相比存在一定的不符。因此,我們有必要探討一下逗號缺失產生的原因。這要針對不同水平的學習者來進行細致的分析。

桂詩春和楊惠中提供了CLEC各類學習者的句長比較,其中st2的句長僅為14.73[13]21,低于st4的18.17和st6的17.74。連淑能指出,漢語以中短句居多[12]64。st2的句長信息反映了高中生英語書面語的口語化傾向,對標點的使用比較隨意,加上母語的影響,高中生較易產生逗號缺失的失誤。

通過檢索st6子庫中的sn911,發現逗號缺失一般發生在以下三種情境:連接詞的使用、列舉事物、插入語,例句見例(1)—(3)③。這不僅是受母語負遷移作用的影響,同時還涉及到英語連接詞的習得。由此可知,我們對逗號習得的研究,不能只從母語遷移方面考慮,而應該著眼于整個句子結構甚至整個語篇。

(1)acing anguish every second. If life is like that[sn911,s]It[fm3,1-]is meaningless and should regard

(2)enuis[fm1,-]three times through a week:Monday[sn911,s]Wednesday and Friday. I don’t form the

(3)thanasia:A Taboon[fm1,-]in China Euthanasia[sn911,s]also named mercy killing,which eases the pai

圖4還顯示,st2子庫中sn922的相對失誤頻數最高,這也反映了高中生英語書面語中的句長比較短、句子零散、不斷句的口語化特點;st4子庫中sn910的相對失誤頻數最高,檢索發現其中出現了很多but、then等連接詞后面緊跟逗號的失誤;st6子庫中sn911的相對失誤頻數最高,檢索發現大多也是由于連接詞的使用而造成的。相關討論詳見對假設1和假設3的檢驗及原因分析。

3.對假設3的檢驗及原因分析

圖2顯示:st4和st6子庫中sn912的相對失誤頻數最高,在st2子庫中sn912中相對失誤頻數居第二位,由此可見句號誤用為逗號的現象比較普遍,這符合假設3。

st2子庫中失誤最多的是sn922,這種現象的出現可以由對假設2的檢驗和分析中有關高中生英語書面語口語化的討論來解釋。

本文統計了句號使用相對失誤頻數最高的幾個類型:sn912、sn920、sn921和sn922,即句號誤用為逗號、句號冗余、句號缺失和逗號誤用為句號(見圖5)。

圖5 句號主要失誤類型統計圖

前文在對假設1的檢驗中具體分析了sn912和sn920,在此主要探討sn921和sn922。表7為sn921和sn922失誤的示例。

表7 sn921和sn922失誤示例

類型失誤示例sn921supperwiththemtonight.Itwashalfpastfour[sn921,s]wewerepreparingforgoingtohavedinner.[sn8,s]Fakecommoditiesdoharmtopeople[sn921,-]fakecommodities’quality[cc1,2-]isn’toftento-day,nottomorrow.Onlythemselves,notothers[sn921,s-]Theyarenear-sightedindeed.Natureissn922itwellwith[pp2,-3]allmymind.Asaresult.[sn922,s-]I’llchangemyjobswhennecessary,butI’llconditionis[vp3,s-]good.Ontheotherhand.[sn922,s-]Someofpeopleusuallychangejobs.Thereanddon’tofferussomanyvalues[wd3,-].[sn922,-]Because[fm3,-]theyarefakecommodities.We

在大部分英語教育者和學習者看來,表7中的失誤都是較易避免的。出現這類失誤有以下兩種可能性:(1)標點符號書寫不規范,以致CLEC建庫錄入文本時無法正確辨識。通過檢索發現,sn921和sn922中的大部分失誤都是基于這個原因。(2)連接詞的使用影響到標點符號的使用。例如表7中sn922例句的because是表達因果關系的并列連接詞,它所引導的從句不可以作為獨立的句子,所以在使用標點符號時就要考慮到該詞的用法,而不能隨意地使用句號。

4.小結

經過數據分析,前文提出的三個假設基本上是成立的。中介語具有不穩定性和不完備性,標點符號習得又與詞匯和句法密切相關,由此我們發現標點符號習得的規律性比較復雜,涉及到多方面因素,以母語負遷移和連接詞因素最為突出。

需要說明的一點是,檢索整個語料庫并沒有發現頓號失誤。在平時的英語習得過程中,中國學習者的確會誤用頓號,為什么在CLEC中沒有體現呢?是由于錄入文本時英文輸入法狀態下無法輸入頓號而將這類失誤忽略了嗎?作者咨詢過參與建庫的李文中教授,他解釋說:主要原因是手寫的幾種標點符號(句號、逗號、頓號)不易區分,可能存在標點符號誤輸入的問題。因此,本文所作的分析有比較重要的理論和實踐意義,但也存在一定的局限性。

(三)對英語教學的啟示

我們應該對標點符號習得給予一定的關注,不應只重視詞匯和語法而忽視標點符號教學。教師要正確認識標點符號習得的規律性和各層次學習者的特點,從英漢標點的對比出發,對學生進行必要的指導,為他們提供足夠的練習。由于標點符號與詞匯、句法相關,我們不能孤立地進行標點符號教學。教師可以從語篇角度,在講解連接詞的同時提示學生有關標點符號的使用,這將大幅度地減少標點符號的失誤,也會促進句法的習得。另外,我們還應培養學習者良好的書寫習慣,規范英語標點符號的書寫。

五、結語

本文發現,不同層次的中國英語學習者在標點符號習得上表現出一定的規律性,同時又有所差別??傮w來看,標點符號失誤隨著學習層次的提高而減少,不同層次學習者在標點符號習得上的難點是相似的,即逗號和句號,尤其以sn912等幾類失誤最為普遍。本文認為,中國學習者標點符號習得的特點主要是由中介語的不穩定性和教學中不夠重視引起的。中介語是動態的、不斷發展變化的,這也就造成了不同層次學習者在標點符號習得時會呈現出各自不同的特點。sn911等失誤的發生可主要歸因于母語負遷移作用和英語連接詞使用的影響。本文的研究對英語標點符號教學及詞匯、語法教學具有一定的積極意義,同時該研究也存在一些不足,如語料庫本身的局限性使得我們對標點符號失誤的分析不夠全面,沒有綜合考慮學習者的心理因素等。因此,當前的研究只是一個初步的探討,標點符號習得還有待于我們作更加深入的研究。

感謝中央高?;究蒲袠I務費專項資金資助項目(2652014024)對本研究的資助。

注釋:

①本文所回顧的二語標點符號研究主要側重于英語作為第二語言的標點符號研究。

②Mugharbil的研究對象是南加利福尼亞大學的留學生,研究中沒有提及他們的母語背景。

③本文的示例均出自檢索軟件的窗口,大多不是完整的句子。其中除了有關標點符號使用失誤的標注,還包含了CLEC中關于詞匯、語法等方面失誤的標注,例如[vp1,1-]表示vp(動詞)的第1種(及物性形式)失誤,1-為失誤發生的范圍,-表示失誤的位置,1表示失誤前有1個詞。聯系前面這個詞就可以判斷出所標注處動詞及物性形式的失誤。本文保留了原語料庫中的所有標注。

④圖1和圖2中涉及到的標注碼包括:sn901(句號逗號同時缺失);sn910(逗號冗余);sn911(逗號缺失);sn912(句號誤用為逗號);sn913(問號誤用為逗號);sn914(分號誤用為逗號);sn915(冒號誤用為逗號);sn916(嘆號誤用為逗號);sn917(引號誤用為逗號);sn918(破折號誤用為逗號);sn919(連詞and/or誤用為逗號);sn9100(省略號誤用為逗號);sn920(句號冗余);sn921(句號缺失);sn922(逗號誤用為句號);sn923(問號誤用為句號);sn924(分號誤用為句號);sn925(冒號誤用為句號);sn926(嘆號誤用為句號);sn929(連詞and/or誤用為句號);sn932(逗號誤用為問號);sn933(句號誤用為問號);sn942(逗號誤用為分號);sn943(句號誤用為分號);sn952(逗號誤用為冒號);sn953(句號誤用為冒號);sn962(逗號誤用為嘆號);sn963(句號誤用為嘆號);sn988(逗號誤用為省略號);sn998(句號誤用為斜線)。

[1]黃伯榮,廖序東. 現代漢語(增訂三版)(下冊)[M]. 北京:高等教育出版社,2002:190.

[2]Quirk R,et al. A Comprehensive Grammar of the English Language[M]. London and New York:Longman,1985.

[3]呂巖. 大學英語學習者寫作中標點符號使用失誤調查[J]. 北京第二外國語學院學報,2006 (4):77-81.

[4]Osborne M. Can punctuation help learning?[C]//Wermter S,Riloff E,Scheler G (eds.). Connectionist,Statistical,and Symbolic Approaches to Learning for Natural Language Processing. Berlin/Heidelberg:Springer,1996:399-412.

[5]Meloni C. Using the web to teach punctuation[EB/OL]. ESL Magazine,2002 (March/April)[2005-05-01]. http://www. eslmag. com/modules. php?name=news& file=article&sid=64.

[6]Mugharbil H. Second language learners’ punctuation:Acquisition and awareness[D]. Los Angeles,CA:University of Southern California,1999.

[7]Knoch U. Diagnostic writing assessment:The development and validation of a rating scale[D]. Auckland:The University of Auckland,2007.

[8]Ellis R. Understanding Second Language Acquisition[M]. Oxford:Oxford University Press,1985.

[9]Larsen-Freeman D,Long M H. An Introduction to Second Language Acquisition Research[M]. Beijing:Foreign Language Teaching and Research Press,2000.

[10]Nemser W. Approximative systems of foreign language learners[J]. International Review of Applied Linguistics in Language Teaching,1971 (9):115-123.

[11]劉重德. 文學翻譯十講[M]. 北京:中國對外翻譯出版公司,1991.

[12]連淑能. 英漢對比研究[M]. 北京:高等教育出版社,1993.

[13]桂詩春,楊惠中. 中國學習者英語語料庫[M]. 上海:上海外語教育出版社,2003.

ACorpus-basedStudyofEnglishPunctuationAcquisitionbyChineseLearners

YU Yang

(School of Foreign Languages,China University of Geosciences (Beijing),Beijing 100083,China)

This paper analyzes Chinese learners’ misuse of English punctuation in Chinese Learners’ English Corpus (CLEC) with AntConc3.2.1w. It indicates that there are certain rules in English punctuation acquisition by Chinese learners,and there are also differences in the acquisition between learners of different levels. The comma and the period are the most difficult punctuation marks for them to acquire. However,the frequency of errors decreases for high-level learners. The negative transfer of Chinese and the use of English conjunction lead to the misuse of punctuation. This study also provides enlightenment for English teaching in China.

English punctuation;punctuation acquisition;negative transfer of Chinese;conjunction;Chinese Learners’ English Corpus (CLEC)

H319

A

2095-2074(2015)01-0052-08

2014-12-17

于洋(1983-),女,山東曲阜人,中國地質大學(北京)外國語學院講師,文學博士。

猜你喜歡
連接詞句號逗號
句號
逗號
連動結構“VP1來VP2”的復句化及新興小句連接詞“來”的形成
句號失蹤記
句號
逗號
賓語從句的語序
句號提意見
吸引閱卷老師的“連接詞”
自傲的逗號
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合