?

淺析含“先行主語it”句式機譯文本問題及其原因

2013-04-12 18:29鄭敏芳郭彧斌
黑龍江教育學院學報 2013年8期
關鍵詞:源語言語序指代

鄭敏芳,郭彧斌,王 敏

(西藏民族學院 外語學院,陜西 咸陽 712082)

含“先行主語it”句是英語中常見句型之一。由于英語注重末端重量(end weight),凡較長的詞語或累贅的成分均需后移。因此,當句子中的主語較長時,往往使用“it”作形式主語來避免頭重腳輕,該句中真正的主語一般為-ing分詞結構、不定時結構或從句,且置于句子末尾。這樣的句式即為含“先行主語 it”句[1]。如:

(1)It is a pity to make a fool of yourself.

(2)It was very easy getting the equipment loaded.

(3)It is possible that he has left for Shanghai.

(4)It doesn't matter whether we start now or later.

(5)It is very clear what he meant.

機器翻譯即為應用計算機實現從一種語言文本到另一種語言文本的翻譯[2]。早在古希臘時代就有人提出利用機械裝置來進行語言翻譯的想法;然而,直到計算機問世后,機譯的夢想才逐漸變成現實。近二三十年來,全球化進程的加速以及國際交流的日趨頻繁,使人們對于翻譯的需求空前增長,而互聯網的發展讓機譯迎來了一個全新的機遇。機器翻譯研究初期,其功能實現主要是基于轉換的思想。該思想指導下的機器翻譯系統主要經過三個處理階段:分析、轉換、生成。此方法采取了一系列的分析和轉換生成層次,使一種源語言句子經過不同的中間表達形式,最終到達目標語言句子的表示。其目的是盡可能地加深對源語言的理解,生成盡可能恰當的目標語言形式。此方法被認為是模擬人類翻譯活動最恰當的機制。從20世紀80年代中期開始,基于語料庫方法的出現推動了機器翻譯研究的深入發展?;谡Z料庫方法又可分為基于實例的翻譯方法和基于統計的翻譯方法?;趯嵗姆椒ㄖ傅氖峭ㄟ^結構化的翻譯例子直接把源語言的短語和句子與目標語言的短語和句子對應起來。具體操作為:建立一個雙語語料庫,其中存放已經對齊的雙語句對。當給定源語言輸入句子S,在雙語語料庫C中匹配查找一個最近接的句子S’,則S’的譯文T’就被接受為S的譯文?;诮y計的方法即為往計算機內輸入大量的文字文本,包括源語言的文本,以及對應目標語言人工翻譯的文本,通過海量統計數據來提高翻譯精確度。此方法號稱不要任何的語言學知識,也能實現源語言到目標語言的映射[3]。雖然這些方法的運用使得機譯文本的質量有了一定的提高;各式各樣的翻譯軟件也如雨后春筍般層出不窮,但含“先行主語it”句有其特殊的結構:即具有真正和形式兩個主語,且英語中以it做主語的句子種類繁多、句式相似度較高,所有的翻譯方法又都沒有對此特殊結構句式的獨特處理,因此,該句式的機譯文本依然存在許多問題。其中表現最突出的是:語序混亂、it處理不當及詞義歧義。

一、語序混亂

含“先行主語it”句的特殊之處在于其句子結構,即:句中各成分及其排列順序[3]。該句式中作形式主語的“it”沒有具體的含義,只是幫助把真正的主語移到句子的后面,使句子顯得更靈活一些[4]。雖然漢語中謂語或賓語也可置于主語之前,但漢語中不存在形式主語,因此漢語中無此排列的句式。此句式英譯漢時,除了英漢詞匯上的轉換外,還需重新排列句內各成分的順序,這就為英漢翻譯增添了一定的難度。由于人類的思維總有相似之處,人工翻譯時,可通過分析句法語義特征等,調整語序,譯出既忠實于原文內容又符合漢語表達習慣的句子。一般而言,人工翻譯時,需用真正的主語替代it,然后再將英語轉換為漢語。然而用計算機處理此類句式時,由于其固有的機械性及自然語言的復雜性和多樣性,譯文總是主謂顛倒、語序混亂,既不忠實也不通順。如:

1.It is a pity to make a fool of yourself.

很遺憾使自己的傻瓜。

可惜出丑。

2.It was very easy getting the equipment loaded.

這是容易的加載設備。

這是非常容易使用的設備加載。

3.It is possible that he has left for Shanghai.

這是可能的,他已經離開上海。

這是可能的,他已經去上海了。

4.It doesn't matter whether we start now or later.

沒關系,我們是否現在或以后開始的。

不管我們現在或以后開始。

5.It is very clear what he meant.

這是非常清楚他是什么意思。

這是很清楚他是什么意思。

以上五句分別代表了含“先行主語it”句的最基本的類型,分別為 it代替不定式結構、-ing分詞結構、that從句,whether從句及what從句。雖然做真正主語的有短語有句子,但他們的漢譯策略相同,即:用真正的主語替換it,然后再按此順序進行英漢轉換。因此正確譯文應為:

1.你愚弄了你自己,這太遺憾了。

2.安裝這些設置,這太容易了。

3.也許他已經到上海了。

4.我們現在開始或遲點開始都沒關系。

5.他的意思非常明白。

人工譯本和機譯文本對比后發現,兩種譯本最顯著的區別在于,人工譯本都做過語序的調節,而機器翻譯只是按照句中詞語的先后順序,把它們轉換成漢語。出現這種狀況的原因在于,譯者能通過句法語法分析,剖析出句子的深層結構;而機器只能根據安裝的程序來識別語言,如果該程序無針對此句式的特殊指令,機器只能同處理普通句式一樣處理此句式。這樣一來,錯誤就再所難免。

二、it處理不當

除了語序混亂外,it的處理也影響著含“先行主語it”句的機譯文本質量。該句式的機譯文本中,it處理不當表現在兩個方面:it的意思錯譯,it的位置不當。

(一)it的意思錯譯

“先行it”是“非指代性it”用法的一種,它不同于“虛義it”,更不同于“指代it”?!疤摿xit”常用作沒有具體意義的主語,出現在表示氣候、天氣、溫度、時間、地點、距離等意義的句子中[5]。漢譯時,一般譯為和氣候、天氣、溫度、時間、地點、距離等相關的詞語。而“指代it”,是it作實詞用,可以用于指人以外的一切生物、無生命的東西和事情,也可指說話者心目中不太清楚或性別不詳的嬰兒。漢譯時一般譯為“它,這”等?!跋刃衖t”指的是 it在句中起先行引導作用,僅在形式上做主語,本身無詞義[6]。漢譯時若不強調形式主語,it不譯出,而若強調作形式主語的 it,一般將其譯為“這”、“這樣,這一點”之類的詞,而且之前會出現它所指代的對象。然而,由于目前機器翻譯研究的局限,機器翻譯時,不能分辨哪個是“先行 it”,哪個是“虛義 it”,哪個是“指代it”。機譯文本中it要么譯為“它、那”,要么漏譯,要么譯為“這,這樣”,但之前未出現it所指代的對象。如:

6.It won't hurt to postpone the meeting for a few days.

不會傷害推遲了幾天的會議。

它不會傷害到會議推遲幾天。

7.It surprised me to hear him say that.

它讓我感到驚訝聽到他說。

我很驚訝,聽到他說。

8.It is pleasant to lie in the sun.

它是愉快地躺在陽光下。

這是愉快躺著曬太陽。

上述三例中,it均非特指,也不需強調,漢譯時,it均無須譯出。但機器無法識別it的作用,錯將其譯為“它,這”。使得譯文所表述內容的意思不明。

(二)it的位置有誤

個別情況下,含“先行主語it”句強調作形式主語的it,這時it需譯出來,一般譯為“這、這樣”,指代其前所出現的內容。從形式上看,這時“這、這樣”不能出現在句子首位。然而,機器不能判斷什么時候強調it,什么時候不強調。雖然機器可將it譯為“這、這樣、那”,但其出現的位置不正確。如:

9.It is difficult for anyone to be angry with her.

這是誰都難以與她生氣。

這是任何人都難以和她生氣。

10.It was wrong of him to tell lies.

這是他錯了,說假話。

那他撒謊是錯誤的。

11.It is a mystery where David got the money.

這是一個謎,大衛拿到了錢。

這是一個謎,戴維拿到了錢。

以上三例中,it均被譯為“這”或“那”。但他們均出現在句子首位,指代不明。譯文可讀性依然不強。

三、詞義歧義

一詞多義和一詞多類是英漢兩種語言都存在的語言現象,它們的存在也是語際翻譯的障礙之一。然而,英語句式一般都有較為嚴謹的結構,句子內各成分一般都有其固定的詞性。通過分析句子結構,一詞多類所造成的歧義基本可以排除。另外,通過分析上下文及背景信息,多義詞所表達的具體含義也基本可確定。然而機器翻譯的消歧機制還不夠完善,詞性錯判、詞義錯譯的現象頻頻發生。如:

12.It is fun being a singer.

這是成為一個歌手的樂趣。

這是有趣的是一個歌手。

“fun”雖然有“樂趣,有趣的”之意,但在該句中其意應為“有意思的”?!癰eing”該為“作”而非“成為”或“是”。然而機器不能辨析詞義,機器只能根據概率統計挑選出使用頻率最高的詞義。再如:

13.It is a shame that Tom is not here.

這是一個恥辱,湯姆是不是在這里。

這是一個恥辱,湯姆不在這里。

“shame”雖有“恥辱”之意,但在該句中,尤其在“It is a shame that...”結構中,“shame”多指“遺憾”,相當于“pity”,和“恥辱”沒什么關系。

14.It doesn't matter when we arrive。

它并不重要,當我們到達。

不要緊,我們到達時。

“When”在該句中起引導真正主語的作用,但又保存疑問副詞的原意“什么時候”,雖然“when”有“當……時”之意,但在該句中,它并非連詞,所以不能譯為“……時”或“當……”顯然,機器程序還不能分析出這樣句式的內部結構,因此,錯譯屢見不鮮。

綜上所述,顯然,含“先行主語it”句的機譯文本還存在很大問題。除了語序混亂、it處理不當外,還存在嚴重的詞義歧義問題。而導致這些問題的因素有兩方面:一是自然語言的復雜性,二為現今的機器翻譯技術還不夠成熟。雖然,在現今的科技條件下,還很難讓機器全自動地譯出高質量的文本,但相信通過設計專門針對含“先行主語it”句的程序及相關語料庫建設,在不久的將來,該句式的機譯文本質量會有大幅度的提高。

注:各例句譯文一為Google的處理結果,譯文二為ICIBA的處理結果。

:

[1]馬志恩.“It”用法[J].西安礦業學院學報,1984,(S1).

[2]John Hutchins.Machine Translation:Past,Present,Future[M].Chichester,England:Ellis Horwood Limited,1986.

[3]趙鐵軍.機器翻譯原理[M].哈爾濱:哈爾濱工業大學出版社,2000.

[4]楊興元.英語句型大全[M].上海:上海外語教育出版社,2007:3.

[5]金長輝.試談帶形式主語 It的句型[J].外語教學,1985,(3).

[6]章振邦.新編英語語法教程(第四版)[M].上海:上海外語教育出版社,2003.

猜你喜歡
源語言語序指代
奧卡姆和布列丹對指代劃分的比較
The Ways of Leading a Healthy Life
基于深度學習的維吾爾語名詞短語指代消解
漢韓“在”字句的語序類型及習得研究
以口譯實例談雙語知識的必要性
自然語言中的指代技術的研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合