?

英漢機器翻譯中的英語動詞漢譯研究

2016-09-08 09:23李俠
電子設計工程 2016年13期
關鍵詞:漢譯語句語義

李俠

(咸陽師范學院 外國語學院,陜西 咸陽 712000)

英漢機器翻譯中的英語動詞漢譯研究

李俠

(咸陽師范學院 外國語學院,陜西 咸陽 712000)

機器翻譯是一項非常重要且困難的工作,動詞因其形式多樣且使用較為靈活,是機器翻譯過程中的重要環節。本文針對機器翻譯過程中的動詞翻譯進行研究,先對語義語言理論進行介紹,進而對動詞語義進行分析,然后在動詞語義模式的基礎上對動詞進行詳細的研究。在對語義進行歸納總結以后,將動詞的語義模式分為三類,再將動詞語義模式庫進行搭建,最后設計出一種以語義、句式以及變量為基礎的翻譯方法,該漢譯方法適用于英語句子當中的動詞翻譯過程中。

機器翻譯;動詞;語義模式;語義類型;變量

隨著計算機的普及,人們希望它能實現更多的功能,同時,現今社會當中,各民族之間的交流也日益增加,隨之而來的就是語言障礙問題,那么,為了保證各個語言國家之間的交流順利,且提高相互交流效率,使用計算機來進行翻譯就勢在必行了。然而,現有的機器翻譯系統遠遠滿足不了語言的復雜性和人們對語言使用的不規則性,所以,高效的機器翻譯系統就非常有必要了。機器翻譯系統是針對句子進行翻譯,而句子是由不同詞性的詞匯組成,其中,動詞是句子中的重要組成部分,對動詞翻譯的準確性影響著對句子翻譯的質量。對于同一個詞匯,在不同環境中所表達的意義可能有所不同,所以,在機器翻譯過程中,對同一動詞而言,要針對不同環境來選擇不同的含義?,F今對動詞翻譯的研究還處于研究過程階段,對動詞翻譯的準確性提高也會提高句子翻譯的質量,有利于機器翻譯系統的擴充和完善[1-2]。

1 機器翻譯概述

機器翻譯是指利用計算機將一種語言翻譯為另一種語言的技術。這種技術非常復雜,它將語言學、計算機學、心理學等各個學科相互結合,是一項非常困難的研究課題。它的特點是[3-5]:

1)涉及多個學科領域,必須將不同學科的領頭人相互合作才可能完成機器翻譯系統的實現。

2)翻譯過程可計算,也就是說,必須利用計算機相關技術才可以實現機器翻譯。

3)翻譯過程困難,因為機器翻譯的是人類自然語言,會因人對語言理解不同而有所不同,無法實現對語言的可操控性。

4)具有實用價值。

2 語義語言和語義單元

2.1語義語言

語義單元表示的是在任意一個自然語言中所表述的一個含義的單元。語義單元又可以組成語義語言,其形式通??杀硎緸椋海ˋ、B、C、D、E)。其中,A表示完結符,B表示變量標志符、C表示語義單元集合,D表示類集,也就是說每個語義單元都與一個類集一一對應,E表示變量代替法則。

通??蓪⒄Z義語言分為三層,分別是語言層、知識層以及語用層。比如,“把這瓶水倒入那壺濃硫酸里”,這一句話是由“這”、“瓶”、“水”、“那”、“壺”、“濃硫酸”六個語義單元所組成,可以歸結為“把倒入里”,N表示的是名詞。

將上述例子用語言層理解,就是分別找到兩個N表示的名詞,然后再根據語句命令將這個N倒入那個N中,而不會考慮會出現什么后果。

若用知識層來理解,就是知道將水倒入濃硫酸中會發生爆炸,會產生嚴重的后果,那么會對該命令進行提醒并警告。

所以,綜上所述,針對不同層次理解,所得到的信息是不一樣的,但是在本文中,僅僅是針對語言層來理解語義單元[6-7]。

2.2基于語義單元的機器翻譯方法

以語義單元為基礎的機器翻譯方法可分為兩部分,分別是統一的機器翻譯軟件和多個語言單元庫[8-9]。該機器翻譯流程圖如圖1所示。

圖1 基于語義單元的機器翻譯系統流程圖

3 動詞語義模式

3.1動詞語義模式的提取方法

動詞語義模式的提取原則主要有以下幾點[10-11]:

1)動詞語義模式是按照一定的排列次序,將變量和實量排列組成,并且該排列結構可以有效的反應出句子中的內部排列次序。其中,實量是語義當中的最小語義單元,變量根據其處于句子當中的不同位置由多種語義代替。

2)在提取過程中,動詞是作為實量來進行提取,并將與動詞搭配的詞匯定義為相關詞組,也視為實量進行提取。

3)對動詞及相關詞組的含義會產生異議的部分定為變量來提取。

4)因為漢英句子的結構排列次序不同,所以變量的提取也不必要求一一對應。

5)將動詞語義庫中的語義模式類型用來代表句子中的句法形式,使得動詞可以被代替。

6)動詞語義模式當中的變量既可以表示形容詞,也可以表示動名詞、句子等形式。

7)表示同一個語義的變量可用相同的動詞語義模式來替換。

3.2動詞語義模式庫

動詞語義模式庫分類如圖2所示。由圖2可看出,動詞語義模式庫由VO語義模式庫和V語義模式庫組成,其中,VO語義模式庫又可以分為VO相鄰語義模式庫和VO非相鄰語義模式庫兩種。VO語義模式表示的是動詞與其他屬性的實量根據不同排列順序所構成的語義模式,動詞與相鄰的實量一起組成的語義模式稱為VO相鄰語義模式,反之則為VO非相鄰語義模式。V語義模式是指由一個動詞構成R部。不同的語義模式組合構成不同的語義模式庫[12-13]。動詞語義模式庫結構如表1所示。

圖2 動詞語義模式庫分類

表1 動詞語義模式庫結構

4 常用動詞的漢譯方法

4.1常用動詞的漢譯方法的選擇

常用動詞的漢譯方法主要有[14]:

1)統計法:在所要求翻譯的句子中,根據上下問中頻繁出現的并且與所要求翻譯的詞較為類似的譯文,通過統計的方法來確定目標詞匯的譯文。這種方法需要較大的工作量,并且需要大量的語句庫作為參考,而且語句庫的翻譯質量會對最終的翻譯結果產生較大的影響。

2)實例法:與統計法較為相似,也是通過在語句庫中大規模的找尋與目標語句較為相似的句子,將該句子提取出來做適當修改以后作為輸出結果。

3)語義模式法:首先要先創建語義模式庫,并且創建過程必須有一定的限制條件才可以。在對目標語句翻譯中,先從庫中找出與之相符的語義模式,然后再根據目標語句的語境找出最符合的語義模式,最后再輸出結果。

4.2漢譯算法的實現

對英語中動詞的翻譯算法流程圖如圖3所示。步驟如下:

圖3 算法流程圖

1)先對開始輸入的英語句子進行初始化;

2)將初始化的句子與固定句式庫中的語句匹配,若成功,則輸出結果,若失敗,則轉3);

3)0將初始化句子再與VO相鄰語義模式庫進行匹配,若成功,轉到4),若失敗,則轉到6);

4)去句子中的右邊的詞N,將N與VO相鄰語義模式庫進行匹配,若成功,轉5),若失敗,轉6);

5)根據語義模式匹配算法將匹配成功的N在相鄰語義模式庫中進行匹配,若成功,轉11),若失敗,轉6);

6)將句子與VO非相鄰語義模式庫進行匹配,若成功,轉7),若失敗,轉9);

7)再去句子中從右邊取除了N以外的詞,分別與VO非相鄰語義模式庫進行匹配,若成功,轉8),若失敗,轉9);

8)利用匹配算法匹配語義,若成功,轉11),若失敗,轉9);

9)將句子與V語義模式庫進行匹配,若成功,轉10),若失敗,則輸出結果失敗,結束過程。

10)用匹配算法匹配語義模式,若成功,轉11),若失敗,則輸出結果失敗,結果過程。

11)分別輸出英語和漢語的語義模式;

12)輸出的漢語語義模式即英語的譯文。

5 結束語

機器翻譯是一項非常重要且困難的工作,動詞在句子中是重要部分,它的復雜多變性是機器翻譯過程中需要攻克的難點。文中先對語義語言進行介紹,提出了基于語義單元的機器翻譯方法,然后再對動詞語義模式的提取方式進行了大致的闡述,并對動詞語義模式庫詳細的進行了分析和介紹,最后對漢譯方法進一步解釋,提出了一種漢譯的算法流程,并對這種方法的過程進行詳細的研究。根據這種方法,進一步可以提高英語動詞漢譯的準確性和高效率。

[1]趙鐵軍.機器翻譯原理[M].哈爾濱:哈爾濱工業大學出版社, 2001.

[2]Gao Q S,Hu Y,LI L,et al.Semantic language and multi一language MT approach based on SL[J].JournalofComputer Science&Technology,2003,18(6):848-852.

[3]高慶獅,高小宇,胡明.基于語義的機器翻譯系統及方法:中國,01131689.6[P].2001,12,27.

[4]胡明,高小宇,高慶獅.多語言機譯系統中高質量語義單元庫形成方法[J].北京科技大學學報,2008,30(6):698-703.

[5]HutchinsJThedevelopmentanduseofmachinetranslationsystemsand computer-based translation tools[C]//Proceedings of International Conference on Machine Translation&Computer Language Information Proeessing.June26-28,1999,Beijing, China.1999:1-16.

[6]王小捷,常寶寶.自然語言處理技術基礎[M].北京:北京郵電大學出版社,2002.

[7]俞士漢.現代漢語語法信息詞典[M].北京:北京大學計算語言學研究所,2000.

[8]陳群秀.信息處理用現代漢語語義分類詞典的設計與實現 [M]//曹石琦.輝煌二十——中國中文信息學會二十周年學術會議.北京:清華大學出版社,2001:148-155.

[9]馮志偉.中國語料庫研究的歷史與現狀[J].Journal of Chinese Language and Computing,2002,12(1):43-62.

[10]俞士漢.計算語言學的應用研究與基礎研究[M]//曹石琦.輝煌二十年——中國中文信息學會二十周年學術會議.北京:清華大學出版社,2001:54-65.

[11]周強,詹衛東,任海波,等.構建大規模的漢語語塊庫[M]//黃昌寧,張普.自然語言理解與機器翻譯.北京:清華大學出版社,2001:102-115.

[12]高小宇,高慶獅,胡明,等.基于語義單元表示樹剪枝的高速多語言機器翻譯[J].軟件學報,2005,16(11):1909-1919.

[13]高慶獅,李莉,劉宏嵐.基于語義單元表示樹剪枝的關鍵字過濾方法[J].北京科技大學學報,2006,28(12):1191-1195.

[14]BuscaldiD,RossoP,PlaF,e al.VerbSenseDisambiguationUsing Support Vector Machines:ImpactofWordNet-ExtractedFeatures[C]//7th International ConferenceonComputationalLinguisticsand Intelligent TextProcessing,February19-25,2006,MexicoCity,Mexico.Springer,2006:192-195.

A study on English translation of English verbs in English and chinese machine translation

LI Xia
(Foreign language college,Xianyang Normal University,Xianyang 712000,China)

Machine translation is a very important and difficult task,because of its diverse forms and the use of a more flexible, is an important part of the machine translation process.In this paper,we study the verb translation in the process of machine translation,first introduce the theory of semantic language,then analyze the semantics of the verb,and then make a detailed study of the verbs in the semantic model.After summarizing the semantics,the semantic patterns of verbs can be divided into three categories,then the verb semantic pattern base is set up.Finally,a translation method based on semantics,syntax and variable is designed.

machine translation;verbs;semantic patters;semantic types;variable

TM933.4

A

1674-6236(2016)13-0013-03

2015-11-27稿件編號:201511273

陜西省社會科學基金項目(13K045)

李 俠(1978—),女,陜西韓城人,碩士,講師。研究方向:英語教學與英語翻譯。

猜你喜歡
漢譯語句語義
《李爾王》漢譯的序跋研究
重點:語句銜接
語言與語義
再論漢譯“突厥”名稱之起源
再論漢譯“突厥”名稱之起源
“社會”一詞的語義流動與新陳代謝
“上”與“下”語義的不對稱性及其認知闡釋
“吃+NP”的語義生成機制研究
談談柯爾克孜語中“bay”、“-bay”和“bek”、“-bek”的漢譯
如何搞定語句銜接題
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合