?

機器翻譯給譯者帶來的機遇和挑戰

2018-10-24 02:03彭子航
安徽文學·下半月 2018年12期
關鍵詞:句法語料庫短語

彭子航

上海理工大學

一、機器翻譯概況

(一)機器翻譯與統計機器翻譯

機器翻譯,又稱自動翻譯,是一種利用計算機將源語言轉換為目標語言的翻譯技術。機器翻譯自產生以來獲得了巨大的發展。其中,1980年代末和1990年代初,IBM研究人員提出了統計機器翻譯的思想,這種以統計學解決翻譯問題的方法逐漸成為機器翻譯的主流,極大地推動了機器翻譯技術的發展。

統計機器翻譯最早由IBM研究人員于20世紀90年代初提出,他們用兩年時間,在沒有采用人工結構的語言知識的情況下,僅利用語料庫就開發出了媲美傳統翻譯系統幾十年研究結果的系統,這充分體現了統計機器翻譯的優越性。在統計機器翻譯中,“翻譯”是一個隨機事件,源語言句子與目標語言句子的匹配是隨機的,匹配正確的概率稱為翻譯模型。這種翻譯技術依靠的是嚴格的數學理論,翻譯的規則以概率的方式呈現,(而翻譯中所需要的詞典、規則都來自于語料庫),翻譯的過程就是尋找最優解的過程。

(二)統計機器翻譯的發展概況

統計機器翻譯的模型從早期基于詞的模型已經過渡到基于短語的模型,短語庫規模的擴大使翻譯系統的性能大大提升。目前,基于句法的模型的研究也正處于火熱中,基于句法的模型成熟后,將大大提高翻譯的精確性。目前,在機器翻譯領域處于領先地位的谷歌翻譯的大部分語言采用的都是統計機器翻譯的方法。

目前國際上統計機器翻譯主要集中在阿拉伯語到英語和漢語到英語兩個方向,當前的研究狀況來看,阿拉伯語到英語的準確率已經達到了很高的水平,而漢語到英語的翻譯準確率相對較低。

(三)統計機器翻譯的優缺點

優點:

人工成本低、開發周期短。機器翻譯系統開發無需人工編寫和調試詞典規則,故人工成本較低,開發周期較短。

可以迅速遷移到新的語種和領域。由于翻譯的詞典、規則都來自于語料庫,所以只要語料庫不斷地豐富,統計機器翻譯就可以擴展到其他語種或其他領域。

性能較高。目前較為成熟的基于短語的翻譯模型雖然是一種較為機械的方法,但是對于現有的計算機,短語庫規模的擴大早已不成問題。所以基于短語的翻譯系統的性能還是比較高的。

新事物。機器翻譯作為互聯網的產物,又由于良好的數學模型和自學習能力等,收到研究者們的青睞,擁有更多關注的目光,更容易被開放領域的互聯網世界接納。

缺點:

受限于翻譯模型的好壞和語料庫的覆蓋能力。翻譯中語言的需求十分的大,由于受到語料庫的規模限制,機器翻譯難以達到較高的匹配率。需要縮小到一些專業領域,翻譯效果才能達到要求。

無法識別語境。以漢語為例,漢語的詞法、語法、句法的變化和語境的更換十分豐富,一點小的變化,意思就大相徑庭,這種復雜的變化,機器翻譯系統是很難理解的。

譯文質量較差。機器翻譯的譯文結果雖然字字都對,但經常讓人很難閱讀。這是機器翻譯難以避免的弊端。單單依靠翻譯系統,很難提高譯文質量。

二、機器翻譯給現代譯者帶來的影響

(一)挑戰

隨著各種機器翻譯的方法的發展和翻譯系統的進步,機器翻譯的研究取得了巨大的進步和豐碩的成果,機器翻譯的前途無疑是光明的,在未來,將有很大一部分的翻譯領域是屬于機器翻譯的,這對翻譯從業人員勢必會造成一定的影響。

當機器翻譯水平發展到一定的高度,勢必會替代一部分人工翻譯的工作。尤其是在一些要求較多,限制較窄的專業領域,以及一些較為基礎的翻譯情景,統計機器翻譯的研究跟相關領域的專業翻譯人員的培養比起來,顯然更節省時間、金錢、精力,更符合社會發展的節奏。這對于社會的發展雖然是可喜的消息,不過也給翻譯從業人員產生了或大或小的威脅。

對于個人用戶來說,他們獲取機器翻譯成果的渠道越來越多,越來越簡單,而往往一般個人用戶對翻譯的要求較低,越來越多的人能夠憑借翻譯軟件以及自身的外語水平解決日常生活中所遇到的翻譯問題,對人工翻譯的需求也就越來越少。

(二)機遇

目前雖然機器翻譯的研究取得了很多成果,但是使用的效果并不能達到客戶的要求,機器翻譯系統之后的研究道路還很長。而翻譯系統的完善僅僅依靠研究人員是不可能完成的。因為目前的機器翻譯中用到的語言知識很少,而翻譯技術的提升需要對語言更深層次的分析,這便需要專業的翻譯從業人員的參與給出更專業的意見。故機器翻譯的發展也給譯者提供了新的機會,就是參與到機器翻譯系統的完善工作中。

由于受翻譯模型和語料庫的限制,機器翻譯的優勢僅在一些要求較多的相對專業的領域得以體現,而在一些較為泛化的領域,由于語料庫規模的不足,機器翻譯的性能不足以與人工翻譯相比;同時,在一些特定領域,機器翻譯永遠無法替代人工翻譯的工作,如文學翻譯,文學翻譯是文化交流的重要渠道,注重的是感情的理解和邏輯層面的分析,這些工作是機器翻譯無法完成的。所以,翻譯人員可以提升自己的工作能力,深化自己在某些領域的技能,以減小機器翻譯發展帶來的威脅。

雖然機器翻譯有優點多多,但是在實際的社會發展中,眾多的使用者對翻譯的質量要求是十分高的。所以在多數重要的翻譯需求的產生之時,公司、政府等仍將首先選擇人工翻譯,人工翻譯仍將是最值得信賴的。而機器翻譯的使用情景一般為:對翻譯的要求時間很短或是工作量很大的情況。同時,在很多情況下,雖然已經使用了機器翻譯,企業或政府仍然需要人工翻譯對機器翻譯的結果進行審核糾正等工作。所以只要工作水平夠高,翻譯人員仍能在機器翻譯發展的形勢下找到適合自己的工作。

關于人工翻譯的關系,人們的定性思維常常是“人機大戰”,但是如果我們轉變思維為“人機合作”,便能有不一樣的收獲,人工推進機器翻譯的進步,機器翻譯輔助翻譯人員的工作,減輕負擔,這樣既能提高效率,還能達到共贏。

(三)思考

雖然目前統計機器翻譯的發展很快,但是基于句法的翻譯模型還不夠完善。有一些不能夠解決的問題,而相關的研究還需要一些時間,這些都意味著機器翻譯距離理想使用狀態相去甚遠,機器翻譯的研究還有很長的路要走。

即使機器翻譯發展到相當成熟的階段,翻譯人員仍無需過多擔心,因為屆時機器翻譯與人工翻譯所面向的市場并非完全一致,人工翻譯將逐漸轉向高端市場,因為在一些重要的文書、經濟合同、政府報告等等翻譯需求出現時,機器翻譯無法承擔這些翻譯任務背后所代表的責任,機器翻譯將主要面向一些不那么精確的翻譯情景,屆時反而會出現更為巨大的高端翻譯市場,翻譯人員需要做的是根據形勢適當地進行轉型,向更高級、更專業的領域的進軍,做精尖人才。

不論在什么時候,翻譯從業人員仍然是不可取代的。再精確的機器也無法與人的大腦相媲美,尤其是在文學翻譯這種注重感情的理解的翻譯需求中,機器翻譯時無法完成任務的。機器翻譯的發展只會淘汰低端的翻譯人員,完全取代人工是不可能的,翻譯從業人員需要做的是不斷提高自己的專業技能,主動學習并擁抱新技術。

或許我們對于機器翻譯與人工翻譯的關系的理解存在誤區,機器翻譯與人工翻譯并不是非此即彼,完全否定機器翻譯和完全夸大機器翻譯的說法都是不恰當的。機器翻譯與人工翻譯的最佳關系應當是相輔相成,機器翻譯不會讓人工翻譯的價值變低,而是將人工翻譯轉向更值得翻譯的任務。機器翻譯和人工翻譯的和諧共存或許才是最終形態。

猜你喜歡
句法語料庫短語
句法與句意(外一篇)
述謂結構與英語句法配置
《語料庫翻譯文體學》評介
句法二題
詩詞聯句句法梳理
《健民短語》一則
基于JAVAEE的維吾爾中介語語料庫開發與實現
語料庫語言學未來發展趨勢
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合