?

人工+智能語言翻譯的現狀與發展

2018-08-31 05:54西北農林科技大學外語系楊曉峰
電子世界 2018年16期
關鍵詞:譯員機器人工

西北農林科技大學外語系 邵 華 楊曉峰

1.引言

人工智能、大數據、云計算、物聯網,作為推動未來生產力發展和產業融合的重要驅動力,已成為繼移動互聯網之后的當前國際競爭新焦點。2017年7月,國務院首次發布《新一代人工智能發展規劃》,要求建設人工智能學科,“利用智能技術加快推動人才培養模式、教學方法改革”,宣布將舉國之力在2030年搶占人工智能全球制高點。2018年3月5日,李克強總理在政府工作報告中四次提及“智能”,特別指出要“加強新一代人工智能研發應用”、“發展智能產業”。2018年3月21日,教育部公布關于2017年度普通高等學校本科專業備案和審批結果的文件,數據科學與大數據技術、機器人工程、智能科學與技術等人工智能專業屢次上榜;在新增備案本科專業名單中,包括中國人民大學、廈門大學、華南理工大學在內的89所教育部直屬高校申請開設數據科學與大數據技術專業,人工智能一時風頭無兩。

在語言服務領域,人工智能與翻譯相結合,使得以計算機為主體的機器全自動翻譯和以人工為主體的計算機輔助翻譯(機器半自動翻譯)成為可能。谷歌、百度、阿里巴巴等商業巨頭在此爭相分羹,電子詞典、翻譯軟件層出不窮,給傳統語言服務行業帶來了機遇的同時,也提出了新的疑難:人工智能翻譯是否能取代人工翻譯?翻譯行業人才又將何去何從?

2.機器翻譯

2.1 人工智能巴別塔

從早期詞典匹配結合語言學知識的規則翻譯,到基于語料庫的統計機器翻譯,再到基于深度學習的神經網絡算法,如今的機器翻譯已擺脫逐字逐句的生搬硬套。利用LSTM((Long-Short-Term-Memory))的循環神經網絡,人工智能可以模擬人腦理解語言,通過大量的(輸入、目標語言)句子集合來訓練完整的框架,機器“知道”輸入的語言類別,甚至可以宏觀把握原文的整個語篇及到目前為止生成的譯文,以提供更加準確流暢的翻譯。在“主+謂+賓”和“主+賓+謂”兩種不同語序的語言之間翻譯時,可以重新排序,達到譯文流暢、通順易讀的基本目標。

圖1

比如提供英語→日語和英語→漢語翻譯訓練,機器將輸入的語言解碼,轉化成內在的通用語言形式,便可以自動地實現日語→漢語的轉化。如任何語言中“足球”這個詞,都讓人想到由黑白兩色的正五邊形拼接而成的球體——機器所理解概念意義上的“足球”,不受語種的限制。如此,機器像人腦一樣不斷輸入、學習、處理、轉化、吸收,有望實現多語言實時翻譯、跨語言數據檢索和深度文本分析,為人類再造語言的巴別塔。

圖2

2.2 機器同傳

目前,人工智能翻譯的觸角已伸及“即時視覺翻譯”:利用移動終端的攝像頭即時取詞,實時將文本OCR識別、解碼翻譯,通過增強現實技術(Augmented Reality,簡稱AR)將譯文覆蓋原文,達到人工同聲傳譯的效果。在2018年的博鰲亞洲論壇上,騰訊同傳作為官方指定的獨家人工智能(AI)同聲傳譯合作伙伴,開創了博鰲亞洲論壇使用非人類同傳翻譯的先河。

3.計算機輔助翻譯與翻譯市場

3.1 計算機輔助翻譯

計算機輔助翻譯(Computer-Aided Translation,簡稱CAT)是由機器翻譯發展而來,有別于全自動的機器翻譯,計算機輔助翻譯以人工翻譯為主導,輔助以翻譯工具,包括術語詞典、翻譯記憶庫、翻譯軟件、翻譯術語工具、翻譯記憶工具和翻譯平臺網站等。因其兼顧效率和準確性,在譯員工作中起到事半功倍的效果而廣受翻譯市場歡迎。

計算機輔助翻譯的核心技術是翻譯記憶。譯員利用CAT軟件翻譯時,原文和譯文會保存在后臺建立的翻譯記憶庫中,當遇到相似的語料,系統通過自動搜索記憶庫中相同或相似的片段并給出參考譯文,用戶可采納、編輯或舍棄,如此譯員可以避免無謂的重復勞動,只需專注于新內容的翻譯,工作效率和譯文質量得到保障和提升。

3.2 翻譯市場

目前翻譯市場主流的計算機輔助翻譯包括翻譯記憶系統、對其工具、術語管理系統、項目管理系統等模塊,各自在規模性的筆譯項目中互相配合,參與需求處理、譯前處理、資源匹配、譯員培訓、里程碑分析、稿件派發、翻譯、審校、質檢排版、交付、反饋修改等過程,集成完成計算機輔助翻譯。

以翻譯軟件Trados為例,譯員個人利用CAT完成一項翻譯任務步驟包括:接收SDLXLIFF文件—翻譯單個文檔—創建翻譯記憶庫—加載術語—合并術語—相關搜索(語料庫)—確認并移至下一句—審校修訂—導出以進行雙語校審(Word)—提取術語—Tag處理—批任務—分析文件、導出—最終交付。過程看似繁復,實則省時省力,CAT大大提高了譯員的翻譯速度和翻譯質量。

如今翻譯公司在市場運作中或購買專業CAT工具,或兼有科技公司性質自主研發CAT軟件,人工智能+翻譯創造的生產力達史前最高峰,國內眾多互聯網巨頭更是紛紛跑馬圈地,競相布局以爭風口,市場一片繁榮向好。

4.AI新時代

承認與否,人工智能新時代已經來臨??拼笥嶏w董事長攜曉譯翻譯機亮相兩會,AlphaGo戰勝人類頂尖圍棋手李世石、柯潔,人機高考大戰AI表現出色,無人駕駛汽車相繼亮相街頭,生產車間裝滿智能化、自動化流水線,還有智能機械手臂、無人駕駛、人臉識別……不經意間,人工智能已經悄無聲息地滲透到人類生活,在各行各業中得到一定普及與應用,在這個追求效率和服務至上的時代,成為了當之無愧的寵兒,甚至在國民經濟發展中扮演的角色也愈加重要。

與此同時,人工智能威脅論、人類失業危機等負面輿論甚囂塵上,成了目前人類對人工智能強勢崛起最為忌憚的痛點所在。就語言服務領域來說,機器客服、智能翻譯憑借語音或文本的方式已經實現與用戶的自然交互,傳統行業從業者收到的沖擊不容小覷。

5.人工智能的阿克琉斯之踵

5.1 算法有盡,可能有限,語言非也

無論如何模擬人腦,人工智能終歸是受計算機語言控制,按照預先的算法和設定的程序運作,結果是在一定范圍內的選擇,而非無限的可能和創造。AlphaGo圍棋可以戰勝李世石、打敗柯潔,一定程度上是得益于圍棋競技本身具有算數推演、可能有限的特點,而語言并非如此。

“本質上,機器翻譯是基于雙語描寫、對比和匹配結果的形式化和程序化處理,實現不同語言的自動翻譯,其特征主要表現為自動化、機械化、以句子為翻譯單位、二度模仿和語境制約有限等特征?!边@決定了其多適用于高重復率高程式化文本,比如法律文書、產品說明、合同訂單。在含有豐富的語言現象、文學理念、修辭手法以及特定環境的文本中,機器翻譯無法替代人腦做出聯想和想象,無法傳遞人際間的情感與審美,無法描繪出一萬個讀者心目的一萬個哈姆雷特。

5.2 思維邏輯,背景文化,森羅萬象

語言是人類的文明成果,是思維邏輯的載體。拿中英翻譯來說,中文語言意合形散、規則性弱,英語語言邏輯縝密、形式嚴謹,是兩個民族在歷史發展過程中形成的獨家藝術,反映了各自不同的哲學思想和思維方式,二者本身就存在無法全盤轉化和表達的弊端。人類語言系統之錯綜復雜,使人類自身對大腦思維與自然語言之間的處理方式、語言思維與文化背景之間的聯絡關系就認知尚淺,又怎能訓練機器做到與人腦反應無二?

騰訊AI在博鰲論壇同傳中犯下“一條公路和一條腰帶”這般讓人啼笑皆非的錯誤,曉譯翻譯機無法識別言語復雜和口齒不清的語句······種種缺憾證明目前AI翻譯或是AI對話中,語義分析、語篇分析、語境分析都是尚未攻克的難題,又何談文化思維的翻譯轉化;加之保證語料庫的與時更新和硬件技術的支持保障本身就是一項浩瀚工程,現在的人工智能遠非至善,還有長足的發展空間。

5.3 人工翻譯突圍

5.3.1 高校課程改革

AI的尚未完美和冉冉升起,正是人才培養和發展的改革機遇期。目前諸多高校已順應科技潮流和市場變化,積極調整課程大綱和專業設置,培養符合時代要求的翻譯人才。北京大學軟件與微電子學院計算機技術系率先開設計算機輔助翻譯專業,作為新興的交叉學科,培養文理兼備的復合型人才;筆者所在的西北農林科技大學外語系開設計算機輔助翻譯課程,采取傳統理論教學+翻譯輔助工具模式,利用Trados、MemoQ等翻譯軟件帶領學生開展項目實踐。綜合來看,高校管理者和翻譯專業師生已經意識到,未來市場需要的不是僅能掌握翻譯原理和技巧的傳統譯員,而是“專業+技術”,“效率+質量”的高端翻譯人才。

5.3.2 “智能+人工”——翻譯的理想國

分析看來,機器翻譯、計算機輔助翻譯、人工翻譯都是提供語言服務的手段和工具,目的是達到一定的服務質量和服務效率,各有千秋,工力悉敵。機器在程式化翻譯上的效率無可比擬,人類在情感和審美上的思考獨一無二。人工智能或將取代人工翻譯的觀點多是技術、商圈、媒體為引資本、博噱頭而夸下的???,卻無意中攪亂了行業的風向標,致使有人或對人工翻譯唉聲嘆氣,或對機器翻譯嗤之以鼻,而忽視了人工與智能之間的互補互助、互不替代的聯結關系。

筆者認為,隨著體力工作和知識工作自動化進程,人工智能會重新定義翻譯行業:“人工智能+翻譯眾包(Translation Outsourcing)”或將是未來發展方向。由人工智能完成初級翻譯和低錯質檢,人工譯員進行專業化的潤色修改;同時機器在后臺自動存儲和不斷學習修改的譯文,變得更加“聰明”、更具“人性”特征。不僅如此,人工智能將與人工譯員成為個性化拍檔,AI學習特定譯員的語言風格、掌握一定領域的專業表達,與人工譯員合作完成復雜多樣的翻譯任務,進一步提高服務效率和服務質量。

“君子性非異也善假于物也”,未來翻譯的理想國里,不是機器取代人工,而是善用工具的譯員取代傳統守舊的譯員,專業高級譯員取代底端從業者。精益求精、工匠精神,是未來各行各業免受AI侵蝕的必然要求,是人類社會發展到一定程度的自然現象。

猜你喜歡
譯員機器人工
人工3D脊髓能幫助癱瘓者重新行走?
機器狗
機器狗
人工,天然,合成
人工“美顏”
未來機器城
會議口譯中譯員的譯前準備研究——一項基于上海譯員的問卷調查
口譯中的“陷阱”
新型多孔鉭人工種植牙
論機器翻譯時代人工譯員與機器譯員的共軛相生
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合