?

大數據背景下石油科技翻譯

2016-12-01 17:03王永諶陽敏侯柯康王琳妹
智富時代 2016年12期
關鍵詞:機器翻譯大數據背景

王永+諶陽敏+侯柯康+王琳妹

【摘 要】隨著科技的進步,大數據已引發了翻譯界的重大變革。以谷歌翻譯、有道翻譯為代表的機器翻譯就是成功借助大數據功能進行翻譯的典型。然而,這種翻譯相比較人工翻譯可謂優缺點并存。筆者以大數據時代機器的石油科技英語翻譯作為切入點進行深入分析。探討大數據背景下石油科技翻譯的存在的機遇和問題,以期為大數據背景下的石油科技翻譯提供可行性建議,促進石油科技翻譯的高效化和智能化。

【關鍵詞】大數據背景;機器翻譯;石油科技翻譯;應對的建議

在科技進步的推動下,大數據時代已經到來,它正以前所未有的廣度和深度影響著人類社會?!叭藗儗τ诖髷祿耐诰蚝瓦\用,預示著新一波生產力增長和消費盈余潮的到來”(Manyika J 2011)。翻譯作為推動人類文明進步的重要環節,不可避免的受其影響。然而,在翻譯界真正結合大數據的研究幾乎空白?;诖?,筆者初步探討大數據與翻譯間的關系和相互影響,構架出翻譯與大數據間內在邏輯關系和理論框架,探索出如何借助大數據進一步推動翻譯的高效化和智能化,推動翻譯為人類文明進步作出更大貢獻。在此,筆者以谷歌翻譯中石油科技翻譯作為切入點,進行深入分析。

一、大數背景下的翻譯特點

以谷歌翻譯為代表的搜索引擎翻譯是利用大數據功能進行翻譯的典型?!案鶕S基百科公布的數據,截至2016年1月,谷歌翻譯支持90種語言,每天為超過兩億人提供免費的多種語言翻譯服務”(斯介生 ?2016)。因此,它具有快捷、量大、高效、語種多等特點。但這種大數據背景下的翻譯在準確性方面還存在很多缺點和不足。為此,我們從以下幾點進行探討:

首先,大數據時代背景下的機器翻譯(以谷歌翻譯為代表),主要是基于大數據功能產生,其翻譯質量受到平行語料庫數據量的制約。而且,語料庫數據中存儲樣本量的不同都會影響翻譯質量。

再者,大數據時代背景下的機器翻譯的模型不能有效識別上下文信息;造成不能識別諸如虛擬語氣、被動語態等語法信息,要么只能識別部分信息。

其次,大數據時代背景下的機器翻譯不能翻譯過長句式的文本。一旦文本句式過長,其翻譯的質量就會下降。

最后,大數據時代背景下的機器翻譯給出的詞頻不能作為譯者采納的標準。

二、石油科技翻譯語言特點

石油英語的語言基于其特殊的專業性和歷史發展,具有其自身特點。筆者以英語為代表進行分析,其具備以下特點:

首先:石油英語具有準確性的特點。這主要表現為:構詞的準確性。石油科技英語從拉丁語、希臘語借用大量術語,以及借助拉丁和希臘詞綴構成大量新詞,而由于拉丁語和希臘語本身意義單一,造成其歧義較少,故準確性較強(鄒宇2007)。例如,hydrocarbon(碳氫化合物, 烴類)。詞綴構成詞匯較多,如desalting(脫鹽)。抽象名詞廣泛使用,如permeability(滲透率)。

再者,石油科技英語中大量運用嚴密、復雜、條理的復合長句表達理論原理、發展變化過程。

再者,石油科技英語具有客觀性。被動語態廣泛使用、現在時態較頻繁。

其次,石油科技英語具有簡潔性??s略詞大量使用,就是其中最明顯的一個特點。如,EOR(enhanced oil recovery):提高采收率。

最后,石油科技英語具有多重學科背景,而且伴隨著石油業的不斷發展,不斷有新詞匯產生,如,timestep(時間步長)。

三、大數據背景下石油科技翻譯的建議

首先,我們翻譯界尤其是石油專業的高校要和石油公司緊密聯系,獲取豐富的翻譯文本,不斷進行與石油相關的平行語料庫建設和完善,為大數據的數據搜索提供原材料。由于石油科技語言的準確簡介性特點決定了只要我們進行充分的詞匯和句式收集就可為大數據時代機器翻譯的準確性提供保證。從實踐中提煉出翻譯準確,標準規范的詞組、句式,繼而通過語料庫進行儲備,然后再通過網絡進行傳播使用,可以有效提升大數據搜集的準確性和嚴密性,從而使諸如谷歌之類的翻譯更具可靠性。

再者,基于大數時代的機器翻譯功能仍未達到成熟水平,不能有效識別上下文語境和復雜長句子。這要求石油科技的翻譯同時要依靠人工翻譯,由譯者去判斷分析句式語法結構,去思考英語句子中的邏輯,再結合譯入語和譯出語的具體語言結構進行恰當翻譯。

其次,基于大數據時代機器翻譯時分析搜集出的詞和詞組仍沒有完全結合語境,其詞頻高低不能作為準確翻譯的標準?!皬姆g理論上分析目的語中普通真實語言的詞頻大小一般不作為譯文的選擇標準,即: 高頻詞不一定適合語境”(倪傳斌 2003)。當然,這種情況也適用于固定搭配。舉例來說,譯者不能由于“petroleum”比“oil ”在真實英語環境中的使用頻率高,在英譯漢時就不加分析總把“petroleum”作為“石油”。同理,大數據搜集出的結果總是基于詞匯頻率高低,有時高頻的譯入語就不能作為語境的最佳選擇。這就需要譯者在進行大數據機器輔助翻譯時,將數據搜集結果結合語境,結合其他關鍵詞進行邏輯分析,以準確把握詞的意義。

再其次,譯者要結合石油科技語言特點和大數據時代的機器翻譯功能原理,主動進行多學科知識積累和儲備;尤其要對大數據的原理和功能進行學習掌握,以更有效發揮其功效。

最后,大數據時代的到來,要求譯者必須和計算機、統計學科領域的學者進行密切合作,以開發出適合特定領域翻譯特點的翻譯軟件和應用程序;對于石油科技英語而言,就要研發出特定的石油科技翻譯軟件和應用程序,以推進石油科技英語翻譯的高效化和智能化。

四、結語

綜上所述,大數據時代的到來,為石油科技等領域的翻譯打開了一扇門。大數據的強大功能將繼續推動翻譯界的變革。譯者要全面認識大數據時代石油科技翻的特點和機理,分析其不足,找準譯者職責新的定位點。既要借助大數據的功能又要發揮譯者翻譯時的主導性;同時,譯者要進行跨學科學習與合作,不斷研發適合石油科技翻譯的新軟件和應用程序,提升石油科技翻譯的高效化和智能化水平。

【參考文獻】

[1]Manyika J, Chui M, Brown B, Bughin J, Dobbs R, Roxburgh C, Byers AH. Big data: nextfrontierforinnovation ,competition,andproductivity.2011.http://www.mckinsey.com/insights/business_technology/big_data_the_next_frontier_for_innovation

[2]倪傳斌 郭鴻杰 趙勇. 論利用互聯網搜索引擎協助翻譯的科學性和可行性——兼與朱明炬先生商榷--[J]. 上??萍挤g,2003,04

[3]斯介生 宋大我 李揚. 大數據背景下的谷歌翻譯 統計研究[J] .統計研究,2016,05 .

[4] 鄒宇.石油英語的特點及翻譯[J].中國科技翻譯,2007,08.

猜你喜歡
機器翻譯大數據背景
大數據背景下企業財務管理的挑戰與變革
淺析大數據背景下財務工作問題與創新
信息時代下機器翻譯的“可譯”與“不可譯”
互聯網+新時代下人機翻譯模式研究
“語聯網+行業” 助力中國偉大復興
大數據背景下企業績效管理的探討
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合