?

計算機中繁簡字轉換問題的探討

2015-05-30 18:29黃瓊霖
新課程學習·上 2015年4期
關鍵詞:轉換繁體字計算機

黃瓊霖

摘 要:在對古籍的電子化過程中,在與使用漢字的國家和地區的交流過程中,繁簡字轉換問題不僅是體現在個人知識領域方面,更是體現在計算機信息文本所必須面對的問題。盡管目前已經產生了很多繁簡轉換的電子工具和軟件系統,但繁簡轉換的錯誤率依舊很高。

關鍵詞:繁體字;簡體字;計算機;轉換

從20世紀80年代開始,關于簡化漢字的爭論就一直沒有停止過。近20多年來,在進一步改革開放的新形勢下,爭論依舊十分激烈。繁簡漢字文本的轉換問題在使用漢語漢字的社會中是一個不能回避的、亟須解決的問題。

漢字的簡體和繁體兩種體式將(會比較)長期存在。因而簡繁轉換和繁簡裝換就需要經常進行。轉換包括手寫轉換和機器轉換。多少年來,漢字主要靠手寫,但隨著信息時代的到來,漢字手寫的使用范圍將逐漸縮小。用鍵盤輸入漢字將會是今后書寫的主要形式,那么漢字繁簡的轉換過程也將會在計算機中得到實現。目前,輸入法中簡繁體字的快速切換功能、微軟的Word2003中中文繁簡轉換功能、網絡上“在線漢字簡體繁體轉換”等,都企圖能夠較為簡單快速地實現漢字繁簡的轉換。

一、繁簡字轉換存在的問題

實踐證明,假如直接采用搜狗拼音輸入法的簡繁體字快速切換,同樣,當一片準確無誤的簡體字,一經電腦程序轉化為繁體字的時候,就會發現出現大量錯別字。以Word2003中文繁簡轉換功能為例,“米糰”(錯)成了“米團”,“詩云”(錯)成了“詩雲”……假若采用“在線漢字簡體繁體轉換”,出現的錯誤則更加明顯?!吧贰背闪恕吧Y”,“幾案”成了“幾案”……舉一個小例子,一篇大約500字的簡體字文章,用電腦程序將其轉化為一篇繁體字文章,僅需0.1秒的時間,但是,要對轉換后的繁體字文章進行校正,卻可能需要1個小時的時間。由此而知,繁簡字在計算機中的轉換問題仍然需要極大的關注。

繁簡字轉換問題困難的產生主要是因為簡化字與繁體字并不都是一個與一個的整齊對應,有些簡化字與繁體字之間存在著復雜的對應關系。正如董琨先生說過:“有的人不明白有的字繁簡轉化并非單一對應關系,于是隨意代替?!笔聦嵏嬖V我們,一簡對多繁在轉換問題中所產生的問題最為嚴重。這種簡化字在轉換為繁體字的時候要進行選擇區分,從而確定轉換為哪個繁體字。

除了一簡對多繁現象之外,在一簡對一繁的簡化字中,可以分成兩類,一類是專用簡化字,一類是借用簡化字。專用簡化字指的是“新造簡化字型”,是為了簡化漢字,而選取百姓的手頭字,或者是特意造出來的字。如果離開了相對應的繁體字,該簡化字也就失去了意義。例如“愛”是“愛”的專用簡化字,只作為“愛”的代表符號。離開了“愛”字,“愛”就失去了存在的意義。這類簡化字與它相對應的繁體字音義相同,不同的只是形體的簡化,筆畫的多寡。而另一類借用簡化字指的是在漢字簡化之前已經存在的字,在漢字簡化的過程中被借用來作為簡化字。

在繁簡字的轉換過程中,一簡對多繁現象和一簡對一繁中的借用簡化字比較容易出現問題。

二、繁簡字轉換問題的解決

當我們通過鍵盤將漢字輸入計算機的時候,絕大多數都是采用輸入法,運用比較廣泛的類別是五筆輸入法和拼音輸入法。其中大多輸入法都提供了簡繁體字的快速切換功能。如何在使用的過程中既快速又準確地輸入繁體字呢?

當我們將一篇簡體字文章采用Word2003中文繁簡轉換功能,或者網上“在線漢字簡體繁體轉換”,如何才能得到高精準的轉換結果呢?

固定算法決定了程序的編制,而程序的編制則決定了電腦運作。要實現繁簡字之間準確無誤的轉換就只能從計算機的根源出發,尋找解決方法。為進一步提高漢字輸入速度,我們經常采用詞匯輸入的途徑,也就是直接輸入詞的代碼。

那么,這就需要后臺詞庫,詞庫是輸入法的靈魂,轉化問題的出現恰好說明了繁簡對應詞庫中存在較多的繁體字登陸錯誤。假若我們將計算機繁體字的詞庫進行修正,使之大容量化,廣泛收錄正確的繁體字體的常用詞匯、短語、地名、人名等,那么,就可能會提高繁體字輸入的準確率。以搜狗拼音輸入法為例,當輸入“xiàbǎi”的時候,屏幕上呈現的字體是錯誤的“下擺”。但假若通過擴大詞庫,“下襬”被收錄在內的話,錯誤的轉換問題相信會得到解決,屏幕上呈現的是正確字體“下襬”。

猜你喜歡
轉換繁體字計算機
哈哈鏡
計算機操作系統
基于計算機自然語言處理的機器翻譯技術應用與簡介
信息系統審計中計算機審計的應用
大數據時代檔案管理模式的轉換與創新
論英漢語翻譯中語內翻譯向語際翻譯的轉換
淺談平面圖與立體圖的思維培養
高中化學教學中研究性學習的應用探究
臺網友鼓動“繁體字申遺”
馮小剛建議讓繁體字回歸課本
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合