?

牛津英語大辭典的數字化歷程及啟示

2014-07-16 07:06林曉芳
現代出版 2014年3期
關鍵詞:辭典詞條工具書

牛津英語大辭典(以下簡稱OED),是牛津大學出版社(以下簡稱OUP)的品牌產品,自1884年出版至今已經有130多年的歷史,不僅極大地增強了牛津大學出版社的品牌和學術出版影響力,也成為OUP迄今為止運轉時間最長、最成功的學術項目之一。它的每次技術變革都為世界出版界和辭典使用者所矚目,其數字化轉型發展的成功實踐也為業界提供了有益啟示,值得認真研究借鑒。

一、OED的數字化發展歷程

在130多年的時間里,OED的數字化發展經歷了三個重要階段:光盤版、在線版和智能編輯系統。隨著技術變革,從書稿到出書的線性化模式被徹底顛覆,OED成為基于多任務平臺、內容整合與鏈接,能實現網上信息接入與檢索的高速數字信息傳遞系統。

第一階段 :光盤版(CD-ROM)(1982~1992)

OED當時面臨的主要挑戰是如何為學者、用戶及出版社創造更大的價值;同時,還要解決50年版權即將到期的問題。為此,它采取的主要辦法是,整合增補版與第一版的內容,將增補版中的詞條加入合適的位置,為讀者提供便利的同時保護第一版版權。

首先是把兩種文本的全部內容電子化,再利用新技術把兩部分文件整合到一起進行編輯。文本標記采用當時比較創新的標準通用標示語言(SGML),由錄入員輸入一個約含15種主要結構標簽的混合體系(如:中心詞、發音、詞源、詞義分節、例證、例證日期、作者等)和較低水平的傳統排版標記(如:以斜體標記各種不同標簽或引文格式)。在這個階段,讀者可以搜索全文和一些主要元素,包括中心詞、發音、詞源、含義和例證等。

第二階段: 在線版(1992~2005)

OED開始啟動第三版修訂計劃,更新并修訂每一詞條,不僅收錄19世紀語言的變更,同時也收錄了新例證、新學術、新思想及新項目,如《中古英語辭典》(Middle English Dictionary)等。為支持這一方案,OED調整了相應的工作內容和流程,設立了一個OED在線出版發行項目,并與高線出版社(HighWire Press)開展合作。高線出版社采用Java和Perl程序語言把這些源文件保存在一個Sybase數據庫中,采用定制化的Verity K2搜索引擎來搜索文章,通過“SGML至HTML”樣式表和轉換程序生成頁面。

2000年3月,OED在線版正式上線。像許多其他采用SGML源文件的出版商一樣,OUP選擇以內聯GIF圖片來呈現這些字符,還委托制作了2,500幅手繪插圖以顯示1,000個左右的特殊字符;設計方面,創建了一個既易于使用又涵蓋印刷版本所有特征的界面設計。

第三階段: 辭典編輯管理系統Pasadena(2005年以后)

OED在數字化以來開發了內部編輯系統,直接保障了項目的高效順利執行,先后經歷了“整合、出版發行和更新系統”(OEDIPUS)和第二代編輯系統TESS/TED,到第三代編輯系統Pasadena的時候,逐漸成熟。

第一代OEDIPUS系統使編輯可以訪問辭典數據,校對詞條以實現即時核對,并且可以對文本完整性進行檢查和控制,對存在明顯錯誤的條目進行編輯變更。

第二代編輯系統適用于開放系統,如:X-windows、Unix操作系統等,此外,還創建了與TESS系統相連的新的文本編輯器TED。用戶可以在辭典中檢索并編輯任何詞條,增強了用戶與編輯的互動性。

第三代編輯系統針對用戶需求,盡可能整合所有編輯功能。除數據庫、搜索界面和詞條編輯外,系統還包含辭典瀏覽器,允許向內部用戶和經授權的遠程用戶顯示詞條;通過外部檢索從詞條中提取圖書館檢索和問題請求,并在完成時把上述內容返回詞條編輯。

隨著新系統的出現,OUP第一次決定改變OED詞條結構,使編輯可以不再必須按照字母排序進行修訂,而是關注查詢次數最多的詞匯以及最新的資料,也可以按照詞條的主題設置進行修訂。這一系統的使用,極大地提高了編輯的工作效率,也使OED真正實現了為全世界用戶服務,收到了良好的效果。

二、OED數字化轉型成功的主要原因

1.離不開卓有成效的項目管理

項目管理是OED數字化轉型成功的關鍵。在OED第二版項目開始時,由項目總監負責編寫總體項目規劃,確定項目的主要工作、相互關系、各活動需花費的時間,以及各活動所需的人力、設備和資金。這些活動具體包括:數據轉換、初步校對工作、機讀文本的計算機開發和自動處理、在屏幕上編輯詞條、長條校樣排版、最終校對工作和最終頁面排版,所有工作內容都制定了詳細的計劃。

1984年10月,項目組起草了一份《用戶需求聲明》,列出項目的目標和計算機系統應執行的操作;1985年7月,計算機團隊公布了一份系統設計大綱,完成計算機系統的初步設計之后,構建和運行該系統所需的時間被加入計劃,并制定了規定各項工作完成時間的嚴格“記錄計劃”:出版發行期限定于1989年3月。這在OED歷史上是第一次在項目運營中采用規劃軟件來監測項目運行的時間和費用。

為支持項目編輯,OED以史無前例的規模來編纂項目規程,每一步都撰寫了詳細的操作手冊,包括校對手冊、整合手冊、發音檢查手冊和鍵盤輸入手冊等。在項目的后續階段繼續使用這一方法,編寫了普通培訓手冊、計算機系統使用手冊、特殊詞條或詞條部分編輯手冊,以及最特別的書目原則手冊。隨著OED2輔助文本的出版發行,還特別編寫了綜合參考書目、初步措施和項目歷史。正是由于對這些項目實施了卓有成效的科學管理,才保證了OED項目的順利實施。

2. 離不開與技術公司的緊密合作

由于意識到自己的優勢是把握內容,OUP沒有再設立技術部門,而是通過項目招標,在不同階段選擇專業技術公司進行合作。例如,在20世紀80年代開始啟動將紙質內容轉化為電子文本時,選擇了當時熟悉字典編排和標引規則的國際電腦印刷公司ICC;后來選擇IBM英國公司和加拿大的滑鐵盧大學共同開發相應的處理電子文本,并允許機讀訪問的程序;1990年,又委托荷蘭軟件公司AND開發具有搜索功能的OED2的光盤版。1999年,為開發OED在線版,選擇與斯坦福大學圖書館的網絡出版商高線出版社合作,2000年3月正式上線后主機仍然由高線出版社托管,以便處理相關技術問題。為提高編輯工作效率,更有效地修訂內容,選擇法國軟件公司IDM來開發新的編輯出版管理系統Pasadena。

3.離不開編輯人員的快速適應

在專項培訓項目結束后,Pasadena系統于2005年6月15日正式上線。OUP決定不同時使用新舊編輯系統,并按照順序組織編輯工作:一是全面關閉舊版系統(有序暫停工作);二是開展正式的Pasadena培訓項目(包括專業課堂教學、詳細用戶指南培訓和專項培訓練習);三是安排短暫的適應期,讓編輯在安全的測試環境中使用新版軟件;四是轉移至在線系統,按預定的工作量恢復工作。

在隨后幾年中,這套系統保持了較高的穩定性,使編輯人員很快適應了工作流信息和辭典數據相互分離、書目引用脫離詞條編輯的設計模式。幾乎所有人員在經過培訓后都能使用新版系統來恢復原有的編輯工作。短短3個月內,新版系統的編輯使用評分便超越了舊版系統的最高分。

三、對我國工具書數字化轉型發展的啟示

我國的工具書數字化轉型中,行動比較早的出版機構有商務印書館的“工具書在線”,上海世紀出版集團的“工具書在線”和中國大百科全書出版社的《中國大百科全書》網絡版。這些項目由于各種原因,還在探索之中,沒有獨自走出一片藍天。而同方知網作為內容集成平臺,延攬大量的工具書進入平臺,實現了逐年上升的贏利勢頭。綜觀我國現有的工具書產品,大多只是紙質產品的電子化或封閉的數據庫化,不能實現外鏈和跨庫檢索,沒有實現協同編纂,用戶體驗與需求之間的差距較大。與OED相比,我國的工具書數字化轉型還有很長的路要走。認真總結OED的發展歷程,吸取其寶貴經驗是非常有意義的。

1.決策前瞻,投入持續

在OED發展的每個關鍵時期,OUP都能從長遠角度出發進行決策。20世紀80年代初,當計算機技術處于初級階段,很多人還不知道計算機為何物的時候,OUP就提出將OED文本電子化并進行數字化標引,從而為OED2的推出及光盤版和OED在線奠定了堅實的基礎。OED2出版不久,很快又著眼于第三版,更新并修訂每一詞條,不僅收錄19世紀語言的變更,同時收錄新證據、新學術、新思想及主要新項目。1994年左右,設立OED在線出版發行項目,使用戶可以在線利用第二版的完整內容。2000年3月起,每一季度在網上發行OED3的一個章節;同時為了使在線發行成為可能,OED部門進行重組,以保證OED的內容不斷得到更新。2010年12月,OED在線版上線10年后,又在新平臺啟動了全新改版后的網站。正是這些前瞻性的決策和持續的投入,使OED經過一個多世紀的培育和完善,依然保持了蓬勃的生命力和影響力。

工具書在數字化時代依然有強大的生命力,但決不能固步自封,要增強前瞻意識,主動適應新技術的發展潮流,始終以用戶需求為中心,及時進行前瞻性的決策,并能夠持續不斷地投入,只有這樣才能保持產品的吸引力,為用戶創造更大的價值。

2.兼顧社會效益和經濟效益

只有始終保持產品的活力,吸引用戶使用,才能擁有更多的用戶群體。OUP對OED的投入是巨大的,首先是出于社會責任的考慮。雖然OED在線版的訂閱收入持續增加,但這些收入并不能補償開發運營的成本。2000年制作出版的OED第三版總成本高達5500萬美元。2010年OED在線版網站做了全部更新和排版,制作成本顯著增加。同時,為保證在線版每季度一次更新,還配備了大約75名全職編輯處理相關的詞條、釋義及例證;產品營銷上也有相應的人力投入。但是,在OED建成大的語料庫以后,OUP從中衍生出一系列小的獨立產品,包括精編本OED等,另外開發的一些編輯軟件不僅適用于OED,工具書部門的其他編輯也可以使用這些成果。這在一定程度上促進了OUP辭典、工具書的發展,帶動了其他產品的銷售,取得了良好的經濟效益,從而實現了社會效益和經濟效益的平衡。

辭書與一般出版物相比,負有更重要的社會責任,不能一味追求經濟效益,但由此實現的衍生品的經濟價值是不可小視的,如果運營得當,完全可以實現“兩個效益”的平衡。對國內出版社來說,如何全面衡量、把握產品所能帶來的社會效益和經濟效益,妥善處理好二者的關系,對辭書在數字化轉型發展的大背景下持續健康發展至關重要。

未來工具書的發展面臨著很多挑戰和機遇。一方面,互聯網新進入者層出不窮,比如維基百科、谷歌、必應辭典等,國內的百度百科、互動百科、有道辭典等,他們充分利用了最新的搜索技術、大數據分析、社會化媒體推廣等,實現了傳統辭書無法實現的功能,滿足了用戶的需求。另一方面,移動互聯網以及移動終端的廣泛普及,為辭書的發展帶來了廣闊的發展空間。如何借鑒OED的發展經驗,把握數字化的新機遇,圍繞如何更好地滿足用戶智能化、個性化的使用需求,制定正確的數字化策略,是值得我國傳統工具書出版者深思的問題。

(林曉芳,中國新聞出版研究院對外合作交流中心主任、副編審)

參考文獻:

① Simon Winchester,The meaning of Everything the story of the Oxford English Dictionary,2003,New York,Oxford University Press

② Mike Letts,the Seybold report on internet publishing,2000.5,http:// ukcatalogue.oup.com

③ 《牛津英語大辭典》將全面改為網絡版,2010年8月31日,中國新聞網 http://www.chinanews.com/cul/2010/08-31/2501357.shtml

④ 牛津英語大辭典印刷版或停印http://learning.sohu.com/20101008/ n275470359.shtml,2010年10月08日,搜狐教育

⑤ 牛津大學出版社OED項目內部報告

猜你喜歡
辭典詞條工具書
《貓的癡情辭典》
利用簡單的公式快速分隔中英文詞條
題烏江亭
指導學生巧用工具書
初中生語文工具書使用的問題與對策
請你發明
字典與詞典
工具書的類別
不必預支
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合