牛津英語大辭典(以下簡稱OED),是牛津大學出版社(以下簡稱OUP)的品牌產(chǎn)品,自1884年出版至今已經(jīng)有130多年的歷史,不僅極大地增強了牛津大學出版社的品牌和學術(shù)出版影響力,也成為OUP迄今為止運轉(zhuǎn)時間最長、最成功的學術(shù)項目之一。它的每次技術(shù)變革都為世界出版界和辭典使用者所矚目,其數(shù)字化轉(zhuǎn)型發(fā)展的成功實踐也為業(yè)界提供了有益啟示,值得認真研究借鑒。
一、OED的數(shù)字化發(fā)展歷程
在130多年的時間里,OED的數(shù)字化發(fā)展經(jīng)歷了三個重要階段:光盤版、在線版和智能編輯系統(tǒng)。隨著技術(shù)變革,從書稿到出書的線性化模式被徹底顛覆,OED成為基于多任務平臺、內(nèi)容整合與鏈接,能實現(xiàn)網(wǎng)上信息接入與檢索的高速數(shù)字信息傳遞系統(tǒng)。
第一階段 :光盤版(CD-ROM)(1982~1992)
OED當時面臨的主要挑戰(zhàn)是如何為學者、用戶及出版社創(chuàng)造更大的價值;同時,還要解決50年版權(quán)即將到期的問題。為此,它采取的主要辦法是,整合增補版與第一版的內(nèi)容,將增補版中的詞條加入合適的位置,為讀者提供便利的同時保護第一版版權(quán)。
首先是把兩種文本的全部內(nèi)容電子化,再利用新技術(shù)把兩部分文件整合到一起進行編輯。文本標記采用當時比較創(chuàng)新的標準通用標示語言(SGML),由錄入員輸入一個約含15種主要結(jié)構(gòu)標簽的混合體系(如:中心詞、發(fā)音、詞源、詞義分節(jié)、例證、例證日期、作者等)和較低水平的傳統(tǒng)排版標記(如:以斜體標記各種不同標簽或引文格式)。在這個階段,讀者可以搜索全文和一些主要元素,包括中心詞、發(fā)音、詞源、含義和例證等。
第二階段: 在線版(1992~2005)
OED開始啟動第三版修訂計劃,更新并修訂每一詞條,不僅收錄19世紀語言的變更,同時也收錄了新例證、新學術(shù)、新思想及新項目,如《中古英語辭典》(Middle English Dictionary)等。為支持這一方案,OED調(diào)整了相應的工作內(nèi)容和流程,設立了一個OED在線出版發(fā)行項目,并與高線出版社(HighWire Press)開展合作。高線出版社采用Java和Perl程序語言把這些源文件保存在一個Sybase數(shù)據(jù)庫中,采用定制化的Verity K2搜索引擎來搜索文章,通過“SGML至HTML”樣式表和轉(zhuǎn)換程序生成頁面。
2000年3月,OED在線版正式上線。像許多其他采用SGML源文件的出版商一樣,OUP選擇以內(nèi)聯(lián)GIF圖片來呈現(xiàn)這些字符,還委托制作了2,500幅手繪插圖以顯示1,000個左右的特殊字符;設計方面,創(chuàng)建了一個既易于使用又涵蓋印刷版本所有特征的界面設計。
第三階段: 辭典編輯管理系統(tǒng)Pasadena(2005年以后)
OED在數(shù)字化以來開發(fā)了內(nèi)部編輯系統(tǒng),直接保障了項目的高效順利執(zhí)行,先后經(jīng)歷了“整合、出版發(fā)行和更新系統(tǒng)”(OEDIPUS)和第二代編輯系統(tǒng)TESS/TED,到第三代編輯系統(tǒng)Pasadena的時候,逐漸成熟。
第一代OEDIPUS系統(tǒng)使編輯可以訪問辭典數(shù)據(jù),校對詞條以實現(xiàn)即時核對,并且可以對文本完整性進行檢查和控制,對存在明顯錯誤的條目進行編輯變更。
第二代編輯系統(tǒng)適用于開放系統(tǒng),如:X-windows、Unix操作系統(tǒng)等,此外,還創(chuàng)建了與TESS系統(tǒng)相連的新的文本編輯器TED。用戶可以在辭典中檢索并編輯任何詞條,增強了用戶與編輯的互動性。
第三代編輯系統(tǒng)針對用戶需求,盡可能整合所有編輯功能。除數(shù)據(jù)庫、搜索界面和詞條編輯外,系統(tǒng)還包含辭典瀏覽器,允許向內(nèi)部用戶和經(jīng)授權(quán)的遠程用戶顯示詞條;通過外部檢索從詞條中提取圖書館檢索和問題請求,并在完成時把上述內(nèi)容返回詞條編輯。
隨著新系統(tǒng)的出現(xiàn),OUP第一次決定改變OED詞條結(jié)構(gòu),使編輯可以不再必須按照字母排序進行修訂,而是關(guān)注查詢次數(shù)最多的詞匯以及最新的資料,也可以按照詞條的主題設置進行修訂。這一系統(tǒng)的使用,極大地提高了編輯的工作效率,也使OED真正實現(xiàn)了為全世界用戶服務,收到了良好的效果。
二、OED數(shù)字化轉(zhuǎn)型成功的主要原因
1.離不開卓有成效的項目管理
項目管理是OED數(shù)字化轉(zhuǎn)型成功的關(guān)鍵。在OED第二版項目開始時,由項目總監(jiān)負責編寫總體項目規(guī)劃,確定項目的主要工作、相互關(guān)系、各活動需花費的時間,以及各活動所需的人力、設備和資金。這些活動具體包括:數(shù)據(jù)轉(zhuǎn)換、初步校對工作、機讀文本的計算機開發(fā)和自動處理、在屏幕上編輯詞條、長條校樣排版、最終校對工作和最終頁面排版,所有工作內(nèi)容都制定了詳細的計劃。
1984年10月,項目組起草了一份《用戶需求聲明》,列出項目的目標和計算機系統(tǒng)應執(zhí)行的操作;1985年7月,計算機團隊公布了一份系統(tǒng)設計大綱,完成計算機系統(tǒng)的初步設計之后,構(gòu)建和運行該系統(tǒng)所需的時間被加入計劃,并制定了規(guī)定各項工作完成時間的嚴格“記錄計劃”:出版發(fā)行期限定于1989年3月。這在OED歷史上是第一次在項目運營中采用規(guī)劃軟件來監(jiān)測項目運行的時間和費用。
為支持項目編輯,OED以史無前例的規(guī)模來編纂項目規(guī)程,每一步都撰寫了詳細的操作手冊,包括校對手冊、整合手冊、發(fā)音檢查手冊和鍵盤輸入手冊等。在項目的后續(xù)階段繼續(xù)使用這一方法,編寫了普通培訓手冊、計算機系統(tǒng)使用手冊、特殊詞條或詞條部分編輯手冊,以及最特別的書目原則手冊。隨著OED2輔助文本的出版發(fā)行,還特別編寫了綜合參考書目、初步措施和項目歷史。正是由于對這些項目實施了卓有成效的科學管理,才保證了OED項目的順利實施。
2. 離不開與技術(shù)公司的緊密合作
由于意識到自己的優(yōu)勢是把握內(nèi)容,OUP沒有再設立技術(shù)部門,而是通過項目招標,在不同階段選擇專業(yè)技術(shù)公司進行合作。例如,在20世紀80年代開始啟動將紙質(zhì)內(nèi)容轉(zhuǎn)化為電子文本時,選擇了當時熟悉字典編排和標引規(guī)則的國際電腦印刷公司ICC;后來選擇IBM英國公司和加拿大的滑鐵盧大學共同開發(fā)相應的處理電子文本,并允許機讀訪問的程序;1990年,又委托荷蘭軟件公司AND開發(fā)具有搜索功能的OED2的光盤版。1999年,為開發(fā)OED在線版,選擇與斯坦福大學圖書館的網(wǎng)絡出版商高線出版社合作,2000年3月正式上線后主機仍然由高線出版社托管,以便處理相關(guān)技術(shù)問題。為提高編輯工作效率,更有效地修訂內(nèi)容,選擇法國軟件公司IDM來開發(fā)新的編輯出版管理系統(tǒng)Pasadena。
3.離不開編輯人員的快速適應
在專項培訓項目結(jié)束后,Pasadena系統(tǒng)于2005年6月15日正式上線。OUP決定不同時使用新舊編輯系統(tǒng),并按照順序組織編輯工作:一是全面關(guān)閉舊版系統(tǒng)(有序暫停工作);二是開展正式的Pasadena培訓項目(包括專業(yè)課堂教學、詳細用戶指南培訓和專項培訓練習);三是安排短暫的適應期,讓編輯在安全的測試環(huán)境中使用新版軟件;四是轉(zhuǎn)移至在線系統(tǒng),按預定的工作量恢復工作。
在隨后幾年中,這套系統(tǒng)保持了較高的穩(wěn)定性,使編輯人員很快適應了工作流信息和辭典數(shù)據(jù)相互分離、書目引用脫離詞條編輯的設計模式。幾乎所有人員在經(jīng)過培訓后都能使用新版系統(tǒng)來恢復原有的編輯工作。短短3個月內(nèi),新版系統(tǒng)的編輯使用評分便超越了舊版系統(tǒng)的最高分。
三、對我國工具書數(shù)字化轉(zhuǎn)型發(fā)展的啟示
我國的工具書數(shù)字化轉(zhuǎn)型中,行動比較早的出版機構(gòu)有商務印書館的“工具書在線”,上海世紀出版集團的“工具書在線”和中國大百科全書出版社的《中國大百科全書》網(wǎng)絡版。這些項目由于各種原因,還在探索之中,沒有獨自走出一片藍天。而同方知網(wǎng)作為內(nèi)容集成平臺,延攬大量的工具書進入平臺,實現(xiàn)了逐年上升的贏利勢頭。綜觀我國現(xiàn)有的工具書產(chǎn)品,大多只是紙質(zhì)產(chǎn)品的電子化或封閉的數(shù)據(jù)庫化,不能實現(xiàn)外鏈和跨庫檢索,沒有實現(xiàn)協(xié)同編纂,用戶體驗與需求之間的差距較大。與OED相比,我國的工具書數(shù)字化轉(zhuǎn)型還有很長的路要走。認真總結(jié)OED的發(fā)展歷程,吸取其寶貴經(jīng)驗是非常有意義的。
1.決策前瞻,投入持續(xù)
在OED發(fā)展的每個關(guān)鍵時期,OUP都能從長遠角度出發(fā)進行決策。20世紀80年代初,當計算機技術(shù)處于初級階段,很多人還不知道計算機為何物的時候,OUP就提出將OED文本電子化并進行數(shù)字化標引,從而為OED2的推出及光盤版和OED在線奠定了堅實的基礎(chǔ)。OED2出版不久,很快又著眼于第三版,更新并修訂每一詞條,不僅收錄19世紀語言的變更,同時收錄新證據(jù)、新學術(shù)、新思想及主要新項目。1994年左右,設立OED在線出版發(fā)行項目,使用戶可以在線利用第二版的完整內(nèi)容。2000年3月起,每一季度在網(wǎng)上發(fā)行OED3的一個章節(jié);同時為了使在線發(fā)行成為可能,OED部門進行重組,以保證OED的內(nèi)容不斷得到更新。2010年12月,OED在線版上線10年后,又在新平臺啟動了全新改版后的網(wǎng)站。正是這些前瞻性的決策和持續(xù)的投入,使OED經(jīng)過一個多世紀的培育和完善,依然保持了蓬勃的生命力和影響力。
工具書在數(shù)字化時代依然有強大的生命力,但決不能固步自封,要增強前瞻意識,主動適應新技術(shù)的發(fā)展潮流,始終以用戶需求為中心,及時進行前瞻性的決策,并能夠持續(xù)不斷地投入,只有這樣才能保持產(chǎn)品的吸引力,為用戶創(chuàng)造更大的價值。
2.兼顧社會效益和經(jīng)濟效益
只有始終保持產(chǎn)品的活力,吸引用戶使用,才能擁有更多的用戶群體。OUP對OED的投入是巨大的,首先是出于社會責任的考慮。雖然OED在線版的訂閱收入持續(xù)增加,但這些收入并不能補償開發(fā)運營的成本。2000年制作出版的OED第三版總成本高達5500萬美元。2010年OED在線版網(wǎng)站做了全部更新和排版,制作成本顯著增加。同時,為保證在線版每季度一次更新,還配備了大約75名全職編輯處理相關(guān)的詞條、釋義及例證;產(chǎn)品營銷上也有相應的人力投入。但是,在OED建成大的語料庫以后,OUP從中衍生出一系列小的獨立產(chǎn)品,包括精編本OED等,另外開發(fā)的一些編輯軟件不僅適用于OED,工具書部門的其他編輯也可以使用這些成果。這在一定程度上促進了OUP辭典、工具書的發(fā)展,帶動了其他產(chǎn)品的銷售,取得了良好的經(jīng)濟效益,從而實現(xiàn)了社會效益和經(jīng)濟效益的平衡。
辭書與一般出版物相比,負有更重要的社會責任,不能一味追求經(jīng)濟效益,但由此實現(xiàn)的衍生品的經(jīng)濟價值是不可小視的,如果運營得當,完全可以實現(xiàn)“兩個效益”的平衡。對國內(nèi)出版社來說,如何全面衡量、把握產(chǎn)品所能帶來的社會效益和經(jīng)濟效益,妥善處理好二者的關(guān)系,對辭書在數(shù)字化轉(zhuǎn)型發(fā)展的大背景下持續(xù)健康發(fā)展至關(guān)重要。
未來工具書的發(fā)展面臨著很多挑戰(zhàn)和機遇。一方面,互聯(lián)網(wǎng)新進入者層出不窮,比如維基百科、谷歌、必應辭典等,國內(nèi)的百度百科、互動百科、有道辭典等,他們充分利用了最新的搜索技術(shù)、大數(shù)據(jù)分析、社會化媒體推廣等,實現(xiàn)了傳統(tǒng)辭書無法實現(xiàn)的功能,滿足了用戶的需求。另一方面,移動互聯(lián)網(wǎng)以及移動終端的廣泛普及,為辭書的發(fā)展帶來了廣闊的發(fā)展空間。如何借鑒OED的發(fā)展經(jīng)驗,把握數(shù)字化的新機遇,圍繞如何更好地滿足用戶智能化、個性化的使用需求,制定正確的數(shù)字化策略,是值得我國傳統(tǒng)工具書出版者深思的問題。
(林曉芳,中國新聞出版研究院對外合作交流中心主任、副編審)
參考文獻:
① Simon Winchester,The meaning of Everything the story of the Oxford English Dictionary,2003,New York,Oxford University Press
② Mike Letts,the Seybold report on internet publishing,2000.5,http:// ukcatalogue.oup.com
③ 《牛津英語大辭典》將全面改為網(wǎng)絡版,2010年8月31日,中國新聞網(wǎng) http://www.chinanews.com/cul/2010/08-31/2501357.shtml
④ 牛津英語大辭典印刷版或停印http://learning.sohu.com/20101008/ n275470359.shtml,2010年10月08日,搜狐教育
⑤ 牛津大學出版社OED項目內(nèi)部報告