杜家利 于屏方 黃建華 楊 可 吳 凡 牛子牧
(1. 廣東外語外貿(mào)大學(xué)外國語言學(xué)及應(yīng)用語言學(xué)研究中心,廣東廣州 510420;2. 廣東外語外貿(mào)大學(xué)中國語言文化學(xué)院廣東廣州 510420;3.廣東外語外貿(mào)大學(xué)西方語言文化學(xué)院,廣東廣州 510420;4. 廣東外語外貿(mào)大學(xué)亞非語言文化學(xué)院,廣東廣州 510420)
與時(shí)俱進(jìn)地推動(dòng)科技名詞規(guī)范化工作具有重要意義[1]。大數(shù)據(jù)發(fā)展的特殊性決定了其研究的高標(biāo)準(zhǔn)性。全國科學(xué)技術(shù)名詞審定委員會(huì)(以下簡稱“名詞委”)作為代表國家審定和公布科技名詞的權(quán)威性機(jī)構(gòu),與北京國際城市發(fā)展研究院合作,及時(shí)審定公布了國內(nèi)權(quán)威的大數(shù)據(jù)百科條目,并制定了相關(guān)的大數(shù)據(jù)研究標(biāo)準(zhǔn)。大數(shù)據(jù)百科條目框架包括大數(shù)據(jù)理論、大數(shù)據(jù)戰(zhàn)略、大數(shù)據(jù)技術(shù)、數(shù)字經(jīng)濟(jì)、數(shù)字金融、數(shù)據(jù)治理、大數(shù)據(jù)安全、數(shù)權(quán)法、大數(shù)據(jù)史九個(gè)部分。
大數(shù)據(jù)研究具有促進(jìn)科技發(fā)展的重要性。作為術(shù)語研究的新興領(lǐng)域,大數(shù)據(jù)研究是在蒸汽技術(shù)革命、電力技術(shù)革命和計(jì)算機(jī)信息技術(shù)革命之后的第四次革命。新興的大數(shù)據(jù)百科條目往往承載著特定領(lǐng)域的專業(yè)概念,并具有高度濃縮的膠囊化特點(diǎn)。作為全球第二大經(jīng)濟(jì)體的中國,大數(shù)據(jù)條目的中國元素也得到越來越廣泛的關(guān)注。大數(shù)據(jù)領(lǐng)域的深入研究可進(jìn)一步完善我國相關(guān)領(lǐng)域的學(xué)科知識(shí)體系建設(shè),更好地實(shí)現(xiàn)大數(shù)據(jù)技術(shù)在各領(lǐng)域的應(yīng)用。因其具有新興科技領(lǐng)域的前沿性和前瞻性,可為我國在科技應(yīng)用方面趕超或保持國際前沿奠定基礎(chǔ)。
人工智能方面,得語言者得天下[2]。大數(shù)據(jù)研究的目標(biāo)在于推動(dòng)人工智能發(fā)展,并在國際化進(jìn)程中爭奪我國在大數(shù)據(jù)領(lǐng)域的國際話語權(quán)。名詞委積極推動(dòng)大數(shù)據(jù)百科條目的多語化進(jìn)程,并在“十三五”階段實(shí)現(xiàn)了大數(shù)據(jù)百科條目的英語翻譯、法語翻譯、俄語翻譯、西班牙語翻譯和阿拉伯語翻譯,相關(guān)研究已經(jīng)納入“術(shù)語在線”知識(shí)庫體系中。我們團(tuán)隊(duì)受名詞委的委托,完成了大數(shù)據(jù)百科條目聯(lián)合國工作語言的翻譯實(shí)踐,形成了較為有效的多語種翻譯工作理念和研究方法。本研究將分析這些工作理念和方法的得失,增強(qiáng)其在指導(dǎo)實(shí)踐方面的價(jià)值。
大數(shù)據(jù)百科條目多語種翻譯是跨學(xué)科研究,屬于術(shù)語和翻譯相交叉的范疇。百科條目的詞條審定、釋義、示例等均具有明顯的術(shù)語學(xué)特點(diǎn)。從漢語條目到英語、法語、俄語、西班牙語和阿拉伯語的平行翻譯則屬于翻譯學(xué)范疇。我們的研究主要關(guān)注的是大數(shù)據(jù)百科條目的多語種翻譯。
大數(shù)據(jù)百科條目分類是在條目分類目錄下采用簡注方式展開的。專業(yè)百科全書設(shè)置條目分類目錄,是編纂者導(dǎo)引讀者打開百科全書知識(shí)寶庫的鎖鑰[3]。大數(shù)據(jù)發(fā)展的新興特點(diǎn)決定了很多條目雖未發(fā)展到術(shù)語命名的嚴(yán)格程度,但與普通名詞有顯著區(qū)別。
百科條目通常分為自然科學(xué)條目(習(xí)稱科技條目)和社會(huì)科學(xué)條目(習(xí)稱哲社條目)兩部分[4]。名詞委審定的大數(shù)據(jù)百科條目涉及這兩部分內(nèi)容。自然科學(xué)條目和社會(huì)科學(xué)條目在同一框架中出現(xiàn),是一個(gè)事物的兩個(gè)方面,而不是對(duì)立的。就像語文詞典可能收錄一些百科條目或百科詞典可能收錄一些語詞條目一樣[5]。在立目方面,名詞委根據(jù)大數(shù)據(jù)復(fù)雜詞匯單位的自身特點(diǎn)采取了適當(dāng)?shù)牧⒛坎呗?將詞目與釋文的左右項(xiàng)關(guān)系較好地融合在一起[6-7]。更為重要的是,名詞委在大數(shù)據(jù)百科條目審定中既關(guān)注了國際性,又融入了民族性,將大數(shù)據(jù)中國元素納入大數(shù)據(jù)百科條目分類框架,較好地平衡了大數(shù)據(jù)百科條目的國際性和民族性,為研究者提供了研究大數(shù)據(jù)條目的社會(huì)和歷史線索[8-11]。
新興領(lǐng)域的百科條目需要給予關(guān)注。大數(shù)據(jù)等新興領(lǐng)域的百科條目對(duì)國內(nèi)知識(shí)文化將產(chǎn)生強(qiáng)烈沖擊[12]。這些新興百科知識(shí)提升了讀者的認(rèn)知,推動(dòng)了語言發(fā)展的增詞和增義[13],提高了新興領(lǐng)域百科條目在詞典中的收詞概率,進(jìn)而推動(dòng)詞典編纂與時(shí)俱進(jìn)[14]。新增大數(shù)據(jù)百科條目體現(xiàn)了術(shù)語審定和辭書編撰的前沿性,在百科條目研究中占據(jù)前沿地位。
我們對(duì)中國知網(wǎng)(CNKI)中的“百科條目”主題進(jìn)行了綜述性回顧。在系統(tǒng)提供的265條檢索項(xiàng)中,“百科條目”的討論主要分為兩大類:定量類和定性類。
定量類集中在信息工程領(lǐng)域,從量化視角對(duì)百科條目的收詞、評(píng)價(jià)、描述、聚類等給予關(guān)注。例如,季一木等[15]基于百度百科數(shù)據(jù)驗(yàn)證了多決策模型的質(zhì)量評(píng)價(jià)方法,為百科詞條的可行性、合理性和有效性進(jìn)行了質(zhì)量評(píng)價(jià),取得了較好的效果。李明澤等[16]在“線索利用理論”框架下驗(yàn)證了詞條內(nèi)容質(zhì)量和詞條描述質(zhì)量均可正向影響詞條感知質(zhì)量的判斷;用戶對(duì)百科詞條的知識(shí)熟悉度比較高的時(shí)候,詞條內(nèi)容質(zhì)量將顯著影響詞條感知質(zhì)量。溫田田[17]從網(wǎng)絡(luò)百科詞條編輯沖突角度入手,分析了百科詞條編纂者的價(jià)值期望,討論了主觀傾向?qū)献鲃?dòng)機(jī)的影響。黃令賀等[18]對(duì)百科詞條質(zhì)量評(píng)價(jià)進(jìn)行了信息分析。于娟和曹曉[19]驗(yàn)證了本體概念聚類方法,進(jìn)一步探討了百科詞條的領(lǐng)域概念之間的語義關(guān)系。尹坤等[20]利用SimRank算法計(jì)算了百科詞條的語義相似度,并借此準(zhǔn)確地反映詞語之間的語義關(guān)系。
定性類集中在詞典編纂、圖書出版、百科收詞、條目審查等領(lǐng)域。例如,中國百科條目“老子”在維基百科全書的協(xié)同編纂中實(shí)現(xiàn)了跨文化的域外傳播和視域融合[21]。《英漢大詞典》(第2版)的百科條目從微觀結(jié)構(gòu)、語義與概念的關(guān)聯(lián)、宏觀結(jié)構(gòu)三個(gè)層面實(shí)現(xiàn)了增補(bǔ)修訂[22]。在詞條編撰的著作權(quán)認(rèn)定方面,網(wǎng)絡(luò)百科詞條在編纂模式、獨(dú)創(chuàng)性判定、著作權(quán)歸屬及侵權(quán)規(guī)則方面呈現(xiàn)了不同于傳統(tǒng)模式的特點(diǎn),其中,作者認(rèn)為獨(dú)創(chuàng)性編輯者而非平臺(tái)擁有著作權(quán)[23],平臺(tái)對(duì)百科詞條要履行“中等程度”的審查義務(wù)[24]。
我們對(duì)1980年以來國內(nèi)“百科條目”的265篇論文進(jìn)行了可視化分析,包括發(fā)表年度統(tǒng)計(jì)、主題分布、學(xué)科分布、文獻(xiàn)來源、作者分布、作者機(jī)構(gòu)分布、關(guān)鍵詞聚類等(如圖1和圖2)。
圖1 CNKI中“百科條目”主題的發(fā)文量趨勢(shì)
圖2 CNKI中“百科條目”下的發(fā)文主題分布
從圖1可以看出,“百科條目”的研究趨勢(shì)具有兩個(gè)增長期。在改革開放初期的20世紀(jì)80年代初,經(jīng)濟(jì)發(fā)展需要百科知識(shí)的支撐,百科研究出現(xiàn)了第一次高潮。隨著我國經(jīng)濟(jì)的快速發(fā)展,2010年我國超過日本成為全球第二大經(jīng)濟(jì)體,這個(gè)時(shí)期百科研究出現(xiàn)了第二次熱潮。經(jīng)濟(jì)發(fā)展與百科研究具有一定的關(guān)聯(lián)性,其主要原因在于很多科技領(lǐng)域涉及百科知識(shí)??萍及l(fā)展需要全領(lǐng)域知識(shí)的支撐,并最終推動(dòng)經(jīng)濟(jì)前行。
從圖2可以看出,“百科條目”的研究主題集中在維基百科、百科全書、海洋測(cè)繪、中國大百科全書、中文維基百科等方面。主題的集中性體現(xiàn)出國內(nèi)研究者關(guān)注的焦點(diǎn)。研究的廣度和深度在各主題中都得到了很好的展現(xiàn)。
從圖3、圖4可以看出,“百科條目”研究涉及學(xué)科較為廣泛,排在前列的是計(jì)算機(jī)軟件及計(jì)算機(jī)應(yīng)用、出版、中國語言文字、圖書情報(bào)與數(shù)字圖書館、新聞與傳播、自然地理學(xué)和測(cè)繪學(xué)等?!掇o書研究》是發(fā)表百科條目相關(guān)研究最多的刊物。很多計(jì)算機(jī)領(lǐng)域的學(xué)者充分利用自己的學(xué)科所長,對(duì)百科條目的自動(dòng)提取、質(zhì)量評(píng)估、文本聚類等進(jìn)行了深度研究。出版業(yè)在“百科條目”方面的研究集中在大百科全書的編纂方面,推動(dòng)了我國大百科全書的發(fā)展。中國語言文字領(lǐng)域的研究則從本體角度對(duì)百科條目的收詞、釋義、示例等進(jìn)行了討論。華中師范大學(xué)、西南交通大學(xué)的學(xué)位論文中,百科條目的研究占有較高比例。
圖3 CNKI中“百科條目”研究的學(xué)科分布
圖4 CNKI中“百科條目”研究的文獻(xiàn)來源
在圖5中,排在前面的作者分別是甘蒞豪(華東師范大學(xué))、賈真(西南交通大學(xué))、付巧(陜西師范大學(xué))、尹紅風(fēng)(西南交通大學(xué))、楊宇飛(西南交通大學(xué))、關(guān)泠(解放軍軍事科學(xué)院)和王錦(東北大學(xué))。其中,西南交通大學(xué)的三位作者在“百科條目”主題研究中具有高顯示度。從圖6可以看出,排在前六位的研究機(jī)構(gòu)是中國大百科全書出版社、武漢大學(xué)、西南交通大學(xué)、華中師范大學(xué)、華東師范大學(xué)、蘇州大學(xué)。中國大百科全書出版社的學(xué)者發(fā)文量占到總發(fā)文量的15.74%。
圖5 CNKI“百科條目”研究的作者分布
圖6 CNKI中“百科條目”研究的機(jī)構(gòu)分布
使用CiteSpace進(jìn)行關(guān)鍵詞聚類研究(結(jié)果如下圖7),可見與“百科條目”關(guān)聯(lián)度最大的是維基百科,其后是百科全書、百度百科、條目、網(wǎng)絡(luò)百科、眾源方式、知識(shí)傳播、知識(shí)庫、檢索系統(tǒng)、知識(shí)獲取、關(guān)系抽取、協(xié)同編輯、數(shù)字社區(qū)等。
圖7 “百科條目”CNKI研究的CiteSpace關(guān)鍵詞聚類
從以上對(duì)中國知網(wǎng)265篇論文的封閉域研究可以發(fā)現(xiàn):(1)“百科條目”是文理兼容的研究領(lǐng)域,體現(xiàn)了定量和定性的特點(diǎn)。定量研究集中在對(duì)“百科條目”的計(jì)算機(jī)處理和統(tǒng)計(jì)分析等方面,定性研究則更多關(guān)注命名實(shí)體、知識(shí)獲取、概念特征分析等方面。(2)在條目翻譯研究方面,發(fā)表了4篇文章,分別討論了外國文學(xué)條目的翻譯[25]、埃博拉病毒條目的漢譯[26]、機(jī)械條目的中日翻譯與傳播[27]、百科全書條目的翻譯策略[28]。大數(shù)據(jù)百科條目多語種外譯的研究鮮有學(xué)者涉及。(3)在整個(gè)“百科條目”研究封閉域中,尚沒有對(duì)大數(shù)據(jù)相關(guān)條目的研究。
在大數(shù)據(jù)百科條目的多語種翻譯中,漢語是源語,以其為放射原點(diǎn)的特性決定了漢語的錨定屬性;英語是漢語之外與其他語種關(guān)聯(lián)最為緊密的語種,顯著的國際性特征和語系特征也決定了英語的錨定屬性。
條目分類處理可提高多語種翻譯的效率。多語種團(tuán)隊(duì)需要全面了解漢語詞條釋義,并參照條目分類進(jìn)行各語種的預(yù)處理。漢語分析和英語翻譯,對(duì)其他語種翻譯有指導(dǎo)性作用。大數(shù)據(jù)百科條目具有詞源的差異性,不同類別的條目應(yīng)采用不同的翻譯模式。我們將條目分為3類,并通過特殊字符標(biāo)識(shí)進(jìn)行區(qū)分,以便在6個(gè)語種的平行翻譯中達(dá)到最大限度的對(duì)應(yīng)。在實(shí)踐中,這種大數(shù)據(jù)百科條目的范疇化為多語種翻譯提供了便利。
2.1.1 一級(jí)標(biāo)記
一級(jí)標(biāo)記“*”為專有名詞符號(hào)。大數(shù)據(jù)百科條目中的專有名詞在多語種翻譯時(shí)需保持原譯,不進(jìn)行修改。這種星號(hào)標(biāo)記的目的是在多語種平行翻譯時(shí)保持體例的一致性。例如,區(qū)塊鏈(block chain,chane de bloc,цепочка блоков,Cadena de bloques,)。又如,大數(shù)據(jù)百科條目中的書名,在多語種翻譯中就屬于一級(jí)標(biāo)記,其他語種平行翻譯時(shí)需要找到對(duì)等的書名,如《零邊際成本社會(huì)》在英語中的書名是TheZeroMarginalCostSociety,而在俄語中書名是Обществе с нулевыми предельными издержками。其他語種在各自語言中找尋對(duì)應(yīng)的書名,如果有約定俗成的翻譯則直接借來使用,如果沒有實(shí)現(xiàn)各語種的本土化翻譯,則需要進(jìn)行對(duì)應(yīng)翻譯,如法語Société à cot marginal zéro,西班牙語La sociedad de coste marginal cero,阿拉伯語()。除了常規(guī)的專名和書名可認(rèn)定為本系統(tǒng)的專有名詞外,為保證多語種翻譯的一致性,以下兩種情況也認(rèn)定為專有名詞:
2.1.2 二級(jí)標(biāo)記
二級(jí)標(biāo)記“#”為有限翻譯符號(hào)。在大數(shù)據(jù)百科條目中,如果條目構(gòu)件是組合形式的,一部分是確定的翻譯構(gòu)件,而另一部分是不確定的構(gòu)件,為保證翻譯的準(zhǔn)確性,把此類條目進(jìn)行“#”二級(jí)標(biāo)記標(biāo)注,目的是將我們的譯文向人們更為熟悉和可接受的譯文靠攏。
例如,“天使匯”是確定的專有名詞,而“運(yùn)作模式”是相對(duì)而言不確定的構(gòu)件,這樣就形成了二級(jí)標(biāo)記符號(hào)條目。
2.1.3 三級(jí)標(biāo)記
從以上大數(shù)據(jù)百科條目范疇化可以看出,一級(jí)條目是專有名詞,翻譯模式是約定俗成的;二級(jí)條目是有限的約定俗成,翻譯模式通常采用組合模式;三級(jí)條目是一級(jí)和二級(jí)之外的自主翻譯條目,需要綜合考慮頻率、語域、語體等指標(biāo)。
大數(shù)據(jù)百科條目多語種翻譯是系統(tǒng)性的翻譯實(shí)踐。在漢語條目外譯到英語、法語、俄語、西班牙語、阿拉伯語的過程中,我們總結(jié)了“以錨為準(zhǔn)、軸為兩翼;規(guī)范為主、兼顧描寫”的系統(tǒng)性翻譯工作理念,采用了獨(dú)特的多語種翻譯方法。
2.2.1 以錨為準(zhǔn)
翻譯錨的選定至關(guān)重要。術(shù)語的溯源錨應(yīng)該是一個(gè)恒定的知識(shí)庫。由于大數(shù)據(jù)百科條目多具有不同于普通詞匯的知識(shí)集約性,而漢語術(shù)語這種濃縮的膠囊化特征在多語種翻譯時(shí)必須進(jìn)行顯性化,因此,能否找到一個(gè)能將術(shù)語的集約性轉(zhuǎn)變成外顯性且具有權(quán)威穩(wěn)定釋義的知識(shí)庫是成功翻譯的關(guān)鍵。這個(gè)知識(shí)庫應(yīng)具有權(quán)威性、百科性、詳釋性、單一性、國際性、便利性等特征。
(1)權(quán)威性: 知識(shí)庫要具有能使人信服的權(quán)威性地位,讓受眾對(duì)術(shù)語的溯源結(jié)果不產(chǎn)生懷疑,而且知識(shí)庫內(nèi)收錄詞條的準(zhǔn)確性要符合國家標(biāo)準(zhǔn)。
(2)百科性:知識(shí)庫要涵括術(shù)語翻譯過程中所需的天文地理、自然人文、宗教信仰等學(xué)科知識(shí),以便給譯者提供充足的釋義和名詞溯源信息,為準(zhǔn)確有效的翻譯提供知識(shí)保障。
(3)詳釋性:知識(shí)庫應(yīng)對(duì)所收錄的詞條分類闡釋,分類項(xiàng)包括中文名、英文名、術(shù)語起源、術(shù)語命名、術(shù)語歷史、術(shù)語特征等模塊。而且知識(shí)庫提供的術(shù)語條目要達(dá)到一定的規(guī)模。也就是說,知識(shí)庫要實(shí)現(xiàn)質(zhì)和量的雙合。
(4)單一性:知識(shí)庫中對(duì)術(shù)語有明確的指稱,不存在歧義且有清晰的區(qū)分度。單一術(shù)語對(duì)應(yīng)多個(gè)指稱的情況較少出現(xiàn)。這種單一性為術(shù)語的有效傳播提供了可能。
(5)國際性:知識(shí)庫中的術(shù)語最好能提供多語種翻譯,如果無法實(shí)現(xiàn)多語種,至少要有英語對(duì)應(yīng)詞,跨語種模塊的存在體現(xiàn)了知識(shí)庫的國際性。
(6)便利性:知識(shí)庫最好具有網(wǎng)絡(luò)檢索的便利性和可復(fù)制性,這樣可以加快研究的速度和驗(yàn)證審校的效率。
“術(shù)語在線”可作為知識(shí)庫的錨?!靶g(shù)語在線”是全國科學(xué)技術(shù)名詞審定委員會(huì)的術(shù)語查詢平臺(tái),涵括了大量的規(guī)范名詞、名詞對(duì)照、工具書資源等?!翱倲?shù)據(jù)量近百萬條,術(shù)語在線已成為全球中文術(shù)語資源最全、數(shù)據(jù)質(zhì)量最高、功能系統(tǒng)性最強(qiáng)的一站式知識(shí)服務(wù)平臺(tái)?!雹佟靶g(shù)語在線”的學(xué)科覆蓋也很廣泛,自然科學(xué)、人文社會(huì)科學(xué)、工程技術(shù)、醫(yī)學(xué)、生命科學(xué)、軍事等學(xué)科術(shù)語均有涉及。從權(quán)威性來說,“術(shù)語在線”是規(guī)范術(shù)語的“數(shù)據(jù)中心”,具有絕對(duì)的權(quán)威性。從國際性來說,“術(shù)語在線”實(shí)現(xiàn)了盡可能多的中英文對(duì)譯,具有很好的國際性。從便利性來說,“術(shù)語在線”查詢方便,更新速度快,具有熱詞榜、術(shù)語標(biāo)注、新詞征集、微信小程序等網(wǎng)絡(luò)模塊,豐富了查詢內(nèi)容,提高了查詢速度。同時(shí),該平臺(tái)審定的詞條數(shù)量在不斷增加。所以,“術(shù)語在線”是我們確定的最重要的錨。
百科類網(wǎng)站可作為錨的補(bǔ)充。除了“術(shù)語在線”知識(shí)庫之外,百度百科、搜狗百科、互動(dòng)百科、好搜百科、MBA智庫百科、百科在線等網(wǎng)絡(luò)百科可作為翻譯錨的補(bǔ)充。例如,從權(quán)威性來說,百度百科與中國科協(xié)、最高人民法院,全國知名博物館、書法家協(xié)會(huì)、衛(wèi)計(jì)委、藝術(shù)院校、學(xué)術(shù)期刊、全國所有本科和專科院校等進(jìn)行合作,具有較好的權(quán)威性。從百科性來說,百度百科是百度公司推出的一部內(nèi)容開放、自由的網(wǎng)絡(luò)百科全書,涵括了知識(shí)檢索的各個(gè)領(lǐng)域。從詳釋性來說,百度百科收詞量達(dá)到1700萬條,每個(gè)詞條均提供了詳細(xì)的釋義模塊,具有較好的釋義特征。從單一性來說,百度百科提供的英語翻譯多數(shù)情況下符合單義特征,鮮有多義情況出現(xiàn)。從國際性來說,2007年4月19日,百度百科詞條頁面改版,在詞條頁面的底部增加了漢英詞典解釋,為百科詞條的國際性傳播鋪平了道路。從便利性來說,百度百科依托百度搜索引擎,具有網(wǎng)絡(luò)檢索的便利性。所以,百度百科適合作為“術(shù)語在線”翻譯錨的補(bǔ)充。
以上分析可以看出,國務(wù)院授權(quán)、代表國家審定和公布科技名詞的權(quán)威性機(jī)構(gòu)推出的“術(shù)語在線”適合作為大數(shù)據(jù)百科條目多語種翻譯的錨,百度百科等百科類網(wǎng)站可對(duì)其進(jìn)行補(bǔ)充。
2.2.2 軸為兩翼
大數(shù)據(jù)百科條目的多語種翻譯需要確定漢語為第一標(biāo)準(zhǔn)軸。我們的研究是漢外翻譯,即將漢語內(nèi)容對(duì)應(yīng)翻譯為英語、法語、俄語、西班牙語和阿拉伯語。原始的大數(shù)據(jù)名詞也是通過漢語的形式提供的。這就要求譯者對(duì)漢語的語言體系和特征有較為深入的了解,同時(shí)對(duì)漢語的文字系統(tǒng)和語義具有較為敏銳的分析能力。譯者必須在漢語使用方面沒有障礙,對(duì)漢語的理解保持順暢性。因此,邀請(qǐng)的外國專家都是在國內(nèi)專家的引領(lǐng)下進(jìn)行多語種翻譯的,國內(nèi)專家要保持與外國專家的有效溝通,這樣翻譯出來的名詞才能更好地實(shí)現(xiàn)“信達(dá)雅”的初衷。
例如,“脫貧攻堅(jiān)”是漢語獨(dú)有的詞條,也只有母語是漢語的專家才能明白這個(gè)詞的意義。在對(duì)“《脫貧攻堅(jiān)大數(shù)據(jù)平臺(tái)建設(shè)實(shí)施方案》(廣西)”的翻譯過程中,每個(gè)語種團(tuán)隊(duì)都需要對(duì)詞條進(jìn)行切分,形成翻譯模塊,即形成“脫貧攻堅(jiān)”“大數(shù)據(jù)”“平臺(tái)建設(shè)”“實(shí)施方案”等關(guān)鍵詞?!懊撠毠?jiān)”有明確的英語翻譯。在《中國日?qǐng)?bào)》(ChinaDaily)中“脫貧攻堅(jiān)”作為一個(gè)統(tǒng)一的語義模塊,翻譯為“poverty alleviation”,準(zhǔn)確表達(dá)了“脫貧攻堅(jiān)”的漢語語義,所以,我們?cè)诤罄m(xù)的術(shù)語翻譯中以此為準(zhǔn)。
從圖8可以看出,“脫貧攻堅(jiān)”在2016年之前搜索量接近零,從2016年5月某個(gè)時(shí)點(diǎn)開始不斷攀升,目前達(dá)到了搜索指數(shù)的高位。說明該名詞的使用不斷得到群體認(rèn)可。因此,處理此類名詞時(shí),要找到具有規(guī)范表達(dá)的權(quán)威機(jī)構(gòu)的翻譯用法(采用的是ChinaDaily的權(quán)威翻譯),避免出現(xiàn)杜撰和強(qiáng)譯。
圖8 “脫貧攻堅(jiān)”的百度搜索指數(shù)
“《脫貧攻堅(jiān)大數(shù)據(jù)平臺(tái)建設(shè)實(shí)施方案》(廣西)”的名詞翻譯還需要處理好其他模塊的翻譯。“大數(shù)據(jù)平臺(tái)建設(shè)”多采用名詞“construction of big data platform”,“實(shí)施方案”譯為“implementation program”。經(jīng)過漢語語義分析,可知核心成分“實(shí)施方案”需要在英譯時(shí)提前到詞首,后續(xù)的關(guān)鍵詞需要通過不同的介詞進(jìn)行引領(lǐng)。這樣,“《脫貧攻堅(jiān)大數(shù)據(jù)平臺(tái)建設(shè)實(shí)施方案》(廣西)”可英譯為“ImplementationProgramforConstructionofBigDataPlatformforPovertyAlleviation(Guangxi) ”,其他語種對(duì)應(yīng)性翻譯為:
法語:Programmed’implémentationpourlaconstructiond’uneplate-formedeBigDatavisantà éradiquerlapauvreté (Guangxi)。
西班牙語:Programa de Implementación para la Construcción de la Plataforma de Macrodatos para el Alivio de la Pobreza (Guangxi)。
在漢語作為第一標(biāo)準(zhǔn)軸外,多語種翻譯標(biāo)準(zhǔn)軸的另一翼為英語。作為聯(lián)合國工作語言之一,英語在國際交流中充當(dāng)了非常重要的角色。英語不僅與歐洲的法語、西班牙語具有語系親緣關(guān)系,而且與俄語和阿拉伯語有著較為密切的語言接觸。這種全景式的語言特點(diǎn),決定了英語可以作為漢語之外的第二標(biāo)準(zhǔn)軸。這樣,在法語、俄語、西班牙語、阿拉伯語翻譯時(shí),需要同時(shí)參照漢語和英語這兩個(gè)軸,為多語種翻譯提供更為準(zhǔn)確的參照系。尤其對(duì)源自英語且譯入中國的大數(shù)據(jù)名詞,再次譯出時(shí),需要搜尋原來的英語表達(dá)并搜尋英語對(duì)應(yīng)的其他語種表達(dá),以求得多語種之間的翻譯對(duì)應(yīng)性,減少語際偏差。
為了提高英語翻譯的準(zhǔn)確度,我們?cè)谟⒄Z翻譯中引入回譯制度,并通過國內(nèi)外成熟的翻譯軟件進(jìn)行重復(fù)驗(yàn)證,提高術(shù)語翻譯的可重復(fù)性,減少不同譯者對(duì)詞條翻譯的負(fù)影響。鑒于存在漢英兩個(gè)標(biāo)準(zhǔn)軸,我們選擇國內(nèi)外各兩個(gè)翻譯軟件,以平衡兩個(gè)軸的翻譯結(jié)果。國外選定的翻譯軟件為Google翻譯(https://translate.google.cn)和DeepL翻譯(https://www.deepl.com/translator),國內(nèi)選定的翻譯軟件為百度翻譯(https://fanyi.baidu.com/translate)及有道翻譯(http://fanyi.youdao.com)。如此,具有英語知識(shí)庫背景的國外翻譯軟件與具有漢語知識(shí)庫背景的國內(nèi)翻譯軟件相互結(jié)合,形成較為堅(jiān)實(shí)有效的漢英翻譯標(biāo)準(zhǔn)軸回譯體系,為高質(zhì)量翻譯術(shù)語奠定了基礎(chǔ)。漢語和英語作為標(biāo)準(zhǔn)軸的兩翼,為法語、俄語、西班牙語、阿拉伯語的順利翻譯提供了漢英雙語的結(jié)構(gòu)性和系統(tǒng)性,為其他語種提供借鑒功能和預(yù)處理功能,最大程度地減少了術(shù)語的內(nèi)生歧義,并將語際誤差率控制在較小范圍。
2.2.3 規(guī)范為主
術(shù)語的規(guī)范是科學(xué)技術(shù)發(fā)展所要遵循的基本要求。在科學(xué)研究過程中,術(shù)語的產(chǎn)生過程是隨科學(xué)工作者的認(rèn)知不斷提升而不斷完善的動(dòng)態(tài)過程,這個(gè)過程是符合科學(xué)發(fā)展觀的。術(shù)語規(guī)范是學(xué)術(shù)規(guī)范的重要一環(huán),對(duì)形成和完善良好的學(xué)術(shù)氛圍具有重要意義。
加強(qiáng)規(guī)范,既要貫徹國家相關(guān)語言文字規(guī)范,也要遵從國家的科技術(shù)語規(guī)范[29]。術(shù)語應(yīng)用的時(shí)代特征為我國術(shù)語規(guī)范化工作帶來更多挑戰(zhàn),術(shù)語翻譯規(guī)范化的重要性愈加凸顯。條目的設(shè)定,既要使讀者能正確理解,還要使讀者能正確地運(yùn)用,這是規(guī)范性詞典的兩項(xiàng)重要任務(wù),缺一不可[30-31]。
大數(shù)據(jù)領(lǐng)域的名詞需要進(jìn)行規(guī)范化研究。雖然該領(lǐng)域的術(shù)語多為新興詞匯,但其數(shù)量增長卻是爆發(fā)性的。不同的譯者從不同角度對(duì)大數(shù)據(jù)名詞表達(dá)了不同的觀點(diǎn),這就形成了對(duì)同一事物的不同翻譯模式。這對(duì)術(shù)語的發(fā)展是不利的,容易產(chǎn)生語內(nèi)歧義和語際偏差,也不利于科技健康發(fā)展和相關(guān)術(shù)語的知識(shí)普及。所以,在漢外翻譯大數(shù)據(jù)百科條目時(shí),也需要進(jìn)行規(guī)范性研究。
例如,我們?cè)谙到y(tǒng)中對(duì)“大綱/綱要”的翻譯就進(jìn)行了規(guī)范。從圖9可以看出,“大綱”和“綱要”的搜索量比較接近,“大綱”略高于“綱要”,但尚未達(dá)到區(qū)別特征的程度,這說明兩個(gè)名詞是同義詞。在翻譯處理時(shí),我們既要關(guān)注兩個(gè)名詞的同義特征,也要在譯詞的選擇上保持一定的區(qū)分度。
圖9 “綱要”和“大綱”近10年的百度搜索指數(shù)趨勢(shì)
英語翻譯時(shí)需要盡量區(qū)分“大綱”和“綱要”。通過廣泛的網(wǎng)絡(luò)查詢以及翻譯軟件的對(duì)比分析,我們發(fā)現(xiàn)“大綱”和“綱要”的主流翻譯都是“outline”。這個(gè)結(jié)果與百度搜索指數(shù)提供的搜索量比較接近的描述是一致的。為區(qū)別這兩者,我們把單復(fù)數(shù)形式作為區(qū)別性特征,即“綱要”多側(cè)重不可數(shù)狀態(tài),譯為“outline”單數(shù)模式;“大綱”多強(qiáng)調(diào)可數(shù)狀態(tài),采用“outlines”的復(fù)數(shù)模式。這樣,我們就可以在保留兩者同義關(guān)系的基礎(chǔ)上,通過單復(fù)數(shù)形態(tài)變化對(duì)它們進(jìn)行區(qū)分。
“大綱”和“綱要”的翻譯體現(xiàn)了“如無必要,勿增實(shí)體”的翻譯原則。根據(jù)前面的分析,“《個(gè)人數(shù)據(jù)保護(hù)基本法制大綱》”翻譯為“OutlinesofBasicLegalSystemforPersonalDataProtection”?!啊洞龠M(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》”翻譯為“*ActionOutlineonPromotingtheDevelopmentofBigData”。前面的條目沒有約定俗成,所以確定為三級(jí)標(biāo)記,后一個(gè)條目是由相關(guān)部門提供的確切英語翻譯,所以確定為一級(jí)標(biāo)記。這樣,通過采用單復(fù)數(shù)形式區(qū)分“大綱”(outlines)和“綱要”(outline),我們?cè)谙到y(tǒng)內(nèi)對(duì)同義關(guān)鍵詞進(jìn)行了規(guī)范性研究。各語種的語義顆粒度不同,可通過具體分析漢英兩種語言的表述來確定自己的翻譯模式。形成的多語種對(duì)應(yīng)性翻譯如下:
從以上分析可以看出,規(guī)范性研究是術(shù)語研究的主流,這種區(qū)別性的排他研究確保了術(shù)語語義傳遞的非歧義性。
2.2.4 兼顧描寫
大數(shù)據(jù)名詞的漢外翻譯是術(shù)語的跨語言再次命名,具有明顯的語言特征,這一特點(diǎn)也決定了在研究方法上,將無可避免地出現(xiàn)語言的描寫特性。
科學(xué)的研究方法可以產(chǎn)生科學(xué)的研究結(jié)果。研究方法的應(yīng)用水平和綜合程度會(huì)產(chǎn)生不同的研究效果和效能。從某種程度上說,術(shù)語理論的研究很多是依托研究方法展開,堅(jiān)實(shí)有效的研究方法會(huì)推進(jìn)術(shù)語學(xué)的發(fā)展。因此,在對(duì)大數(shù)據(jù)百科條目進(jìn)行漢外翻譯時(shí),需要在關(guān)注“規(guī)范為主”的研究方法同時(shí),也關(guān)注“兼顧描寫”的語言特征,使我們對(duì)大數(shù)據(jù)術(shù)語的描述更加清晰,翻譯更加準(zhǔn)確,邏輯分析更加嚴(yán)密,最終讓術(shù)語研究的內(nèi)容更廣泛,研究視角更新穎,研究思想更有深度。
術(shù)語翻譯的描寫特性通常是對(duì)約定俗成的語言特例的尊重。這種描寫性研究方法是對(duì)現(xiàn)有語言現(xiàn)象的描述和敘述,具有從語言特例中解釋語言共時(shí)和歷時(shí)變化的特點(diǎn),能更好地為語言系統(tǒng)服務(wù)。
綜上分析可以看出,研究方法的創(chuàng)新與否及創(chuàng)新綜合程度高低,都會(huì)影響研究的效果、效率和效能。我們提出的“以錨為準(zhǔn)、軸為兩翼;規(guī)范為主、兼顧描寫”的翻譯理念和方法,是大數(shù)據(jù)百科條目漢外翻譯的一種創(chuàng)新。這種方法既關(guān)注了釋義錨的選定,也關(guān)注了標(biāo)準(zhǔn)軸的規(guī)劃;既強(qiáng)調(diào)了術(shù)語規(guī)范的重要性,也強(qiáng)調(diào)了規(guī)范之外描寫特性的合理性。從對(duì)“以錨為準(zhǔn)、軸為兩翼;規(guī)范為主、兼顧描寫”研究方法的分析可知:術(shù)語研究是兼跨自然科學(xué)和人文科學(xué)的研究;充分釋義是準(zhǔn)確翻譯的前提;漢英雙軸對(duì)應(yīng)可避免語際偏差。在術(shù)語單義性的主流規(guī)范模式之下,我們也難以避免語言描寫特性的存在。期待這種研究方法能夠推動(dòng)大數(shù)據(jù)領(lǐng)域的發(fā)展,為科技進(jìn)步和學(xué)術(shù)規(guī)范做出貢獻(xiàn)。
翻譯錨、大數(shù)據(jù)百科條目、多語種翻譯均存在提升的空間。(1)“術(shù)語在線”(及補(bǔ)充信息的百度百科等)作為我們多語種翻譯的錨具有溯源清晰、知識(shí)豐富、英語自附等特點(diǎn),很好地實(shí)現(xiàn)了翻譯錨所需的權(quán)威性、百科性、詳釋性、單一性、國際性和便利性。但是,翻譯錨隨著新知識(shí)的涌入還有提升的空間。(2)在大數(shù)據(jù)百科條目的遴選中,大數(shù)據(jù)百科條目由于源自新興領(lǐng)域,條目的數(shù)量與傳統(tǒng)研究領(lǐng)域的條目相比還處于弱勢(shì)階段,后續(xù)還需要深化對(duì)大數(shù)據(jù)領(lǐng)域的研究,編寫和審定更多的大數(shù)據(jù)百科條目[32]。(3)因?yàn)楦髡Z種間語義顆粒度的大小不均,6個(gè)語種的平行翻譯會(huì)出現(xiàn)語義不對(duì)等的情況。例如,“中華人民共和國國家互聯(lián)網(wǎng)信息辦公室”作為專有名詞,約定俗成翻譯為“*Cyberspace Administration of China”,這種既定模式的漢英對(duì)應(yīng)有時(shí)本身就是不對(duì)稱的,但已經(jīng)約定俗成。這種語義顆粒度不均勻?qū)е碌亩嗾Z種翻譯的不對(duì)稱問題為后續(xù)提高條目的多語種翻譯質(zhì)量預(yù)留了空間。
大數(shù)據(jù)百科條目多語種翻譯是對(duì)大數(shù)據(jù)新興領(lǐng)域的研究。大數(shù)據(jù)研究被稱為繼蒸汽技術(shù)革命、電力技術(shù)革命和信息技術(shù)革命之后的第四次革命。在大數(shù)據(jù)百科條目聯(lián)合國工作語言的多語種翻譯中,我們形成了獨(dú)有的工作理念和方法。
首先,大數(shù)據(jù)百科條目具有范疇化特征。約定俗成的漢語專有名詞條目可作為一級(jí)標(biāo)記條目(*標(biāo)注),提示我們?cè)诙嗾Z種翻譯時(shí)關(guān)注其約定俗成的特性。同時(shí)具有約定俗成和組合構(gòu)件特點(diǎn)的條目可作為二級(jí)標(biāo)記條目(#標(biāo)注),提示我們?cè)诙嗾Z種平行翻譯時(shí)聚焦條目的組合性。其他類條目為三級(jí)標(biāo)記條目(默認(rèn)無標(biāo)注),此為團(tuán)隊(duì)的創(chuàng)新性翻譯。
其次,大數(shù)據(jù)百科條目翻譯具有系統(tǒng)性。“以錨為準(zhǔn)、軸為兩翼、規(guī)范為主、兼顧描寫”是我們?cè)诖髷?shù)據(jù)百科條目多語種翻譯中總結(jié)形成的工作理念和方法?!耙藻^為準(zhǔn)”指作為新興領(lǐng)域的大數(shù)據(jù)研究,其百科條目的翻譯首先要確定權(quán)威的知識(shí)庫作為翻譯錨,全國科學(xué)技術(shù)名詞審定委員會(huì)推出的“術(shù)語在線”適合作為翻譯錨,百度百科等百科類知識(shí)庫適合作為翻譯錨的補(bǔ)充。“軸為兩翼”指在多語種翻譯中,漢語因其源語特點(diǎn)適合作為第一標(biāo)準(zhǔn)軸,英語因其國際性特點(diǎn)適合作為第二標(biāo)準(zhǔn)軸,其他語種平行翻譯時(shí)將參照漢英標(biāo)準(zhǔn)軸進(jìn)行翻譯?!耙?guī)范為主”指大數(shù)據(jù)百科條目多語種翻譯時(shí),要強(qiáng)調(diào)規(guī)范的重要性,以國際標(biāo)準(zhǔn)、國家標(biāo)準(zhǔn)、部委標(biāo)準(zhǔn)、省市標(biāo)準(zhǔn)等規(guī)范為主,相關(guān)條目需要遵守規(guī)范?!凹骖櫭鑼憽敝刚Z言的描寫特性及語際的語義顆粒度不均衡等原因會(huì)影響多語種翻譯理想狀態(tài)的實(shí)現(xiàn),各語種在平行翻譯過程中存在一定的語言描寫空間。
由于我們團(tuán)隊(duì)的大數(shù)據(jù)百科條目多語種翻譯涉及英語、法語、俄語、西班牙語、阿拉伯語等聯(lián)合國工作語言,譯者的翻譯素養(yǎng)和大數(shù)據(jù)素養(yǎng)難以保持一致,一定程度上制約了多語種翻譯的質(zhì)量。而且,新興大數(shù)據(jù)百科條目的語言認(rèn)知還在發(fā)展中,命名規(guī)則的不斷調(diào)整、語言共同體的深度認(rèn)可以及社會(huì)約定的深入變化都可能帶來大數(shù)據(jù)百科條目多語種翻譯結(jié)果的變化。所以,我們的研究更多是“拋磚引玉”,希望成為大數(shù)據(jù)研究領(lǐng)域、術(shù)語審定領(lǐng)域、辭書編撰領(lǐng)域和翻譯領(lǐng)域研究的基石,為后續(xù)發(fā)展奠定基礎(chǔ)。
注釋
① https://www.termonline.cn/about
② http://language.chinadaily.com.cn/a/201907/04/WS5d1d4f5ca3105895c2e7b94f.html