国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

科技新詞工作實踐探索

2013-12-27 05:23
中國科技術語 2013年6期
關鍵詞:名詞委詞條新詞

張 暉

(全國科學技術名詞審定委員會,北京 100717)

一 科技新詞工作的地位和意義

科技新詞工作是科技名詞審定工作的重要補充??萍济~審定工作是全國科技名詞委的核心業(yè)務內(nèi)容。常態(tài)的名詞審定工作以各學科委員會專家委員為主體,遵照全國科技名詞委制定的《科學技術名詞審定原則與方法》(以下簡稱《原則》)進行,最終的成果以出版《××學科名詞》的形式向社會公布。每部學科名詞在一定周期內(nèi)啟動修訂,并以再版形式向社會公布??萍夹略~工作的最初設想源于希望解決學科名詞書修訂周期長,不能達到及時規(guī)范新出現(xiàn)的、重要的科技名詞的目的。針對科學技術界新出現(xiàn)的新理論、新方法等開展的靈活多樣的新詞收集工作,可以在一定程度上解決上述問題。

科技新詞工作是與社會形成良性互動的重要渠道??萍夹略~的出現(xiàn)源于科技的發(fā)展,這符合詞語產(chǎn)生的自然規(guī)律??萍济~與科技概念一一對應,也符合語言規(guī)范性的特點。但有些刻意制造的、張冠李戴的科技名詞出現(xiàn)在某些領域,尤其是市場經(jīng)濟領域,就嚴重偏離了詞語產(chǎn)生的自然規(guī)律。諸如,有廠商把一只質(zhì)量低劣的杯子冠以“納米”二字,冒充高科技的納米杯;服務商宣稱的“高速網(wǎng)絡”慢似蝸牛,只因宣傳時偷換了“byte”(字節(jié))和“bit”(位)的概念;有點維生素成分就言必稱“富含營養(yǎng)因子、維他命”等,用不規(guī)范詞語偷換科技概念,誤導消費者。如果說語言工作者肩負一定的社會責任,那么倡導使用科學規(guī)范的科技語言無疑是其中重要的一部分。及時開展科技新詞的定名和普及,有利于規(guī)范科技交流,喚醒公眾的科技意識,維護自身利益。

科技新詞工作可以成為科技名詞審定新理論和新方法的試驗田??萍济~審定工作正探索運用語料庫等自然語言處理技術,實現(xiàn)自動抽取和專家推薦相結合的工作形式。一方面,參考語料庫(reference corpus)對自然語言處理技術起到支撐性作用。全國科技名詞委已經(jīng)公布的幾十萬條規(guī)范科技名詞數(shù)據(jù)可以成為可靠的參考語料庫核心資源。另一方面,從目前來看,傳統(tǒng)的科技名詞審定工作方式對維護詞條的權威性和規(guī)范性具有不可替代的作用,大規(guī)模運用新技術去完全替代原有方式,需要比較長時間的探索和積累,才能確保效果。因此,從工作基礎和技術可行性兩個角度來考慮,科技新詞工作可以達到先試先行的效果。

二 全國科學技術名詞審定委員會的新詞工作實踐

1.與學科名詞審定同步的新詞工作實踐

全國科技名詞委歷來很重視科技新詞的收集和定名。各學科名詞審定分委員會每間隔一定周期所進行的學科名詞修訂再版,是實現(xiàn)新詞收集的主要途徑。此外,還注意創(chuàng)新收詞手段與發(fā)布機制,收效顯著。

從收詞手段來看,除了大部分學科采用的專家人工收集方式以外,天文學名詞委還綜合利用了包括數(shù)據(jù)庫、郵件列表、維基技術在內(nèi)的一系列技術手段開展科技新詞工作[1],信息科技、管理科技等學科還運用了語料庫等技術手段,收集整理新詞。

從發(fā)布機制來看,除了常態(tài)的名詞書出版公布方式以外,各學科也探索了更多途徑的新詞發(fā)布機制。全國科技名詞委主辦的《中國科技術語》期刊是各學科發(fā)布試用新名詞的重要陣地,其先后發(fā)布了10余批天文學新詞[1]、3批信息科技新詞①、3批地球物理學新詞②、2批生命科學新詞③、1批物理學新詞④等,還公布了101~112、114、116號元素的中文正式定名⑤。除此以外,《物理》《天文學進展》等雜志、“天文學名詞”等網(wǎng)站,也發(fā)布了大量經(jīng)相關學科名詞委審定的新詞。以上絕大部分工作成果都已陸續(xù)被相關學科名詞書最終收錄。

2.新詞工作委員會的新詞工作實踐

2009年,全國科技名詞委成立了新詞工作委員會,發(fā)布了《關于開展科技新詞工作的意見》(以下簡稱《意見》)。《意見》明確了科技新詞工作委員會的組織形式和工作任務、基本原則與工作程序[2]。根據(jù)設想,科技新詞工作委員會委員每年向全國科技名詞委提交擬發(fā)布試用的各學科科技新詞。全國科技名詞委負責建立科技新詞數(shù)據(jù)庫,按年度出版《××年科學技術新詞》,或通過網(wǎng)站向社會發(fā)布試用。2009年、2010年,全國科技名詞委先后向各學科新詞工作專家征集新詞,計劃整理后對外發(fā)布試用。從實際效果來看,除全國科技名詞委網(wǎng)站“新詞征集”欄目收到少量詞條以外,絕大多數(shù)學科的專家收詞工作未能取得進展,與初期規(guī)劃差距較大。

依靠新詞工作委員會專家收詞的方式為何會遭遇瓶頸?究其原因,有專家認為,科技新詞工作委員會“一個專家聯(lián)系一個分委員會”的組織形式很難確保新詞工作深入到各學科專家的日常審定工作業(yè)務中,各學科的新詞委員受限于其自身專長而無法代表一級學科專家推薦科技新詞;也有專家提出,學科基本詞、基礎詞并不會大量出現(xiàn),3~5年一次的學科名詞修訂工作實質(zhì)上就收選了不少新名詞;還有專家提出,應該加強對專家委員的激勵和要求,設立秘書機構,確保按計劃進行。目前,雖然這種收詞形式效果不佳,但仍一直在堅持進行。

3.自動抽取與專家推薦相結合的新詞工作實踐

2011年,為了繼續(xù)推動科技新詞工作取得進展,全國科技名詞委決定嘗試運用自動抽取與專家推薦相結合的機制開展新詞工作,分自動抽取、人工干預、專家推薦三個階段進行。自動抽取是指運用自然語言處理技術,從科技語料中根據(jù)規(guī)則、統(tǒng)計等方法抽取備選的新詞語;人工干預是指通過多輪人工干預,減少備選新詞語的數(shù)量,提高質(zhì)量;專家推薦是指由相關學科專家以推薦的形式選出候選新詞。

2012年開始的試點工作以部分基礎學科為對象,在自動抽取階段,與中國知網(wǎng)展開技術合作,通過技術手段,從中國知網(wǎng)數(shù)據(jù)庫抽取相關學科備選詞。在人工干預階段,主要淘汰學科屬性有誤的名詞、簡單復合詞、來源不可靠的名詞。在專家推薦階段,分預審、函審、會商、確定等階段進行。

三 自動抽取與專家推薦相結合的新詞工作試點的幾點啟示

在自動抽取與專家推薦相結合開展的新詞工作試點中,有兩次會議的研討成果值得關注。在2012年底召開的全國科技名詞委新詞試點學科編輯座談會上,結合部分學科預審的實際情況,經(jīng)過會議討論,決定將工作目標由收集傳統(tǒng)意義上的“新詞”調(diào)整為“有價值的詞條”,包括“有發(fā)布試用價值的新詞”和“其他有審定公布價值的科技名詞”兩部分。“有發(fā)布試用價值的科技新詞”,即代表新概念的名詞,包括新理論、新物質(zhì)、新材料、新技術、新工藝、新方法、新儀器和裝置等。這類詞出現(xiàn)于21世紀,是傳統(tǒng)意義上的“新詞”,反映了當代科技前沿及進展,有必要盡早加以規(guī)范,及時發(fā)布試用?!捌渌袑彾ü純r值的科技名詞”,即原有審定工作中遺漏的基本名詞。包括本學科概念體系中較基礎的詞,特有的常用詞、重要詞等。這類詞可能不是傳統(tǒng)意義上的新詞,但在構成學科體系時不可或缺,可留供學科名詞修訂再版時參考。

在2013年召開的新詞試點工作專家研討會上,參與新詞推薦的部分專家、負責新詞自動抽取的工作人員,以及語言文字專家、各學科審定編輯共同對試點工作,尤其是在審稿過程中發(fā)現(xiàn)的全局性問題進行了研討。大多數(shù)專家對這種嘗試感興趣,但是對新詞的產(chǎn)出率不太滿意。專家提出的問題主要包括:第一類意見,認為語料的選擇存在問題。有專家認為,從關鍵詞、標題選詞范圍過窄,很難產(chǎn)出新詞;也有專家認為中國知網(wǎng)收選的文獻以中文文獻為主,而科技前沿往往在國外,應嘗試以英文文獻為資源。第二類意見,認為專家審稿過程中對新詞的界定不統(tǒng)一。有的專家按照“未審定公布且有價值”為標準,有專家按照“新出現(xiàn)且有價值”的標準,以至于不同專家推薦標準參差不齊,部分學科還存在評判標準的交叉和混淆。第三類意見,認為現(xiàn)有的一級學科跨度較大,審稿專家往往在更加細化的專業(yè)領域內(nèi)才能發(fā)表意見,不同的分支學科之間都很難明確詞條價值,應該按照不同的二三級分支學科單獨審稿。第四類意見,認為應該嘗試新的抽取機制,如特征標引等,以增強自動抽取工作的質(zhì)量。第五類意見,提出審稿專家的選擇應該更有針對性,比如考慮年齡、外文水平、對新詞的敏感性等諸多方面,部分學科還存在專家參與度不高,積極性不足的問題。

綜合上述意見,從試點工作的實際成效來看,可以總結以下幾點經(jīng)驗教訓:

1.新詞的標準問題

新詞的標準問題是在開展新詞工作時最常被討論的問題。實踐中,一般有兩種觀點:一種認為,新詞就是剛出現(xiàn)的詞;另一種認為,新詞是現(xiàn)有審定公布的名詞庫中沒有的詞。從理論上來講,兩者實際都在強調(diào)詞條在某一時點所表現(xiàn)的價值,即時點價值,要么某個詞條在某一時點后才出現(xiàn),要么在某一時點才被納入審定工作視野。顯然,科技新詞如果僅僅以時點價值作為衡量科技新詞工作的唯一價值支撐,恐怕遠遠不夠,更需要重視詞條的“時段價值”。時段價值展示了一個詞條在出現(xiàn)后呈現(xiàn)什么樣的發(fā)展趨勢,是越來越多地被繼續(xù)使用,還是明顯具有社會關注效應,抑或是逐漸退出了歷史舞臺。經(jīng)過對詞條時點價值和時段價值的共同考察,才有可能形成相對全面的詞條定位。在科技新詞試點實踐中,新詞標準也的確經(jīng)歷了從初期籠而統(tǒng)之地強調(diào)“新”,到試點過程中同時強調(diào)詞條本身的“價值”,也恰恰印證了這一點。

與此同時,科技新詞工作作為科技名詞規(guī)范化工作的一部分,其最終目的還在于“規(guī)范”,即為同一個科學概念確定一個科學的中文定名,避免因一物多名造成科技交流不暢。因此,在科技名詞規(guī)范視野下來討論科技新詞的標準,有必要引入“規(guī)范價值”標準。通俗來講,應重點關注新概念定名混亂、直接使用字母詞、對相同概念采用多個不規(guī)范表達等現(xiàn)象,對有關新詞及時定名。這樣的工作具有良好的示范作用,如2013年全國科技名詞委組織的PM2.5定名工作。

在實踐中,某個詞條往往難以全部滿足“時點價值”“時段價值”和“規(guī)范價值”三個標準,因而在選詞實踐中存在幾個標準的優(yōu)先級問題。在常態(tài)的科技名詞審定工作中,首先是強調(diào)規(guī)范價值,對應《原則》中的“一個科學概念,確定一個中文名”;其次是時段價值,對應《原則》中“收選學科的基本詞、重要詞”的規(guī)定;再次是時點價值,如在修訂過程中,往往新增的詞條是近來出現(xiàn)的重要詞,刪減的是被淘汰的詞條,修訂的是那些被證實定名有誤的詞條。而就科技新詞工作而言,筆者認為三個標準的優(yōu)先級有所不同,從高到低應該是:時點價值、規(guī)范價值、時段價值。即首先是從新出現(xiàn)的術語中進行初選,然后考察其使用情況,對于使用混亂的,特別是已經(jīng)進入大眾生活領域的術語要優(yōu)先規(guī)范,而對可能兼具時段價值的術語重點規(guī)范。雖然這三個標準并非缺一不可,但是明確這樣的標準,對于在實踐層面把握科技新詞的取舍具有指導意義。

2.新詞的語料來源

新詞語料的選擇直接決定了新詞的來源。新詞語料一般是各類正式科技出版物,這是由于科技新詞從科技領域進入語言研究領域,呈現(xiàn)于固定的載體。通常,載體的權威性越突出,其可信度越高。首先,按載體劃分,可分為專著語料、期刊語料、報紙語料等。以專著、期刊、報紙三者為例,不同的語料載體受出版周期的影響,所關注的科技新詞的時點價值逐步升高,而時段價值依次降低。其次,按語種劃分,可分為母語語料和外文語料。決定可信度的指標,是在研究中占據(jù)主導的語言種類。通俗的說,一國的科技實力決定科技語言的話語權。目前在大多數(shù)領域,英文語料仍然是主體。再次,按性質(zhì)劃分,可分為確定語料和非確定語料。前者,如新詞詞典、關鍵詞表、文后術語表等;后者,如標題、正文、參考文獻等。不同性質(zhì)的語料對新詞抽取工作量的影響較大,但是毋庸諱言,確定語料時點價值偏弱,可能無法滿足新詞工作的具體需求。

3.收詞方式的選擇

科技新詞的收詞方式可分為人工收詞與自動抽取兩種。人工收詞的優(yōu)點在于準確性高,二次加工簡單,缺點在于人工成本投入大,時效性不強,對實施者自身科技素養(yǎng)的要求比較高。而自動抽取則恰恰相反。目前比較可行的辦法是兩者并舉。自動抽取的程度直接決定了人工審核的難易程度,實踐中往往需要通過不斷改進自動抽取技術來降低人工審核的工作量??萍夹略~試點工作的實踐,讓筆者體會最深的就是切忌理論研究和實踐需要兩張皮。成功的實踐要以良好的理論作為指導,而有效的實踐才能發(fā)現(xiàn)理論的漏洞和不足。因此,最有效的做法是規(guī)劃者全程指導和參與自動抽取工作,邊研究邊實踐,注重普遍性和特殊性相結合,及時發(fā)現(xiàn)問題,優(yōu)化方法。

4.人工干預的必要性和實施策略

目前,囿于自動抽取技術在語義判別上的局限,往往從自動抽取環(huán)節(jié)進入人工干預環(huán)節(jié)的詞條數(shù)量可觀,為了減小專家審詞量,人工干預顯得必不可少。從科技新詞試點工作實踐來看,教育背景不同的人員往往對科技新詞的敏感程度有很大的不同,所以對自動抽取的詞條采取分級篩選,是比較有效的方式。

從科技新詞試點來看,進入專家審詞的詞條數(shù)量不能太大,大學科門類、詞條版(不含釋義)的詞條數(shù)不宜超過2000條。小學科門類、詞條版不應超過200條。如果是釋義版,100條以內(nèi)為佳。如果條件允許,團隊式的人工干預模式是最有效的。

5.審詞專家的選擇

審詞專家的選擇對確保詞條質(zhì)量的重要性不言而喻。在選擇審詞專家時,專家的時間、精力、學術水平、英文水平、年齡和對新詞的敏感度都是重要的考慮因素。與此同時,還要考慮專家的背景,注重吸收部分中青年專家、海外留學歸國人員、科研院所一線工作人員等。此外,因為學科劃分越來越細,且彼此交叉,所以必要時甚至需要針對個別詞條有針對性尋找合適的審詞專家。

6.工作周期的確定

分批次發(fā)布新詞是目前比較常見的發(fā)布形式。有定期的,如語委組織發(fā)布的年度新詞語;也有不定期的,如天文學名詞審定委員會在《中國科技術語》期刊陸續(xù)發(fā)布的十多批天文學新名詞。公布周期的選擇直接決定了新詞工作周期的選擇,需要綜合考慮實際需要和可操作性兩個方面。實際需要是指有沒有迫切需要向社會公布的名詞,可操作性是指新詞工作的人、財、物保障??傮w而言,無論采用多長周期,都應該保持適當?shù)倪B續(xù)性。多年的堅持和積累才能把新詞工作引向深入。

最后,筆者認為,科技新詞工作實踐證明,有必要進一步強化新詞的理論研究和操作層面的研究。從宏觀層面,研究內(nèi)容應該包括:及時規(guī)范新詞的可行性研究、規(guī)范視角下的新詞選詞標準研究、分學科語料的權威性研究、新詞自動選詞規(guī)則的共性研究、新詞抽取統(tǒng)計路徑的共性研究、創(chuàng)新科技新詞發(fā)布機制研究。從微觀層面,新詞生命力研究、字母詞的研究、新詞特征標引的研究都是實踐所迫切需要的。

新詞工作開展不易,筆者呼吁在不同行業(yè)或領域從事新詞相關工作的學者,能在語料、技術、經(jīng)驗等方面相互借鑒、有效溝通、共同培育,減少重復勞動和資源浪費,讓新詞理論工作深深扎根實踐的土壤。

注 釋

①分別刊載于《科技術語研究》1998年第1期、1999年第1期和2001年第3期。

②分別刊載于《科技術語研究》2000年第2期、2001年第2期和2001年第4期。

③分別刊載于《科技術語研究》1998年第1期、1999年第1期。

④刊載于《科技術語研究》1999年第4期。

⑤101~109號元素定名刊載于《科技術語研究》1998年第1期;110號元素定名刊載于《科技術語研究》2003年第3期;111號元素定名刊載于《科技術語研究》2006年第1期;112號元素定名刊載于《中國科技術語》2011年第5期;114號、116號元素定名刊載于《中國科技術語》2013年第5期。

參 考 文 獻

[1]崔辰州. 充分利用現(xiàn)代信息技術開展科技名詞工作[J]. 中國科技術語,2010(3):19-21.

[2]才磊. 科技新詞工作初探[J]. 中國科技術語,2008(2):49-51.

猜你喜歡
名詞委詞條新詞
《微群新詞》選刊之十四
2016年4月中國直銷網(wǎng)絡熱門詞條榜
2016年3月中國直銷網(wǎng)絡熱門詞條榜
2016年9月中國直銷網(wǎng)絡熱門詞條榜
大數(shù)據(jù)相關詞條
小議網(wǎng)絡新詞“周邊”
外教新詞堂
當代新詞“微X”詞族的多維考察
漠河县| 沙坪坝区| 盱眙县| 肥西县| 长丰县| 西宁市| 揭阳市| 酒泉市| 靖安县| 正阳县| 周至县| 安徽省| 沾化县| 光山县| 临沂市| 乐陵市| 长垣县| 乳山市| 七台河市| 龙岩市| 巴彦县| 南木林县| 柳州市| 清流县| 清水河县| 噶尔县| 启东市| 阳曲县| 岳普湖县| 南川市| 鄂尔多斯市| 格尔木市| 定安县| 恭城| 瑞昌市| 施甸县| 子长县| 玛多县| 吴旗县| 成都市| 铜鼓县|