国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

一體化醫(yī)學(xué)語言系統(tǒng)及其對我國的借鑒作用

2010-01-04 01:41朱彥慧騰吉斯
中國科技術(shù)語 2010年4期
關(guān)鍵詞:詞表術(shù)語詞典

朱彥慧 騰吉斯

(全國科學(xué)技術(shù)名詞審定委員會,北京 100717)

一體化醫(yī)學(xué)語言系統(tǒng)及其對我國的借鑒作用

朱彥慧 騰吉斯

(全國科學(xué)技術(shù)名詞審定委員會,北京 100717)

由美國國立衛(wèi)生院開發(fā)創(chuàng)立的一體化醫(yī)學(xué)語言系統(tǒng)已成為世界上最全面的醫(yī)學(xué)術(shù)語系統(tǒng),它包括四個組成部分:元敘詞表、語義網(wǎng)絡(luò)、專家詞典與相關(guān)詞典項(xiàng)目、支持性軟件工具,并擁有 17個語言版本。一體化醫(yī)學(xué)語言系統(tǒng)不僅為全球使用者搜索文獻(xiàn)提供便捷,也為我國電子病歷的實(shí)施提供術(shù)語學(xué)基礎(chǔ)。

一體化醫(yī)學(xué)語言系統(tǒng),術(shù)語,電子病歷

在當(dāng)前眾多的術(shù)語數(shù)據(jù)庫中,一體化醫(yī)學(xué)語言系統(tǒng) (the Unified Medical Language System,UMLS)以收詞量大、涵蓋面廣、語言版本多而備受矚目。由美國國立衛(wèi)生院開發(fā)以來,該系統(tǒng)在使用英語及其他歐洲語言的國家中使用率甚高。本文簡要介紹一體化醫(yī)學(xué)語言系統(tǒng)的歷史沿革、組成、應(yīng)用,以及對我國術(shù)語學(xué)和生物信息學(xué)發(fā)展的借鑒作用。

一 歷史沿革

當(dāng)今世界,信息技術(shù)的迅猛發(fā)展和信息傳播的便捷極大提升了知識傳播的速度和數(shù)量,這使得現(xiàn)代醫(yī)學(xué)在發(fā)展過程中產(chǎn)生了大量的生物醫(yī)學(xué)文獻(xiàn)。然而,很多文獻(xiàn)在對同一概念的描述中經(jīng)常使用不同的名稱,給研究者在理解與區(qū)分方面帶來了不同程度的困難。為解決此類問題,早在 1986年,具有計算機(jī)專業(yè)知識背景的醫(yī)學(xué)博士唐納德·林德伯格(Donald Lindberg)就慧眼獨(dú)具,著手研發(fā)一體化醫(yī)學(xué)語言系統(tǒng)[1-2],并被美國國立衛(wèi)生院國家醫(yī)學(xué)圖書館納入。一體化醫(yī)學(xué)語言系統(tǒng)是醫(yī)生、生物信息專家、圖書管理人員、計算機(jī)專家和語言學(xué)家合作研發(fā)的數(shù)據(jù)庫系統(tǒng),目的是通過發(fā)展計算機(jī)語言系統(tǒng),對醫(yī)學(xué)術(shù)語和詞典進(jìn)行整合,以達(dá)到信息整合的目的,從而克服兩個障礙:“一是不同機(jī)讀資源和不同人群對同一概念表達(dá)的差異,二是信息在網(wǎng)絡(luò)中的不同數(shù)據(jù)庫之間傳播的困難?!盵3]

一體化醫(yī)學(xué)語言系統(tǒng)的研發(fā)歷經(jīng)三個階段:1986—1988年,調(diào)查用戶需求,界定了一體化醫(yī)學(xué)語言系統(tǒng)的三個組成部分:元敘詞表、語義網(wǎng)絡(luò)及情報源圖譜,并將系統(tǒng)與醫(yī)學(xué)術(shù)語數(shù)據(jù)庫鏈接;1989—1991年,主要研制和發(fā)布了三款一體化醫(yī)學(xué)語言系統(tǒng)產(chǎn)品的測試版本,同時繼續(xù)開展用戶調(diào)查和一體化醫(yī)學(xué)語言系統(tǒng)的功能開發(fā);1992年以后,不斷擴(kuò)大詞匯量和語言版本,以使數(shù)據(jù)庫更加完善,1996年時增加了一個新的組成部分——專家詞典。目前,一體化醫(yī)學(xué)語言系統(tǒng)每年更新兩次,通過網(wǎng)絡(luò)共享和發(fā)行光碟供全球使用者免費(fèi)使用。

二 組成及應(yīng)用

一體化醫(yī)學(xué)語言系統(tǒng)由四個部分組成:元敘詞表、語義網(wǎng)絡(luò)、專家詞典和相關(guān)詞典項(xiàng)目、支持性軟件工具[4]。

1.元敘詞表 (Metathesaurus)

元敘詞表基于多種詞典、分類、編碼以及生物醫(yī)學(xué)文獻(xiàn)、基礎(chǔ)醫(yī)學(xué)、臨床醫(yī)學(xué)文獻(xiàn)中的詞匯,構(gòu)成了一體化醫(yī)學(xué)語言系統(tǒng)的基礎(chǔ),包含 100多萬個生物醫(yī)學(xué)概念和 500多萬個名稱[5]。例如,2009年11月發(fā)布的最新版本的詞匯來源于 100多個詞典和分類系統(tǒng)見 (圖 1),包括國際疾病分類—9 ( ICD—9)、國際疾病分類—10( ICD—10)、醫(yī)學(xué)主題詞表 (MeSH)、臨床醫(yī)學(xué)命名系統(tǒng)(SNOMED—CT)、觀測指標(biāo)標(biāo)識符邏輯命名與編碼系統(tǒng)(LO INC)、世界衛(wèi)生組織不良反應(yīng)術(shù)語集 (WHO—ART)、英國臨床術(shù)語 (UK Clinical Te rms)、臨床藥學(xué)標(biāo)準(zhǔn)術(shù)語(RxNORM)、基因本體(gene ontology)、人類孟德爾遺傳網(wǎng) (OM IM)等[6]。這些詞匯稱為元敘詞表的“源詞匯”,它來源于英語、西班牙語、法語、德語、日語等 17個國家的語言,目前還不包括漢語。

圖 1 一體化醫(yī)學(xué)語言系統(tǒng)組成示意圖

從本質(zhì)上說,元敘詞表對同一概念的不同名稱進(jìn)行關(guān)聯(lián),元敘詞表的一個概念至少被分配到語義網(wǎng)絡(luò)的一個語義類型,它對語義網(wǎng)絡(luò)的所有概念進(jìn)行了分類。元敘詞表中的許多單詞和多個單詞組成的術(shù)語也出現(xiàn)在專家詞典中,該詞典工具可以確定源于元敘詞表的標(biāo)準(zhǔn)化詞匯。

2.語義網(wǎng)絡(luò) (Semantic Network)

語義網(wǎng)絡(luò)對元敘詞表中的每個概念進(jìn)行語義分類,對各個語義類型之間的相互關(guān)系進(jìn)行說明。元敘詞表中的每個概念至少屬于一個語義類型,從不同的語義類型之間可以獲得“語義關(guān)系”,語義類型和語義關(guān)系構(gòu)成了語義網(wǎng)絡(luò)。一體化醫(yī)學(xué)語言系統(tǒng)一共有 135種語義類型和 54種相互關(guān)系。大的語義類型包括:有機(jī)體、解剖結(jié)構(gòu)、生物功能、化學(xué)物質(zhì)、事件、物體、概念等。語義網(wǎng)絡(luò)表明了組群和概念之間的相互關(guān)系 (見圖 2)[7]。

圖 2 語義網(wǎng)絡(luò)組群和概念之間的相互關(guān)系示意圖

3.專家詞典和相關(guān)詞典項(xiàng)目 (SPEC IAL IST lexicon and associate lexicon program)

專家詞典包含了英語術(shù)語的句法信息,用于術(shù)語向元敘詞表的映射,包括普通英語詞典、MEDL INE和一體化醫(yī)學(xué)語言系統(tǒng)中的術(shù)語以及生活醫(yī)學(xué)術(shù)語等。每個詞條包括句法的、形式和結(jié)構(gòu)的拼寫信息,詞條可以是一個單詞,也可以是多個單詞組成的術(shù)語。應(yīng)用 Java程序,可以通過詞典完成對生物醫(yī)學(xué)文本變異的處理,這有利于網(wǎng)絡(luò)搜索和對電子病歷的搜索。

4.支持性軟件工具

一體化醫(yī)學(xué)語言系統(tǒng)的支持性軟件工具包括MetamorphoSys、lvg、MetaMap、知識資源服務(wù)器。MetamorphoSys是針對元敘詞表的特殊用途而定制出的應(yīng)用程序,例如,可以應(yīng)用它來排除其他來源的詞匯,可以從一個數(shù)據(jù)庫中挑選出一個概念和這個概念優(yōu)先使用的名詞。lvg程序基于專家詞典和手工編碼的規(guī)則,產(chǎn)生一個既定術(shù)語的詞匯變異(例如從單數(shù)變?yōu)閺?fù)數(shù))和衍生 (例如形容詞形式變?yōu)槊~形式),并且能清除語義學(xué)上不重要的詞匯。MetaMap是一個在線工具,當(dāng)給予一個文本時,它能查找出與元敘詞表相關(guān)的概念。知識資源服務(wù)器是一個在線服務(wù)器,它具有支持讀者瀏覽元敘詞表的功能。

一體化醫(yī)學(xué)語言系統(tǒng)為美國國家生物技術(shù)信息中心 (National Center for Biotechnology Information)的文獻(xiàn)檢索 (包括MEDL INE等)提供關(guān)鍵詞搜索。MEDL INE與世界上大部分生物醫(yī)學(xué)文獻(xiàn)鏈接,其搜索路徑可以檢索美國醫(yī)學(xué)圖書館的大多數(shù)文獻(xiàn)、會議資料、科研項(xiàng)目等。一體化醫(yī)學(xué)語言系統(tǒng)也為臨床試驗(yàn)系統(tǒng) (ClinicalTrials.gov)的使用提供搜索便捷,解決一個概念有多個名稱的問題。另外,一些醫(yī)學(xué)機(jī)構(gòu)利用一體化醫(yī)學(xué)語言系統(tǒng)的資料庫收集醫(yī)學(xué)術(shù)語[8]。

三 對規(guī)范我國醫(yī)學(xué)術(shù)語的借鑒作用和意義

我國醫(yī)學(xué)術(shù)語系統(tǒng)化建設(shè)起步晚,收詞量少,發(fā)展緩慢,而一體化醫(yī)學(xué)語言系統(tǒng)為我國醫(yī)學(xué)術(shù)語系統(tǒng)化提供了概念基礎(chǔ)和理論借鑒。

要建立我國的一體化醫(yī)學(xué)語言系統(tǒng),首先要確立詞庫。美國一體化醫(yī)學(xué)語言系統(tǒng)含有 100多萬個概念,500多萬個名稱。100多萬個概念為漢語醫(yī)學(xué)術(shù)語提供了概念基礎(chǔ),但 500多萬個名稱中有很多僅僅是英文次序或者語法的變化,因此要充分考慮英語和漢語的異同點(diǎn),做好本地化工作。漢語化的語義網(wǎng)絡(luò)建設(shè)要充分考慮到漢語名詞的同名不同義和異名同義的特點(diǎn),另外,還應(yīng)從漢語科技文獻(xiàn)中補(bǔ)充漢語詞匯。

在西方醫(yī)學(xué)傳入我國之前,傳統(tǒng)中醫(yī)學(xué)的主導(dǎo)地位不可動搖,在我國醫(yī)學(xué)史上有著深遠(yuǎn)的影響。西方醫(yī)學(xué)進(jìn)入我國后,大量的西方醫(yī)學(xué)術(shù)語被翻譯成漢語,西方醫(yī)學(xué)術(shù)語的翻譯也同樣受到傳統(tǒng)中醫(yī)學(xué)的影響,漢語化的西方醫(yī)學(xué)術(shù)語帶有很強(qiáng)的民族特色。因此,建立我國的一體化醫(yī)學(xué)語言系統(tǒng)并不是一個簡單的術(shù)語翻譯問題,納入中醫(yī)學(xué)術(shù)語對該系統(tǒng)的漢語化建設(shè)具有重要意義。

隨著社會現(xiàn)代化及信息網(wǎng)絡(luò)化的發(fā)展,普及應(yīng)用電子病歷的重要性日益凸現(xiàn)出來。電子病歷技術(shù)能夠?qū)崿F(xiàn)醫(yī)療信息共享,即將以醫(yī)院為單位的醫(yī)療診斷信息通過網(wǎng)絡(luò)實(shí)現(xiàn)不同醫(yī)療機(jī)構(gòu)之間的信息共享,從而更加有效地利用醫(yī)療資源。信息共享的一個重要基礎(chǔ)是術(shù)語的信息化,以便使表達(dá)同一概念的不同名稱能被計算機(jī)正確解讀。

[1]Medical terminologies:UMLS[DB/OL].http://www. openclinical.org/medTer mUmls.html.

[2]LindbergD A,HumphreysB L,McCray A T.The Unified Medical Language System[J].Methods Inf Med,1993 Aug,32(4):281-91.

[3]HumphreysB L.The UMLS and the web:new opportunities to link sciencitific knowledge to clinical care[EB/ OL].http://crics3.bvsalud.org/cgi-bin/crics3/.

[4]LindbergD A B,Humphreys B L.The UMLS Knowledge Sources:tools for building better user interfaces[J].Proc Annu Symp ComputApplMed Care,1990,121-5.

[5]About the UMLS[DB/OL].http://www.nlm.nih.gov/ research/umls/about_umls.html.

[6]Source Vocabularies-2009AB Release[DB/OL].http://www.nlm.nih.gov/research/umls/knowledge_ sources/metathesaurus.

[7]Kleinsorge A,W illis J,Browne,A.AM IA 2006 Tutorial T12 UMLS Overview[DB/OL].http://www.nlm.nih. gov/research/umls/pdf/AM IA_T12_2006_UMLS.pdf.

[8]UMLSApplications[DB/OL].(2009-09-23)[2010 -06-21].http://www.nlm.nih.gov/research/umls/ implementation_resources/applications.html.

The UMLS and Its Reference to Standardize Chinese Medical Terminologies

ZHU Yanhui Tengjisi

Having been deve lop ed for ove r two decades by U.S.N a tiona l Ins titute of Hea lth,w ith its17 linguis tic ve rs ions,the U nified M ed ica l Language Sys tem (UMLS)has becom e the m os t unive rsa l m ed ica l te rm inology sys tem.It inc ludes the M e ta thesaurus,Sem antic N e tw ork,SPEC IAL IST lexicon and assoc ia te lexicon p rog ram,supp orting softw a re tools.The UMLS p rovides convenience for lite ra ture re trieva l and the imp lem enta tion of the na tiona l e lec tronic m ed ica l record.

UMLS(Unified M ed ica lLanguage Sys tem),te rm inology,e lec tronic m ed ica l record

N04;R3

A

1673-8578(2010)04-0015-04

2010-05-11

朱彥慧(1972—),男,山東人,2004年北京大學(xué)醫(yī)學(xué)部博士畢業(yè),同年赴美從事醫(yī)學(xué)研究,2006年歸國,現(xiàn)為全國科學(xué)技術(shù)名詞審定委員會副編審。通信方式:zhuyh@cnctst.gov.cn。

猜你喜歡
詞表術(shù)語詞典
A Chinese-English List of the Sports Programmes in Winter Olympics 冬奧會項(xiàng)目名稱漢英對照詞表
評《現(xiàn)代漢語詞典》(第6版)
詞典例證翻譯標(biāo)準(zhǔn)探索
敘詞表與其他詞表的互操作標(biāo)準(zhǔn)
《胡言詞典》(合集版)刊行
國外敘詞表的應(yīng)用與發(fā)展趨勢探討*
常用聯(lián)綿詞表
高唐县| 沁源县| 化州市| 北流市| 宜阳县| 无为县| 友谊县| 新和县| 宁化县| 达日县| 丰县| 孝昌县| 礼泉县| 扬中市| 兰考县| 达日县| 石景山区| 金平| 湟中县| 贵州省| 麟游县| 独山县| 云安县| 湘潭市| 安阳市| 馆陶县| 若尔盖县| 永顺县| 准格尔旗| 三原县| 松原市| 南川市| 襄垣县| 合江县| 仪征市| 芜湖市| 安宁市| 罗甸县| 八宿县| 襄樊市| 郯城县|