張士男(中國(guó)科學(xué)院文獻(xiàn)情報(bào)中心 中國(guó)科學(xué)院大學(xué) 北京 100190)
知識(shí)組織體系術(shù)語(yǔ)刪除分析*
張士男(中國(guó)科學(xué)院文獻(xiàn)情報(bào)中心 中國(guó)科學(xué)院大學(xué) 北京 100190)
知識(shí)組織體系的內(nèi)容只有不斷地調(diào)整和更新,才能準(zhǔn)確反映知識(shí)的科學(xué)發(fā)展,及時(shí)刪除“過(guò)時(shí)”術(shù)語(yǔ)能夠使知識(shí)組織體系更加準(zhǔn)確地揭示領(lǐng)域知識(shí)。不同知識(shí)組織體系在術(shù)語(yǔ)刪除機(jī)制、術(shù)語(yǔ)刪除原因、術(shù)語(yǔ)刪除處理方式方面存在差異,但本質(zhì)都是為了保持一致性,反映科學(xué)知識(shí)的最新進(jìn)展。術(shù)語(yǔ)刪除是檢查知識(shí)組織體系質(zhì)量的一種方式,因此要建立完善的術(shù)語(yǔ)刪除機(jī)制,明確術(shù)語(yǔ)刪除的原則,根據(jù)術(shù)語(yǔ)刪除原因采取不同的處理方式。
知識(shí)組織體系敘詞表術(shù)語(yǔ)刪除
知識(shí)組織體系的內(nèi)容只有不斷調(diào)整和更新,才能準(zhǔn)確反映知識(shí)的科學(xué)發(fā)展,進(jìn)而更加成功地支持?jǐn)?shù)據(jù)檢索和知識(shí)發(fā)現(xiàn)。確定一個(gè)科學(xué)分類系統(tǒng)內(nèi)容的過(guò)程是一種組織性遺忘的過(guò)程,這就意味著一個(gè)新的分類被創(chuàng)建,開發(fā)者就要決定哪些內(nèi)容需要從體系里刪除。如果沒(méi)有分類去描述一個(gè)對(duì)象或行為的含義,則信息系統(tǒng)無(wú)法記錄這個(gè)對(duì)象或行為,沒(méi)有名稱的事物將在分類系統(tǒng)中被遺忘[1]。術(shù)語(yǔ)刪除是檢查知識(shí)組織體系質(zhì)量的一種方式,如基因本體(Gene Ontology,簡(jiǎn)稱GO)中刪除的術(shù)語(yǔ)占術(shù)語(yǔ)總量的比例超過(guò)4.4%,這意味著每增加100個(gè)術(shù)語(yǔ),就至少有4個(gè)術(shù)語(yǔ)被刪除[2]135,建筑與藝術(shù)敘詞表(Art & Architecture Thesaurus,簡(jiǎn)稱AAT)可獲取的主題詞中有4.4%為被遺棄的主題[3]。本文在分析術(shù)語(yǔ)刪除機(jī)制、術(shù)語(yǔ)刪除原因、術(shù)語(yǔ)刪除處理方式的基礎(chǔ)上,分析術(shù)語(yǔ)刪除中存在的問(wèn)題,提出受控詞表術(shù)語(yǔ)刪除的幾點(diǎn)建議,以期為受控詞表的維護(hù)提供參考。
筆者在進(jìn)行數(shù)據(jù)分析時(shí)選擇的詞表至少滿足兩個(gè)條件:一是詞表持續(xù)更新;二是詞表提供網(wǎng)絡(luò)服務(wù),開放的網(wǎng)絡(luò)環(huán)境更有利于對(duì)詞表變化的系統(tǒng)跟蹤。此外,筆者還綜合考慮了詞表權(quán)威性、應(yīng)用程度等因素,具體如表1所示。
在詞表更新維護(hù)調(diào)研過(guò)程中,筆者更加關(guān)注術(shù)語(yǔ)刪除的相關(guān)問(wèn)題,包括術(shù)語(yǔ)刪除機(jī)制、術(shù)語(yǔ)刪除原因、術(shù)語(yǔ)刪除的處理方式及其對(duì)資源標(biāo)引可能帶來(lái)的影響。
2.1機(jī)制分析
在受控詞表維護(hù)過(guò)程中,知識(shí)組織體系編制機(jī)構(gòu)應(yīng)該特別關(guān)注術(shù)語(yǔ)刪除,尤其是當(dāng)術(shù)語(yǔ)已經(jīng)被使用。對(duì)于已經(jīng)帶有很多標(biāo)注的術(shù)語(yǔ)一旦決定將其刪除,則需要花大力氣詳細(xì)討論如何處理已經(jīng)使用的刪除術(shù)語(yǔ)的標(biāo)注。因此,術(shù)語(yǔ)刪除要謹(jǐn)慎,要按照嚴(yán)謹(jǐn)?shù)臋C(jī)制來(lái)執(zhí)行,術(shù)語(yǔ)刪除機(jī)制主要包括如下兩項(xiàng)內(nèi)容:
表1 術(shù)語(yǔ)刪除分析的詞表
(1)由受控詞表專門的維護(hù)團(tuán)隊(duì)或部門主導(dǎo)。LCSH的維護(hù)由美國(guó)國(guó)會(huì)圖書館政策與標(biāo)準(zhǔn)部(Policy and Standards Division)執(zhí)行,組織方式也更加開放,最初,該部門直接通過(guò)“編目要?jiǎng)?wù)通報(bào)”(Cataloguing Service Bulletin)公布修改結(jié)果,自2005年起,該部門在其網(wǎng)站上以周報(bào)/月報(bào)(2011年8月起周報(bào)改為月報(bào))的形式公布對(duì)修改意見(jiàn)的處理方式,不論意見(jiàn)是否被采納,均給出了原因說(shuō)明[6]。同時(shí),最終處理結(jié)果在Cataloguing Service Bulletin公布,但并不是公布全部數(shù)據(jù),2011年以后術(shù)語(yǔ)修改結(jié)果不再通過(guò)編目要?jiǎng)?wù)通報(bào)公布[7]。CABT主題詞的變更由CABT維護(hù)團(tuán)隊(duì)負(fù)責(zé),這些變更作為整部詞表的主要更新每隔一至兩年與整部詞表發(fā)布新版本時(shí)一起出版[4]。CABT上一版本于2012年9月發(fā)布,最新版本于2014年7月21日正式在線發(fā)布。
(2)開發(fā)人員、標(biāo)引人員、領(lǐng)域?qū)<夜餐瑓⑴c。GO為了使其更加成功地支持?jǐn)?shù)據(jù)驅(qū)動(dòng)的知識(shí)發(fā)現(xiàn)和數(shù)據(jù)檢索,準(zhǔn)確地表達(dá)生物知識(shí)的實(shí)體和過(guò)程,使用了術(shù)語(yǔ)定義,建立了術(shù)語(yǔ)之間的關(guān)聯(lián)。GO長(zhǎng)期維護(hù)的一個(gè)關(guān)鍵問(wèn)題就是更新其內(nèi)容以反映生物學(xué)知識(shí)的最新科學(xué)發(fā)展。GO在創(chuàng)建之初就意識(shí)到了這個(gè)問(wèn)題,創(chuàng)建了反饋機(jī)制,從而GO用戶能夠向管理人員反饋其在自己研究領(lǐng)域?qū)ι飳?shí)體或過(guò)程的理解與GO中相應(yīng)知識(shí)表達(dá)不一致的地方。GO的管理人員通過(guò)幾種不同的機(jī)制提出候選“淘汰”術(shù)語(yǔ),隨后這些淘汰術(shù)語(yǔ)通過(guò)一個(gè)標(biāo)準(zhǔn)的門戶Sourceforge tracker推出,進(jìn)行14天的意見(jiàn)搜集,然后管理者、編輯者、領(lǐng)域?qū)<夜餐懻?,有時(shí)本體用戶也參與討論。在沒(méi)有Sourceforge tracker管理之前,GO通過(guò)郵件列表來(lái)記錄和討論淘汰術(shù)語(yǔ)。近60%的淘汰術(shù)語(yǔ)從提出到確定一般需要30~60天左右。提出淘汰術(shù)語(yǔ)的人員主要是GO的開發(fā)人員和標(biāo)引人員。一般來(lái)講,GO確定刪除術(shù)語(yǔ)分為三個(gè)步驟 :首先由其管理者或用戶提出單個(gè)候選刪除術(shù)語(yǔ);其次,確定候選刪除術(shù)語(yǔ)(一般由編輯者或標(biāo)注者提出);最后,通過(guò)會(huì)議討論或研發(fā)人員特別興趣小組等確定刪除的術(shù)語(yǔ)集[2]132-138。
2.2原因分析
不同詞表內(nèi)容進(jìn)行調(diào)整的原因各不相同。NALT每年進(jìn)行更新,更新內(nèi)容包括:將術(shù)語(yǔ)替換為最新術(shù)語(yǔ),替換掉歧義術(shù)語(yǔ),更正錯(cuò)誤[8]。MeSH是標(biāo)引生物醫(yī)學(xué)及其相關(guān)領(lǐng)域資源的受控詞表,生物醫(yī)學(xué)領(lǐng)域經(jīng)常有新概念產(chǎn)生,因此對(duì)于概念的增加、刪除等MeSH需要及時(shí)調(diào)整,以反映領(lǐng)域最新進(jìn)展。MeSH進(jìn)行調(diào)整的基本類型包括直接替換、刪除和增加術(shù)語(yǔ),刪除原因一般包括:標(biāo)題使用率低;標(biāo)題不能反映識(shí)別資源的優(yōu)選形式或不能用于英語(yǔ)醫(yī)學(xué)文獻(xiàn);標(biāo)題不能與其他標(biāo)題在含義上有所區(qū)分;標(biāo)題與上位詞明顯不同但是上位詞使用率低;標(biāo)題具有特殊含義但是其優(yōu)選形式存有歧義;標(biāo)題最初擁有多種內(nèi)涵,但是目前特殊含義的合適的標(biāo)題令之前的標(biāo)題沒(méi)有必要繼續(xù)存在;標(biāo)題/副標(biāo)題的組合可以進(jìn)一步細(xì)分;層級(jí)結(jié)構(gòu)中錯(cuò)誤分類的標(biāo)題[9]。AAT數(shù)據(jù)的變化主要基于如下原因:增加新主題詞或?yàn)楝F(xiàn)有主題增加新術(shù)語(yǔ);反映術(shù)語(yǔ)及其定義在學(xué)術(shù)研究或使用中的變化;增強(qiáng)數(shù)據(jù)一致性;更正一些主題中的近義詞或地位上升的歷史數(shù)據(jù);為歷史數(shù)據(jù)建立多元層級(jí)(2001年之前詞表不允許建立多元層級(jí));更正錯(cuò)誤,包括貢獻(xiàn)的數(shù)據(jù)或編輯錯(cuò)誤[10]。GO術(shù)語(yǔ)刪除的主要原因一是術(shù)語(yǔ)超出了GO的范圍,不再用于標(biāo)注基因產(chǎn)品;二是術(shù)語(yǔ)被重新定義或是內(nèi)涵發(fā)生變化。其本質(zhì)是為了體現(xiàn)本體真實(shí)性[11]。LCSH則更正了有文化偏見(jiàn)的主題[12]。
從上述分析可以看出,數(shù)據(jù)更新的本質(zhì)是為了保持一致性,反映科學(xué)知識(shí)的最新進(jìn)展。術(shù)語(yǔ)刪除主要原因包括術(shù)語(yǔ)使用率低;術(shù)語(yǔ)歧義;術(shù)語(yǔ)被重新定義或內(nèi)涵發(fā)生變化;術(shù)語(yǔ)內(nèi)涵不清晰;術(shù)語(yǔ)內(nèi)涵過(guò)于寬泛;其他問(wèn)題,如將術(shù)語(yǔ)替換為最新術(shù)語(yǔ),更正編輯性錯(cuò)誤等。
2.3處理方式分析
2.3.1刪除程度分析
從刪除程度來(lái)看,術(shù)語(yǔ)刪除處理方式包括臨時(shí)刪除和永久刪除。永久刪除指術(shù)語(yǔ)不再繼續(xù)使用,被永久刪除。臨時(shí)刪除指術(shù)語(yǔ)雖然被標(biāo)記為淘汰(obsolete),但在受控詞表文件中仍然存在,可以通過(guò)版本進(jìn)行檢索,被刪除的詞匯能夠被重新啟用,如GO中淘汰的術(shù)語(yǔ)(obsolete terms)并不是被永久刪除,GO中所有的淘汰術(shù)語(yǔ)都包含在新版本GO文件中,但增加了“obsolete”標(biāo)記。因此,每個(gè)子本體(細(xì)胞組件本體、分子生物功能本體和生物過(guò)程本體)都可以檢索之前的淘汰術(shù)語(yǔ)[2]1 3 2。歐盟多語(yǔ)種敘詞表(Multilingual Thesaurus of the European Union,簡(jiǎn)稱EuroVoc)由于歷史原因,將一些概念定義為“刪除的概念”,并且標(biāo)記為“obsolete”,但他們?nèi)匀淮嬖谟跀⒃~表中,并且他們的URIs也被保留了[13]。
2.3.2處理方式分析
從處理方式來(lái)看,術(shù)語(yǔ)刪除處理方式包括以下三種。一是直接刪除,并且沒(méi)有指明代替被刪除術(shù)語(yǔ)的詞匯。例如,NALT在2014年的版本中直接刪除了2013年版本中的術(shù)語(yǔ)“environmental communication”和“Galandromus”[8]。二是將刪除術(shù)語(yǔ)作為替代術(shù)語(yǔ)的入口詞。將淘汰的術(shù)語(yǔ)作為替代術(shù)語(yǔ)的同義詞是最常見(jiàn)的處理方式。自2010年起,MeSH在其官方網(wǎng)站公開發(fā)布了歷年刪除術(shù)語(yǔ)清單,并為每個(gè)刪除術(shù)語(yǔ)指明了替代術(shù)語(yǔ),同時(shí)將刪除的術(shù)語(yǔ)作為新概念的入口詞[14],如刪除術(shù)語(yǔ)“Nuclear Reprogramming”用“Estrogen Antagonists”代替,并將“Nuclear Reprogramming”作為“Estrogen Antagonists”的入口詞[15]。NALT團(tuán)隊(duì)竭盡所能將被替換或修改的優(yōu)選術(shù)語(yǔ)與新的優(yōu)選術(shù)語(yǔ)建立相互參照關(guān)系,即將刪除的術(shù)語(yǔ)作為替換他們的概念詞的入口詞。例如,刪除術(shù)語(yǔ) “a l lo p a t r ic populations”用“allopatry”代替[8],并將“allopatric populations”作為“allopatry”的入口詞[16]。EuroVoc將刪除的術(shù)語(yǔ)用新的術(shù)語(yǔ)代替,并且用“use instead”作為代替標(biāo)識(shí)[13]。三是指明刪除術(shù)語(yǔ)的替換術(shù)語(yǔ),但沒(méi)有將刪除的術(shù)語(yǔ)作為替換他們的概念詞的入口詞。NALT直接刪除了淘汰的術(shù)語(yǔ),指明了替代術(shù)語(yǔ),但沒(méi)有將刪除的術(shù)語(yǔ)作為代替術(shù)語(yǔ)的入口詞,如刪除“Boer”并用“Boer (goat breed)”代替,但沒(méi)有將“Boer”作為“Boer (goat breed)”的入口詞[8,17], NALT中這類處理方式多見(jiàn)于替換術(shù)語(yǔ)是在被刪除術(shù)語(yǔ)基礎(chǔ)上增加了限定詞。
2.3.3記錄方式分析
從記錄方式來(lái)看,術(shù)語(yǔ)刪除處理方式包括以下兩種。一是直接增加刪除標(biāo)識(shí)。知識(shí)組織體系編制機(jī)構(gòu)一般在刪除詞匯的后面明確注明詞匯為刪除術(shù)語(yǔ),如“obsolete term”“obsolete”“former heading”等標(biāo)識(shí)。例如,GO本體為每一個(gè)淘汰的術(shù)語(yǔ)做了“obsolete”標(biāo)識(shí)。二是通過(guò)歷史附注記錄術(shù)語(yǔ)的刪除信息。這也是最常見(jiàn)的處理方式。如果打開AAT印本書的任何一頁(yè),我們可以看到很多諸如“1992年4月刪除標(biāo)題”或“1993年標(biāo)題改變”的歷史附注。這些變化可以在歷史版本中自動(dòng)跟蹤,當(dāng)這些數(shù)據(jù)可以通過(guò)應(yīng)用程序編程接口(Application Programming Interface,簡(jiǎn)稱APIs)獲取時(shí),這種變化可以實(shí)時(shí)獲?。?0]。被刪除的主題可能已經(jīng)在用戶數(shù)據(jù)中被使用了,為了不丟失這些數(shù)據(jù),AAT為已經(jīng)在數(shù)據(jù)中使用的這些遺棄主題的用戶提供連續(xù)性信息,其中記錄了有關(guān)遺棄主題的少量信息,并且將其發(fā)布關(guān)聯(lián)數(shù)據(jù),包括如下三種屬性信息[3]:
● skos:prefLabel:優(yōu)選名稱(通常是英語(yǔ)形式)
● gvp:enfDate:刪除時(shí)間
● dct:isReplacedBy:合并入的主題(如果已經(jīng)合并到另一個(gè)主題中)
2.4刪除術(shù)語(yǔ)與標(biāo)引
受控詞表的主要作用是進(jìn)行資源標(biāo)引,一旦標(biāo)引的術(shù)語(yǔ)被使用,則標(biāo)注也要隨之變化。CAB文摘數(shù)據(jù)庫(kù)使用CABT概念標(biāo)簽標(biāo)引資源,優(yōu)選術(shù)語(yǔ)的任何變化都會(huì)影響成千上萬(wàn)條記錄、大量檢索文檔及衍生產(chǎn)品。CABT整部詞表發(fā)布新版本后,CAB文摘數(shù)據(jù)庫(kù)標(biāo)引再進(jìn)行更新以反映出敘詞表的變化。由于沒(méi)有可供使用的開放(關(guān)聯(lián))數(shù)據(jù),因此在開放環(huán)境下CABT的使用受限制[4]。CAB正式考慮將CABT發(fā)布為關(guān)聯(lián)數(shù)據(jù)[18]。如果GO中一個(gè)術(shù)語(yǔ)將要被刪除,則在本體文件中會(huì)被標(biāo)記,同時(shí)不再用于標(biāo)注基因產(chǎn)品。對(duì)于已經(jīng)帶有很多標(biāo)注的過(guò)時(shí)術(shù)語(yǔ),GO管理者需要花大力氣詳細(xì)討論,決定現(xiàn)有的標(biāo)注應(yīng)該遷移到哪個(gè)替換的術(shù)語(yǔ)中。GO的一組開發(fā)人員在2008年7月召開了專門會(huì)議來(lái)討論整體遷移事宜[2]132,141。
3.1刪除的詞匯作為替換詞匯的入口詞容易混淆用戶
概念是人腦中的思想單元,具有明確的內(nèi)涵和外延,一個(gè)概念可以用不同的術(shù)語(yǔ)表達(dá),同一個(gè)概念的不同術(shù)語(yǔ)之間是等同關(guān)系,等同術(shù)語(yǔ)中的一個(gè)通常被選作優(yōu)選術(shù)語(yǔ)來(lái)表達(dá)概念,以便人進(jìn)行閱讀,具有等同關(guān)系的術(shù)語(yǔ)可能是同義術(shù)語(yǔ)或近義術(shù)語(yǔ),也可能是反義術(shù)語(yǔ)。術(shù)語(yǔ)刪除原因復(fù)雜,直接將刪除的術(shù)語(yǔ)作為新概念的入口詞,容易混淆用戶的認(rèn)知。如果刪除的術(shù)語(yǔ)之前為優(yōu)選術(shù)語(yǔ),當(dāng)刪除的術(shù)語(yǔ)與替換他的詞含義不完全一致時(shí),將改變概念內(nèi)涵。
3.2缺少刪除原因的信息記錄
由于卡片目錄的制作需要花費(fèi)大量精力,人們往往不愿意做出過(guò)多改變。計(jì)算機(jī)技術(shù)的發(fā)展使詞表維護(hù)變得更加簡(jiǎn)單,也使詞表維護(hù)的機(jī)制變得更加開放。詞表開始記錄刪除的術(shù)語(yǔ)及其相關(guān)信息,并且為了保持連續(xù)性,將刪除的術(shù)語(yǔ)與替換他的術(shù)語(yǔ)建立了相互參照。但從上述分析可以看出,知識(shí)組織體系編制機(jī)構(gòu)缺少對(duì)刪除原因的記錄,這也是術(shù)語(yǔ)刪除標(biāo)準(zhǔn)不明確的表現(xiàn)。
3.3對(duì)基于概念標(biāo)簽的標(biāo)引影響更大
受控詞表的主要作用是對(duì)資源進(jìn)行標(biāo)引和分類。術(shù)語(yǔ)刪除會(huì)帶來(lái)多重影響,可能導(dǎo)致概念刪除或變化、詞表體系結(jié)構(gòu)調(diào)整。在基于概念的標(biāo)引中,不同數(shù)據(jù)庫(kù)的標(biāo)引形式不同,一是用概念唯一標(biāo)識(shí)符進(jìn)行標(biāo)引,這時(shí)無(wú)論概念的優(yōu)選詞標(biāo)簽如何變化,唯一標(biāo)示符代表的概念內(nèi)涵沒(méi)有變化,則不會(huì)對(duì)標(biāo)引產(chǎn)生過(guò)多影響。二是用概念優(yōu)選標(biāo)簽進(jìn)行標(biāo)引,只要概念的優(yōu)選標(biāo)簽發(fā)生變化,則要影響使用這一標(biāo)簽標(biāo)引的全部資源。例如,在CABT中,當(dāng)概念“climate change”的優(yōu)選術(shù)語(yǔ)標(biāo)簽從“climatic change”變?yōu)椤癱limate change”時(shí),上千條記錄需要用新的字符串進(jìn)行更新并且重新標(biāo)引,標(biāo)引中的這種變化將會(huì)影響所有CAB文摘衍生產(chǎn)品。
4.1建立完善的術(shù)語(yǔ)刪除機(jī)制
術(shù)語(yǔ)刪除是受控詞表質(zhì)量保障和維護(hù)的主要手段之一,涉及方方面面,尤其是當(dāng)術(shù)語(yǔ)已經(jīng)被使用時(shí)更要引起重視。建立嚴(yán)謹(jǐn)?shù)男g(shù)語(yǔ)刪除機(jī)制很重要,明確哪些人員能夠提出候選刪除術(shù)語(yǔ),通過(guò)哪個(gè)平臺(tái)或方式來(lái)進(jìn)行意見(jiàn)征集和討論,后續(xù)問(wèn)題處理、一致性檢驗(yàn)等是知識(shí)組織體系創(chuàng)建機(jī)構(gòu)需要考慮的重要問(wèn)題。
4.2明確術(shù)語(yǔ)刪除的原則
刪除原則是術(shù)語(yǔ)刪除工作的指導(dǎo)。國(guó)際標(biāo)準(zhǔn)化組織/文獻(xiàn)工作技術(shù)委員會(huì)(International Organization for Standardization/Technical Committees,簡(jiǎn)稱ISO/TC 46)發(fā)布的報(bào)告“N 2422 Result of voting ISO/CD5127”描述了國(guó)際標(biāo)準(zhǔn)化組織/委員會(huì)階段委員會(huì)草案《信息與文獻(xiàn)——術(shù)語(yǔ)》 (International Organization for Standardization/ Committee Draft《Information and documentation —Vocabulary》, ISO/CD 5127) 的投票結(jié)果和各國(guó)專家意見(jiàn),專家指出,當(dāng)前標(biāo)準(zhǔn)中增加和刪除術(shù)語(yǔ)的規(guī)則不明晰,刪除的一些詞,如“archivist” “archive science”“evidential value”“inventory”等在信息與文獻(xiàn)領(lǐng)域中是有意義的,不應(yīng)刪除[19]。詞表編輯人員應(yīng)該關(guān)注所有建議和提出的候選術(shù)語(yǔ),使用過(guò)于頻繁或過(guò)于稀少的詞語(yǔ)應(yīng)作為刪除或被修正的候選術(shù)語(yǔ)[20]。此外,專指性過(guò)強(qiáng)、內(nèi)涵過(guò)于寬泛、內(nèi)涵發(fā)生變化、與當(dāng)前詞表學(xué)科范圍關(guān)聯(lián)性不大、不再使用的術(shù)語(yǔ)等都應(yīng)該被考慮。
4.3根據(jù)刪除原因采用不同的處理策略
術(shù)語(yǔ)刪除的原因多樣,知識(shí)組織體系編制機(jī)構(gòu)應(yīng)該根據(jù)不同的原因,采取不同的處理方式。例如,從未被使用的術(shù)語(yǔ),說(shuō)明并不能反映客觀事實(shí),不能記錄任何一個(gè)事物或?qū)嶓w,可直接刪除;專指性過(guò)強(qiáng)的術(shù)語(yǔ),可以合并入其他概念;含義過(guò)于寬泛的術(shù)語(yǔ),應(yīng)該被刪除,且拆分為多個(gè)概念等。
本文對(duì)幾部主流知識(shí)組織體系的術(shù)語(yǔ)刪除機(jī)制、刪除原因及處理方式等進(jìn)行了調(diào)研,分析了存在的問(wèn)題,并提出了幾點(diǎn)建議,但是分析的還不夠深入,缺少系統(tǒng)深入的實(shí)例研究。術(shù)語(yǔ)刪除是知識(shí)組織體系質(zhì)量檢驗(yàn)的手段之一,但不是唯一的手段,而是與其他方面的修改(如術(shù)語(yǔ)增加、關(guān)系調(diào)整等內(nèi)容)息息相關(guān)。
[1]Bowker C. Star L. Sorting Things Out: Classification and its Consequences[M]. Cambridge:MIT Press,1999:1-377.
[2]Mayor C. The Classification of Gene Products in the Molecular Biology Domain: Realism, Objectivity, and the Limitations of the Gene Ontology[D].London: City University London,2012.
[3]Trust J P G.AAT Semantic Representation [EB/OL]. [2014-10-14]. http://www.getty.edu/research/tools/vocabularies/lod/ aat_semantic_representation.pdf .
[4]Thomas B, Osma S. GACS: Status Quo of Three Partner Thesauri. [EB/OL]. [2014-11-20]. http://aims.fao.org/sites/default/files/ GACS_Status_Quo_1%200.pdf.
[5]Mayor C, Robinson L. Ontological Realism and Classification: Structures and Concepts in the Gene Ontology[J]. Journal of the American Society for Information Science and Technology,2014: 1-12.
[6]Summary of Decisions from the Weekly (and Monthly, as of May 2011) Editorial Meeting [EB/OL]. [2014-10-07]. http://www.loc. gov/aba /pcc/saco/cpsoed/cpsoeditorial.html.
[7]Cataloging Service Bulletin [EB/OL]. [2014-10-07].http://loc. gov/cds/PDFdownloads/csb/index.html.
[8]Replaced Terms Between 2013 and 2014 Editions [EB/OL]. [2014-09-28].http://agclass.nal.usda.gov/dne/replaced.shtml.
[9]Humphrey M. File Maintenance of MeSH Headings in MEDLINE[J]. Journal of the American Society for Information Science,1984,35(1):34-44.
[10]Trust J P G. AAT: Frequently Asked Questions[EB/OL].[2014-10-25].http://www.getty.edu/research/tools/vocabularies/aat/ aat_faq.html.
[11]Mayor C, Robinson L.Ontological Realism, Concepts and Classification in Molecular Biology Development and Application of the Gene Ontology[J]. Journa of Documentation, 2014,70(1): 173-193.
[12]Knowlton S. Three Decades Since Prejudices and Antipathies: A Study of Changes in the Library of Congress[J].Cataloging and Classification Quarterly, 2005,40(2):123-145.
[13]EuroVoc 4.4: Obsolete Concepts by Microthesaurus[EB/OL]. [2014-12-13].http://eurovoc.europa.eu/drupal/?q=node/ 1242&cl=en.
[14]Deleted Descriptors [EB/OL]. [2014-08-28]. http://www.nlm.nih. gov/mesh/deleted.html.
[15]2015MeSH[EB/OL].[2015-04-16]. http://www.nlm.nih.gov/cgi/ mesh/2015/MB_cgi?term=ESTROGEN+ANTAGONISTS.
[16]Allopatry[EB/OL].[2014-09-05]. http://agclass.nal.usda.gov/ mtwdk.exe?k=default&l=60&w=192781&n=1&s=5&t=2.
[17]Boer (goat breed) [EB/OL]. [2014-09-25]. http://agclass.nal.usda. gov/mtwdk.exe?s=1&n=1&y=0&l=60&k= default&t=2&w= Boer+%28goat+breed%29.
[18]New edition of CAB Thesaurus Published[EB/OL]. [2014-09-12]. http://aims.fao.org/community/general-information/blogs/newedition-cab-thesaurus-published#.VDQHUlde8Y0.
[19]劉春燕,安小米,侯人華.術(shù)語(yǔ)標(biāo)準(zhǔn)研制方法及在信息與文獻(xiàn)領(lǐng)域中的應(yīng)用[J].圖書情報(bào)工作,2014,58(9):91-95.
[20]International Organization for Standardization.ISO 25964-1 Information and Documentation- Thesauri and Interoperability with Other Vocabularies-Part 1: Thesauri for Information Retrieval[S]. 2011,87.
Analysis on the Term Deletion in Knowledge Organization System
With the constant adjustment and update, Knowledge Organization System (KOS) can reflect the development of science accurately, and deleting the obsolete term can make KOS more accurate in revealing the domain knowledge. There are differences on mechanism, reason and treatment of the term deletion among KOS, but the essence is all to keep the consistency of KOS and to reflect the latest progress of the scientific knowledge. Term deletion is a kind of form to check the quality of KOS, so it is essential to establish perfect term deletion mechanism, improve term deletion principle, and take different measures in different conditions.
Knowledge Organization System(KOS); Thesauri; Term deletion
G254
A
*本文系國(guó)家科技支撐計(jì)劃項(xiàng)目“面向外文科技文獻(xiàn)信息的知識(shí)組織體系建設(shè)與應(yīng)用示范( STKOS) ”子課題“面向外文科技文獻(xiàn)的超級(jí)科技詞表和本體建設(shè)” 研究成果之一,課題編號(hào):2011BAH10B01。
張士男 女,1986年生,現(xiàn)工作于中國(guó)科學(xué)院文獻(xiàn)情報(bào)中心,館員,中國(guó)科學(xué)院大學(xué)2012級(jí)圖書館學(xué)博士。
2015-03-05 ]