謝桂蘋 劉斌
〔摘 要〕CSCD作為國內(nèi)最具權(quán)威性的引文信息源,其引文檢索的滿意度直接影響了各種科學(xué)評價的結(jié)果。本文結(jié)合實例,就如何提高CSCD引文檢索的查全率,從來源文獻的完善、檢索詞的選取及檢索詞間的邏輯組配等多種角度,提出了探討性意見。
〔關(guān)鍵詞〕CSCD;中國科學(xué)引文索引;引文檢索;查全率
1 CSCD概況
中國科學(xué)引文數(shù)據(jù)庫(Chinese Science Citation Database,簡稱CSCD)創(chuàng)建于1989年,是我國第一個引文數(shù)據(jù)庫。收錄我國數(shù)學(xué)、物理、化學(xué)、天文學(xué)、地學(xué)、生物學(xué)、農(nóng)林科學(xué)、醫(yī)藥衛(wèi)生、工程技術(shù)、環(huán)境科學(xué)和管理科學(xué)等領(lǐng)域出版的中英文科技核心期刊和優(yōu)秀期刊千余種,目前已積累從1989年到現(xiàn)在的論文記錄300萬條,引文記錄近1 700萬條[1]。
CSCD憑借其建庫歷史最為悠久、專業(yè)性強、數(shù)據(jù)準(zhǔn)確規(guī)范、檢索方式多樣、完整、方便等特點,已經(jīng)在我國科研院所、高等學(xué)校的課題查新、基金資助、項目評估、成果申報、人才選拔以及文獻計量與評價研究等多方面作為權(quán)威文獻檢索工具獲得廣泛應(yīng)用[2],深受用戶好評,被譽為“中國的SCI[2]”。
CSCD檢索系統(tǒng)除具備一般的檢索功能外,還提供新型的索引關(guān)系——引文索引,使用該功能,用戶可迅速從數(shù)百萬條引文中查詢到某篇科技文獻(專著、期刊論文、會議文獻、專利、學(xué)位論文等)被引用的詳細情況,還可以從一篇早期的重要文獻或著者姓名入手,檢索到一批近期發(fā)表的相關(guān)文獻,對交叉學(xué)科和新學(xué)科的發(fā)展研究具有十分重要的參考價值[3]。
學(xué)術(shù)論文的收錄從論文產(chǎn)出的“量”的角度反映被評價對象的學(xué)術(shù)價值,而由于學(xué)術(shù)論文引用行為的目的性,使得引文從“質(zhì)”的角度反映了被評價對象的學(xué)術(shù)價值[4]。因此,引文的計量與分析成為科學(xué)評價體系中最為重要的組成部分。CSCD作為國內(nèi)上最具權(quán)威性的引文信息源,其引文檢索的滿意度也必然地成為關(guān)乎科研成果評價是否公正、準(zhǔn)確的重要環(huán)節(jié)。
2 CSCD引文檢索的基本流程
2.1 明確檢索目的,檢索相關(guān)信息
CSCD引文檢索界面提供了被引作者、被引第一作者、被引來源、被引機構(gòu)、被引實驗室、被引文獻主編6個檢索字段,因此,應(yīng)明確檢索目的,根據(jù)檢索內(nèi)容,搜集檢索課題中與6個檢索字段相關(guān)的信息。
2.1.1 個人學(xué)術(shù)論文被引檢索
一般應(yīng)整理出:①作者姓名,英文姓名全拼。②作者單位,包括檢索時間范圍內(nèi)作者服務(wù)過的所有單位。③已經(jīng)發(fā)表的論文目錄,包括中文篇名、英文篇名、期刊名稱及卷期頁、書名或?qū)@枴l(fā)表時間;會議論文應(yīng)包括會議名稱、會議時間、會議地點,按照論文類型、語種分類,同時以論文發(fā)表時間排序。
2.1.2 來源文獻檢索
一般應(yīng)整理出:①出版物所有歷史名稱的全稱,全稱拼音或英文名稱;②中英文出版物名稱以及各種縮寫形式。
2.1.3 科研機構(gòu)論文被引檢索
機構(gòu)所有作者學(xué)術(shù)論文被引情況的匯總。按“個人學(xué)術(shù)論文被引檢索”課題提供相應(yīng)的信息。
2.2 分析檢索內(nèi)容,確定檢索途徑
2.2.1 檢索課題中包括學(xué)術(shù)論文收錄要求
如果檢索課題中包括學(xué)術(shù)論文收錄的內(nèi)容,可通過“來源文獻檢索”檢索論文收錄情況,包括某種刊、某個機構(gòu)、某作者等的論文產(chǎn)出量。
2.2.2 檢索課題中只包括引文要求
①個人學(xué)術(shù)論文檢索:一般選擇引文檢索的“被引作者”或者“被引第一作者”字段。英文文獻作者姓名的鍵入一般為“姓、名的全拼”或“姓全拼”、“名首字母”的各種縮寫方式。為了提高檢索結(jié)果的查全率,CSCD作者引文檢索一般通過第一作者檢索獲取引文信息。②科學(xué)出版物檢索:一般選擇引文檢索的“被引來源”字段。在該字段輸入文獻刊名、書名、會議錄、專利號或其它一些名稱的縮略式。③機構(gòu)引文檢索:選擇引文檢索的“被引機構(gòu)”字段,在該字段輸入要檢索的機構(gòu)名稱的各種變化,可以使用邏輯算符“OR”和其他字段組合檢索。
2.3 分析檢索結(jié)果,及時調(diào)整策略
CSCD引文檢索界面提供的6個檢索字段之間均可進行邏輯算符進行組合檢索,因而可根據(jù)檢索結(jié)果返回情況,隨時調(diào)整檢索策略,通過幾個字段相結(jié)合的途徑,從多個入口進行引文的檢索。并可限定論文被引年份和論文發(fā)表年份。
2.4 輸出檢索結(jié)果,出據(jù)檢索報告
將選中的引文添加到結(jié)果列表中,選擇“打印”或“下載”導(dǎo)出結(jié)果。整理檢索結(jié)果,并根據(jù)讀者要求將數(shù)據(jù)進行整理出據(jù)完整的檢索報告。
3 提高CSCD引文檢索查全率的基本方法
CSCD引文檢索通過兩種途徑獲得:
(1)從來源文獻中獲得,僅限于CSCD收錄的中文期刊和中國出版的英文版期刊,由于引證文獻中作者的多種著錄格式,收錄文獻中所揭示的引用次數(shù)不是該文章的最終次數(shù),僅限于參考。
(2)從引文檢索界面實現(xiàn)。CSCD引文檢索一般使用第一作者檢索被引文獻。引文檢索時,如果不限定第一作者,雖然可以檢索到部分非第一作者文獻被引用的情況,但是檢索結(jié)果不全。例如,某作者以第三作者發(fā)表的論文,如果引證文獻中的參考文獻只標(biāo)注了第一作者姓名,那么在做引文檢索時,用非第一作者姓名檢索時就查不到,所以非第一作者被引文獻檢索時建議使用第一作者進行檢索。
被引文獻的表達:CSCD在做標(biāo)引的時候沒有將被引文獻進行規(guī)范化著錄,導(dǎo)致檢索結(jié)果中同一篇被引文獻可能出現(xiàn)多個命中,有時候還不排列在相近的位置,檢索時需要格外仔細,因此,提高CSCD引文檢索的查全率,不但要了解CSCD的編排和處理規(guī)則,還要不斷地從實踐中總結(jié)各種可能遺漏的情況和判斷結(jié)果的方法。
3.1 完善來源文獻信息
由于來源文獻信息是核實引文檢索結(jié)果的重要依據(jù),而被評價對象在提供論文信息時往往存在論文目錄不全、個別論文信息不全甚至錯誤、以中國出版的英文版期刊或發(fā)表的國際學(xué)術(shù)期刊論文缺少關(guān)鍵性英文信息等。因此,在實施檢索前發(fā)現(xiàn)問題及時與論文作者溝通,將目錄信息補充完整,或通過檢索《中國期刊全文數(shù)據(jù)庫》、館藏OPAC系統(tǒng)以及網(wǎng)絡(luò)搜索引擎等方式把目錄清單補充完整。
3.2 查全檢索詞的多種縮寫
3.2.1 被引作者
CSCD中英文引文的著錄格式?jīng)]有統(tǒng)一標(biāo)準(zhǔn),中國作者名稱及縮寫形式多種方式甚至錯誤的拼寫都可以檢索到結(jié)果。
如:張樹霖
Zhang shulin=(shulin zhang)
Zhang shu-lin=(zhang shu lin)
Zhang sl
Zhang s l=(Zhang s-l)
Zhang s
Zhang shl
(1)不同的拼寫
例一:鄭綿平論文的引文檢索結(jié)果中同一篇文獻的不同拼寫(見表1)。
例二:鄭綿平著作的引文檢索結(jié)果中同一篇文獻的錯誤拼寫(見表4)。
為避免由于作者名拼寫的不同造成的漏檢,一般利用截詞符或多種拼寫的同字段組配方式檢索,但如果檢索結(jié)
果數(shù)量過大,就要采取分次輸入檢索詞,并結(jié)合與其他檢索字段的組配,以提高檢索效率。
3.2.2 被引來源
對于中文語種的出版物,既要了解其更名歷史,又要將其名稱準(zhǔn)確英譯,并給出各種可能的縮寫形式。
例:《物理化學(xué)學(xué)報》在CSCD索引中提供的全稱及多種縮形式均有檢索結(jié)果(見表5)。
為避免漏檢, 英文刊名的檢索可選取來源文獻名稱中的任意一個詞作為檢索詞, 并與其他檢索字段進行組配,檢索結(jié)果與來源文獻信息核對確認。
3.2.3 被引文獻出版年
引文檢索時,如果被引作者和被引來源檢索結(jié)果量大時,可限定被引出版年和論文發(fā)表時間。但由于引文信息中的年段著錄經(jīng)常出現(xiàn)錯誤,如同一篇文章年不一致:
侯增謙 地球科學(xué).1990,16(2):153 4
侯增謙 地球科學(xué).1991,16(2):153 7
因此,利用該檢索字段時,應(yīng)將論文發(fā)表時間進行適當(dāng)?shù)臄U展,以提高查全率。
3.3 寬泛檢索字段的邏輯組配
被引作者、被引第一作者、被引來源、被引機構(gòu)、被引實驗室、被引文獻主編、被引文獻出版年和論文發(fā)表年之間均可進行邏輯組配,可以有效地提高查準(zhǔn)率、查全率和檢索效率。但因被引作者、被引著作均有多種拼寫且各檢索字段均有可能出現(xiàn)錯誤,因此,只有在單一字段的檢索結(jié)果過于龐大的情況下,才使用不同字段組配的方式,但組配的字段不宜過多,更不能把檢索詞定的過于嚴(yán)格,應(yīng)根據(jù)檢出結(jié)果,靈活調(diào)整檢索策略。
3.4 利用相關(guān)信息確認檢索結(jié)果
在實際檢索中,同一篇學(xué)術(shù)論文的引用信息經(jīng)常出現(xiàn)差異。如:
4 問題及建議
通過以上案例分析,為了有效的提高CSCD引文檢索的查全率查準(zhǔn)率,CSCD數(shù)據(jù)庫還需要不斷的完善。以下是檢索過程中常見問題及建議:
4.1 增加邏輯組合檢索字段
能否給用戶提供多途徑的查詢,是評價數(shù)據(jù)庫的一個重要指標(biāo),方便用戶檢索的字段也同樣重要,CSCD數(shù)據(jù)庫中的邏輯組合檢索項只有3項,邏輯組合字段不能任意添加,引文檢索時,面對作者多種拼寫方式時,不能一次完成檢索,建議增加邏輯組合檢索字段,以提高效率。
4.2 適量增加核心期刊和優(yōu)秀期刊的收錄
CSCD只收錄國內(nèi)出版的核心期刊和少量的優(yōu)秀期刊,是影響查全率的因素之一,可以適量增加核心期刊和優(yōu)秀期刊的收錄。
4.3 增加精確檢索
引文檢索時,輸入被檢作者的各種拼寫方式進行檢索時,數(shù)據(jù)庫檢出的結(jié)果默認的是模糊檢索,例如檢索作者xiao d時,在作者項輸入xiao d,檢出結(jié)果包含Xiao D;Xiao D N;XIAO S D;XIAO D W;Xiao D M;D R Xiao;等等,必須使用英文狀態(tài)下的引號括起來,建議增加精確檢索。
4.4 著錄標(biāo)引規(guī)范化
CSCD中英文引文的著錄格式?jīng)]有統(tǒng)一標(biāo)準(zhǔn),來源文獻及作者名稱的縮寫形式多種方式甚至錯誤的拼寫都可以檢索到結(jié)果。檢索過程繁瑣,導(dǎo)致檢索結(jié)果中同一篇被引文獻可能出現(xiàn)多個命中,并且不排列在相近的位置,需要檢索人員整合數(shù)據(jù)。建議加強對發(fā)表論文中參考文獻著錄的規(guī)范控制;也建議中國科學(xué)文獻服務(wù)系統(tǒng)建立相應(yīng)的機制,除更好地規(guī)范引文標(biāo)引外,應(yīng)及時地更改現(xiàn)有的不夠準(zhǔn)確甚至錯誤的標(biāo)引,賦予CSCD更高品質(zhì)的引文索引。
4.5 增加來源文獻檢索字段
檢索字段少,建議適當(dāng)增加來源文獻所在頁碼、ISSN、ISBN號等相關(guān)信息的檢索點,以提高檢索效率。
5 結(jié) 語
CSCD引文檢索是一種比較復(fù)雜的信息檢索,如何制定優(yōu)良的檢索策略是關(guān)系到能否獲得滿意檢索結(jié)果的核心問題。檢索人員除了必須清楚CSCD的編排結(jié)構(gòu),編排時對特殊符號、非英文語種、著者名稱等的處理規(guī)則外,應(yīng)善于積累個案,善于將實際檢索中所觸及到的一些常見的典型問題進行匯總分析,不斷提高引文檢索的技巧,有效地保障引文檢索的查全率與查準(zhǔn)率。
參考文獻
[1]http:∥sdb.csdl.ac.cn/indexzmore5.jsp[EB].
[2]樂平.用CSCD數(shù)據(jù)庫作各學(xué)科定量評價工具有缺陷[J].科技情報開發(fā)與經(jīng)濟,2006,(10):238-239.
[3]周靜怡,廖鳳,劉小兵,等.CSCD個性化服務(wù)研究與設(shè)計[J].圖書情報工作,2011,(7):106-110.
[4]趙蓉英,雷將,馬瑞敏,等.我國五大數(shù)據(jù)庫引文功能的比較研究[J].情報理論與實踐,2008,(4):589-593,605.