孫淑萍 孫玉坤
〔摘 要〕利用維普資訊——中文科技期刊數(shù)據(jù)庫、美國國立醫(yī)學(xué)圖書館的pubmed系統(tǒng),對醫(yī)學(xué)文獻(xiàn)中信號通路的檢索方法及應(yīng)注意的問題進(jìn)行論述,探討其對醫(yī)學(xué)科技查新的影響。
〔關(guān)鍵詞〕科技查新;數(shù)據(jù)庫;信號通路;檢索方法;查全率;查準(zhǔn)率
近年來研究發(fā)現(xiàn),信號轉(zhuǎn)導(dǎo)通路幾乎參與所有的細(xì)胞生命活動,包括細(xì)胞代謝、分裂、分化、凋亡等。異常的信號轉(zhuǎn)導(dǎo)通路在腫瘤細(xì)胞的增殖和分化過程中起著重要的調(diào)節(jié)作用。分析異常的信號通路,將對癌癥的機(jī)理研究提供有益的指導(dǎo)作用。下面以“維普資訊——中文科技期刊數(shù)據(jù)庫——鏡像站”、“美國國立醫(yī)學(xué)圖書館的pubmed系統(tǒng)”為例,就科技項目查新檢索工作中,磷脂酰肌醇-3-激酶/絲蘇氨酸蛋白激酶(PI3K/Akt) 信號通路的檢索方法及應(yīng)注意的問題,談一些認(rèn)識和經(jīng)驗。
1 維普資訊——中文科技期刊數(shù)據(jù)庫
在諸多的信號轉(zhuǎn)導(dǎo)途徑中,磷脂酰肌醇-3-激酶/絲蘇氨酸蛋白激酶(PI3K/Akt)通路被認(rèn)為是癌細(xì)胞存活的首要通路,參與細(xì)胞生長、增殖、凋亡及遷移的多個過程,有望成為腫瘤治療的新靶點。但磷脂酰肌醇-3-激酶/絲蘇氨酸蛋白激酶(PI3K/Akt)檢索詞全稱過長,且詞中含有“-”和“/”等特殊符號,檢索起來比較困難,很容易造成漏檢。檢索人員在檢索PI3K/Akt時,分別采用幾種不同檢索詞和書寫方式進(jìn)行檢索,詳見檢索結(jié)果對照表,見表1。表1 任意字段PI3K/Akt的不同檢索詞及書寫方式的
結(jié)果比較(1989-2012,9月)
序號檢 索 詞命中篇數(shù)①磷脂酰肌醇-3-激酶/絲蘇氨酸蛋白激酶152②磷脂酰肌醇3激酶*絲氨酸*蘇氨酸*蛋白激酶11③磷脂酰肌醇?激酶*絲氨酸*蘇氨酸*蛋白激酶11④磷脂酰肌醇3激酶*絲蘇氨酸蛋白激酶8⑤PI3K/Akt381
檢索結(jié)果分析:檢索式①命中的152篇文獻(xiàn),經(jīng)將檢索式展開,全都是以磷脂酰肌醇命中的文獻(xiàn),與PI3K/Akt不相關(guān),顯然是錯誤檢索。后發(fā)現(xiàn)維普資訊——中文科技期刊數(shù)據(jù)庫不識別“-”的半角符號輸入方式,而默認(rèn)“—”的全角符號輸入方式。檢索式②③④將磷脂酰肌醇-3-激酶/絲蘇氨酸蛋白激酶檢索詞拆分,運用邏輯運算符“*”進(jìn)行檢索,雖檢索到磷脂酰肌醇3激酶/絲蘇氨酸蛋白激酶的文獻(xiàn),但相對文獻(xiàn)較少,查全率低。檢索式⑤命中381篇文獻(xiàn),全部是PI3K/Akt的文獻(xiàn)。
在醫(yī)學(xué)文獻(xiàn)中,很多詞都有全稱和縮寫兩種書寫形式。從表1中可以看出,縮寫詞在文獻(xiàn)檢索中起至關(guān)重要的作用,忽略縮寫詞,將漏檢很多文獻(xiàn)。尤其是在檢索磷脂酰肌醇—3—激酶/絲蘇氨酸蛋白激酶(PI3K/Akt)這類檢索詞過長,且詞中含有“-”和“/”等特殊符號時,應(yīng)盡可能選擇檢索式⑤的縮寫詞進(jìn)行檢索,避免漏檢,提高查全率。
2 美國國立醫(yī)學(xué)圖書館的pubmed系統(tǒng)
等進(jìn)行檢索,均命中6 304篇文獻(xiàn),全部是PI3K/Akt的文獻(xiàn)。以英文檢索詞進(jìn)行檢索,檢索式⑤⑥⑦分別命中558、37、518篇文獻(xiàn),雖檢索到PI3K/Akt的文獻(xiàn),但相對文獻(xiàn)較少,查全率低。采用邏輯符“AND”的分欄式檢索詞輸入方法,即2個檢索框進(jìn)行檢索,分別命中1 611篇和2 197篇文獻(xiàn),檢索式⑧⑨為檢索后系統(tǒng)給出的檢索表達(dá)式,除命中PI3K/Akt的文獻(xiàn)外,還命中PI3K/Akt拆分的文獻(xiàn)。
從表2中可以看出,在檢索磷脂酰肌醇-3-激酶/絲蘇氨酸蛋白激酶(PI3K/Akt)這類比較長的檢索詞時,盡量不選擇該信號通路的英文詞進(jìn)行檢索,以防造成不必要的漏檢。而應(yīng)選擇該信號通路縮寫詞的不同書寫方式進(jìn)行檢索,也就是檢索式②③④中的任何一種檢索式,均能提高查全率和查準(zhǔn)率。
3 醫(yī)學(xué)文獻(xiàn)信號通路的網(wǎng)絡(luò)信息資源
互聯(lián)網(wǎng)是世界上最大的信息資源網(wǎng),利用網(wǎng)上資源是獲取有用信息的最快、最有效的途徑。近年來,與信號通路有關(guān)的研究正如火如茶,搜集、整理與信號通路有關(guān)的信息,對于全面理解生物進(jìn)行復(fù)雜調(diào)控機(jī)制具有重要意義。但是面對浩如煙海的信息資源,要從中快速、準(zhǔn)確地查找出所需的信息,并非易事。下面介紹比較常見的與信號通路密切相關(guān)的數(shù)據(jù)庫。
存放信號通路的數(shù)據(jù)庫:
《科學(xué)》(Science)是美國科學(xué)促進(jìn)會(AAAS)出版的一份學(xué)術(shù)雜志。信號轉(zhuǎn)導(dǎo)知識環(huán)境 (stke.sciencemag.org)是一個為研究細(xì)胞如何用化學(xué)信號相互“交流”提供的一個中心電子信息源。這個生物科學(xué)信息網(wǎng)絡(luò)對了解從胚胎發(fā)育到癌癥的幾乎全部生物學(xué)問題必不可少。STKE提供綜述文章、研究評述、實驗規(guī)程、以及連接圖(Connections Maps)等,該網(wǎng)站的內(nèi)容被Medline索引[2]3.2 Signaling Gateway(http:∥www.signaling-gateway.org/) Signaling Gateways是加州大學(xué)圣地亞哥分校自然信令網(wǎng)關(guān)的分子頁面(http:∥www.signaling-gateway.org/molecule)數(shù)據(jù)庫,提供了超過4000蛋白質(zhì)參與細(xì)胞信號,以及專家撰寫的評論,高度結(jié)構(gòu)化的數(shù)據(jù),包括蛋白質(zhì)相互作用等,這里介紹的信息和數(shù)據(jù)是免費提供給所有者[3]。
3.3 KEGGIsl(www.genome.jp/kegg)
KEGG(Kyoto Encyclopedia of Genes and Genomes)數(shù)據(jù)庫是由日本京都大學(xué)生物信息中心開發(fā)的,是一個在網(wǎng)絡(luò)水平和分子水平系統(tǒng)研究基因功能的數(shù)據(jù)庫。KEGG數(shù)據(jù)庫的主要組成部分是各種調(diào)控通路的圖表。KEGG數(shù)據(jù)庫主要以通路的形式儲存關(guān)于基因組,生物化學(xué)、分子以及細(xì)胞生物學(xué)的一些研究,并且體現(xiàn)在分子水平或者基因水平的調(diào)控關(guān)系。另外,KEGG也儲存了大量物種的基因目錄以及全基因組序列信息。這個數(shù)據(jù)庫每日更新并且是開源的
3.4 Biocarta(http:∥www.biocarta.comD)
BioCarta數(shù)據(jù)庫是一家生物技術(shù)公司它在其公共網(wǎng)站上提供了用于繪制生物學(xué)通路的模板??梢杂脕硌芯糠肿踊プ麝P(guān)系、富集分析、通路為基礎(chǔ)的研究等。它還提供了包括12萬多個多物種的基因信息的重要資源。Biocarta的主要特點在于它是一個開源的在線平臺,科研工作者可以在線上自主交流,自行繪制所涉及的通路。在Biocarta的通路頁面,基因間的相互關(guān)系也以生動的圖表表示出來。與KEGG不同的是,Biocarta以信號轉(zhuǎn)導(dǎo)通路占主要部分[4]。
綜上所述,在維普資訊——中文科技期刊數(shù)據(jù)庫、美國國立醫(yī)學(xué)圖書館的pubmed系統(tǒng)中,在檢索有關(guān)醫(yī)學(xué)文獻(xiàn)信號轉(zhuǎn)導(dǎo)通路時,我們必需考慮該信號通路檢索詞的全稱、簡稱、英文名稱、縮寫詞、特殊符號、希臘字母等不同的書寫方式以及各數(shù)據(jù)庫默認(rèn)的檢索表達(dá)式,盡量避免漏減,提高查全率。同時還可以利用網(wǎng)上信息資源,獲取與信號通路有關(guān)的醫(yī)學(xué)文獻(xiàn)。
參考文獻(xiàn)
[1]王立榮.信號通路相關(guān)文獻(xiàn)挖掘與分析方法[D].2007-中國科學(xué)技術(shù)大學(xué):生物醫(yī)學(xué)工程 博士學(xué)位論文 萬方數(shù)據(jù)庫
[2]www.labbase.net/News/…5724B3A.html[EB].2009-12-07.
[3]www.signaling-gateway.Org[EB].
[4]王瓊萍.通路分析與調(diào)控網(wǎng)絡(luò)的分析[EB].www.xumurc.com/main/showNews-9656.html,2012-06-13.
(本文責(zé)任編輯:孫國雷)