尹懋龍 ,常永虎
(1.遵義醫(yī)科大學(xué),貴州 遵義 563000;2.華北電力大學(xué),北京 102206)
結(jié)直腸癌(colorectal cancer,CRC)是胃腸道中常見(jiàn)的惡性腫瘤,早期無(wú)明顯臨床表現(xiàn),但隨著癌腫的增大而表現(xiàn)排便習(xí)慣改變,會(huì)出現(xiàn)便血、腹瀉、腹瀉與便秘交替、局部腹痛等癥狀,晚期則表現(xiàn)貧血、體重減輕等全身癥狀[1]。其發(fā)病率和病死率在消化系統(tǒng)惡性腫瘤中僅次于胃癌、食管癌和原發(fā)性肝癌。人類(lèi)已經(jīng)受結(jié)直腸癌這種疾病影響了幾千年。但是在古人看來(lái),結(jié)直腸癌是一種無(wú)法治愈的疾病。
多種因素會(huì)增加發(fā)生結(jié)直腸癌的風(fēng)險(xiǎn),其中包含高脂肪飲食,膳食纖維不足,也包含遺傳因素(家族聚集性,結(jié)腸癌較直腸癌更為明顯)[2]。
科學(xué)知識(shí)圖譜(Mapping Knowledge Domain)是利用可視化技術(shù)描述知識(shí)資源及其載體,挖掘、分析、構(gòu)建、繪制和顯示知識(shí)及它們之間的相互聯(lián)系,顯示科學(xué)知識(shí)的發(fā)展進(jìn)程與結(jié)構(gòu)關(guān)系的一種圖形[3]。它以科學(xué)知識(shí)為計(jì)量研究對(duì)象,是一種新型計(jì)量學(xué)工具,并利用可視化的圖譜形象地展示學(xué)科的核心結(jié)構(gòu)、發(fā)展歷史、前沿領(lǐng)域以及整體知識(shí)架構(gòu),為學(xué)科研究提供切實(shí)的、有價(jià)值的參考。CiteSpace(引文空間)是一款眼著于分析科學(xué)分析中蘊(yùn)含的潛在知識(shí),是在科學(xué)計(jì)量學(xué)、數(shù)據(jù)可視化背景下逐漸發(fā)展起來(lái)的一款引文可視化分析軟件。本文利用CiteS-pace,將國(guó)內(nèi)CRC 生物信息相關(guān)文獻(xiàn)進(jìn)行知識(shí)圖譜描繪,分析近年來(lái)該研究領(lǐng)域的發(fā)展及演進(jìn)趨勢(shì),為后續(xù)的研究工作提供有價(jià)值的借鑒和參考。
圖1 文獻(xiàn)篩選流程圖
數(shù)據(jù)庫(kù):中國(guó)知網(wǎng)數(shù)據(jù)庫(kù)(CNKI)。檢索策略:高級(jí)檢索,主題:“結(jié)直腸癌”“生物信息”,關(guān)鍵詞:“基因”“臨床表現(xiàn)”。時(shí)間范圍:2000年 1月 1日-2019年 12月 31日。檢索時(shí)間:2020年 4月 27日。
選取以結(jié)直腸癌生物信息為主題的文獻(xiàn),包括基因表達(dá)、臨床表現(xiàn)、研究進(jìn)展等。去除無(wú)關(guān)主題、重復(fù)文獻(xiàn)、會(huì)議論文及科普宣講等,將篩選得到的文獻(xiàn)以RefWorks 格式導(dǎo)出并用CiteSpace 去重,最后得到1116篇文獻(xiàn)。篩選過(guò)程如圖1。
使用Excel 對(duì)文獻(xiàn)發(fā)表數(shù)量進(jìn)行統(tǒng)計(jì)并制作統(tǒng)計(jì)表,分析結(jié)直腸癌研究領(lǐng)域文獻(xiàn)發(fā)表數(shù)量的時(shí)間分布情況,如圖2??梢?jiàn),2000-2004年發(fā)文量平緩增長(zhǎng),年均10.8 篇,2005-2016年在波動(dòng)中快速增長(zhǎng),年均66.7 篇,并在2016年達(dá)到峰值,說(shuō)明該領(lǐng)域的研究在這段時(shí)間內(nèi)受到國(guó)內(nèi)學(xué)者的持續(xù)和大量關(guān)注。此后,從2016-2019年總體呈下降趨勢(shì),年均83.7 篇,研究熱度有所下降。
將數(shù)據(jù)導(dǎo)入CiteSpace5.6.R4 軟件。參數(shù)設(shè)置:時(shí)間分區(qū) (Time Slicing):2000-2019;時(shí)間切片 (Years Per Slice):1年;節(jié)點(diǎn)類(lèi)型(Node Types):Author;閾值(Top N Per Slice):50。共有197 位作者進(jìn)入結(jié)直腸癌生物信息文獻(xiàn)作者共現(xiàn)圖譜(見(jiàn)圖3),發(fā)文量≥4 篇的作者見(jiàn)表1。
圖2 2000-2019年結(jié)直腸癌生物信息領(lǐng)域發(fā)文量
圖3 2000-2019年結(jié)直腸癌生物信息文獻(xiàn)部分核心作者時(shí)區(qū)分布圖譜
圖4 2000-2019年結(jié)直腸癌生物信息領(lǐng)域主要研究機(jī)構(gòu)時(shí)區(qū)分布圖譜
根據(jù)普萊斯定律[4],核心作者最低發(fā)文量為3 篇,由此可得國(guó)內(nèi)結(jié)直腸癌生物信息的核心作者為41 人,共發(fā)文144 篇,約占總發(fā)文量的12.9%。遠(yuǎn)低于普萊斯定律要求的50%。結(jié)合作者聚類(lèi)視圖可知,國(guó)內(nèi)對(duì)結(jié)直腸癌生物信息的研究有多個(gè)團(tuán)隊(duì),但各團(tuán)隊(duì)內(nèi)部合作比較多,不同團(tuán)隊(duì)之間的合作則較少,這意味著該領(lǐng)域的尚未形成穩(wěn)定的核心研究團(tuán)隊(duì),研究者比較分散。
表1 2000-2019年結(jié)直腸癌生物信息文獻(xiàn)部分高發(fā)文量作者情況
表2 2000-2019年結(jié)直腸癌生物信息領(lǐng)域高發(fā)文量研究機(jī)構(gòu)(前14 位)
利用 CiteSpace 5.6.R4,節(jié)點(diǎn)類(lèi)型選為“Instructions”,其余設(shè)置與“2.2”相同。將相同的醫(yī)療或科研機(jī)構(gòu)合并,生成結(jié)直腸癌生物信息研究機(jī)構(gòu)的市區(qū)分布共現(xiàn)圖譜(見(jiàn)圖4)。同時(shí)生成發(fā)文量前14 位的機(jī)構(gòu)(見(jiàn)表2)。
圖4 中,N=427,E=142。說(shuō)明該領(lǐng)域領(lǐng)域 1116 篇文章是由427 個(gè)機(jī)構(gòu)完成,圓形節(jié)點(diǎn)代表研究機(jī)構(gòu),節(jié)點(diǎn)的大小與發(fā)文量成正比,節(jié)點(diǎn)間的連線代表合作發(fā)表論文的情況。由表2 可知,全國(guó)范圍內(nèi)對(duì)結(jié)直腸癌生物信息領(lǐng)域比較有影響力的機(jī)構(gòu)有北京軍區(qū)總醫(yī)院,中山大學(xué)附屬第一醫(yī)院和寧波市李惠利醫(yī)院。由圖2 可知,各機(jī)構(gòu)之間連線比較少而且稀疏,說(shuō)明機(jī)構(gòu)間合作較少。
表3 2000-2019年結(jié)直腸癌生物信息文獻(xiàn)前20 位關(guān)鍵詞
2.4.1 熱點(diǎn)方向
利用 CiteSpace 5.6.R4,NodeTypes 選擇為 KeyWord,修剪方式為Pathfinder 和Pruning the merged network。其余參數(shù)與“2.2”相同。將一些異名同義詞進(jìn)行合并處理,例如:將“結(jié)直腸癌”和“結(jié)腸直腸癌”合并,將“p53 基因”和“p53”合并,將“k-ras 基因”和“kras 基因”合并。利用CiteSpace 生成關(guān)鍵詞聚類(lèi)示圖,如圖5。統(tǒng)計(jì)得前20 位關(guān)鍵詞,如表3。
目前對(duì)于結(jié)直腸癌生物信息的研究主要集中在基因表達(dá),臨床表現(xiàn)?;虮磉_(dá)部分有“k-ras 基因”“基因突變”“基因多態(tài)性”“抑癌基因”等關(guān)鍵詞,臨床表現(xiàn)有“甲基化”“臨床特征”等高頻關(guān)鍵詞。
中介中心性是CiteSpace 知識(shí)圖譜中測(cè)度節(jié)點(diǎn)在網(wǎng)絡(luò)中重要性的指標(biāo)[5],具有高中介中心性的文章通常連接兩個(gè)不同領(lǐng)域的關(guān)鍵樞紐。作為生物信息的研究,結(jié)直腸癌(0.56)成為整個(gè)領(lǐng)域的重要節(jié)點(diǎn),結(jié)直腸腫瘤(0.39)和基因(0.28)緊隨其后。
2.4.2 前沿研究
利用CiteSpace 從論文題目、關(guān)鍵詞和摘要等字段提取后選專(zhuān)業(yè)術(shù)語(yǔ),通過(guò)跟蹤他們不同時(shí)間區(qū)間內(nèi)出現(xiàn)頻率的變化(激增),識(shí)別出代表研究前沿的若干名詞術(shù)語(yǔ),突發(fā)值為衡量該類(lèi)名詞術(shù)語(yǔ)激增的指標(biāo),突發(fā)值越高者,說(shuō)明它的增長(zhǎng)速度越快。利用軟件將發(fā)值前25 位的名詞術(shù)語(yǔ)按出現(xiàn)及持續(xù)時(shí)間大體分為3 個(gè)階段(見(jiàn)圖6)。2000年-2007年,代謝酶基因、p53 基因、聚合酶鏈反應(yīng)等術(shù)語(yǔ)迅速增長(zhǎng),基因及蛋白質(zhì)的研究較為熱門(mén)。2008年-2012年,“西妥昔單抗”“免疫組化”“靶向治療”等術(shù)語(yǔ)迅速增長(zhǎng),對(duì)抗體,治療方向的研究迅速增加。2013年-2019年“腫瘤轉(zhuǎn)移”“臨床特點(diǎn)”“錯(cuò)配修復(fù)基因”等關(guān)鍵詞迅速增長(zhǎng)。說(shuō)明這一時(shí)期對(duì)該問(wèn)題的研究轉(zhuǎn)移到臨床表現(xiàn)上來(lái)。三個(gè)時(shí)期經(jīng)歷了從基因到治療到臨床表現(xiàn)的轉(zhuǎn)變。
圖5 2000-2019年結(jié)直腸癌生物信息文獻(xiàn)高頻關(guān)鍵詞圖譜
從文獻(xiàn)作者的數(shù)據(jù)來(lái)看,結(jié)直腸癌生物信息研究的主要作者有李世擁、肖文華、李秋立、楊祖立、黎瑩等。其中,國(guó)內(nèi)對(duì)該領(lǐng)域研究影響力最大的團(tuán)隊(duì)為李秋文、肖文華、趙慧霞團(tuán)隊(duì)、楊帆團(tuán)隊(duì)和楊祖立團(tuán)隊(duì)。李秋文團(tuán)隊(duì)主要研究結(jié)直腸癌患者糞便中SEPT9(Septin9)基因的甲基化狀態(tài),并得出了糞便DNA SEPT9 基因甲基化檢測(cè)可代替癌組織用于結(jié)直腸癌的早期診斷和篩查的結(jié)論[6]。楊帆團(tuán)隊(duì)的研究表明,結(jié)直腸癌組織中Lgr5 和MIF 蛋白均呈明顯高表達(dá),其可能與結(jié)直腸癌的發(fā)生、發(fā)展以及轉(zhuǎn)移存在密切相關(guān)[7],通過(guò)對(duì)上述因子的表達(dá)水平進(jìn)行調(diào)控,可能是臨床上治療結(jié)直腸癌的新靶點(diǎn)。
從研究機(jī)構(gòu)的數(shù)據(jù)來(lái)看,只有寧波市李惠利醫(yī)院、阿斯利康中國(guó)創(chuàng)新中心、第二軍醫(yī)大學(xué)東方肝膽外科醫(yī)院和解放軍第113 醫(yī)院這幾所機(jī)構(gòu)有合作,其他機(jī)構(gòu)基本是在獨(dú)立研究該領(lǐng)域的問(wèn)題。從機(jī)構(gòu)地域來(lái)看,發(fā)文量多的機(jī)構(gòu)集中在北京和上海,且地區(qū)間合作較少。
從關(guān)鍵詞數(shù)據(jù)來(lái)看,“基因”一詞反復(fù)在文獻(xiàn)中出現(xiàn),研究表明,某些基因突變可能在結(jié)直腸癌的發(fā)生、發(fā)展中起重要作用,而且與淋巴結(jié)轉(zhuǎn)移和肝臟轉(zhuǎn)移有密切相關(guān),可作為判斷結(jié)直腸癌惡性程度的一個(gè)分子生物學(xué)指標(biāo)[8]。
本此次研究借助CiteSpace 5.6.R4 軟件,對(duì)CNKI 上有關(guān)“結(jié)直腸癌生物信息”的1116 篇相關(guān)文章進(jìn)行了文獻(xiàn)計(jì)量分析,為研究人員開(kāi)展結(jié)直腸癌研究提供了參考。
圖6 2000-2019年結(jié)直腸癌生物信息文獻(xiàn)突發(fā)值提取的名詞術(shù)語(yǔ)圖
結(jié)直腸癌生物信息領(lǐng)域的研究熱度近年來(lái)有所下降。初期以蔡世榮團(tuán)隊(duì)為主,主要研究裸鼠結(jié)直腸癌腫瘤生長(zhǎng)和臨床病例分析[9],中期以李秋文團(tuán)隊(duì)為主,主要研究一些特定基因甲基化在結(jié)直腸癌早期診斷中的應(yīng)用[10]。后期以李世擁團(tuán)隊(duì)為主,主要研究特定蛋白在結(jié)直腸癌組織中的表達(dá)及臨床意義[11]。
不同團(tuán)隊(duì)和時(shí)期對(duì)該問(wèn)題的研究角度方法均不同,也表現(xiàn)在團(tuán)隊(duì)和機(jī)構(gòu)間合作并不緊密,之前涌現(xiàn)的研究力量主要集中在生物信息方面,雖然總結(jié)了大量臨床病例,但尚未形成穩(wěn)定的研究方向。這也提示我們,下一步關(guān)于結(jié)直腸癌的研究應(yīng)該在總結(jié)臨床實(shí)踐經(jīng)驗(yàn)和研究生物信息的基礎(chǔ)上尋求突破點(diǎn)。