徐玲玲 朱小惠
(1浙江師范大學(xué)學(xué)術(shù)期刊社 金華 321004 2浙江工業(yè)大學(xué)學(xué)術(shù)期刊社 杭州 310014)
隨著互聯(lián)網(wǎng)、云計算技術(shù)的迅猛發(fā)展,各個領(lǐng)域產(chǎn)生了海量數(shù)據(jù)且呈幾何級數(shù)增長,“大數(shù)據(jù)”作為新的專業(yè)術(shù)語和生產(chǎn)要素引起各界重視[1],數(shù)據(jù)挖掘利用與數(shù)據(jù)分析手段已迅速擴(kuò)散和滲透到各個領(lǐng)域。面對互聯(lián)網(wǎng)中信息如潮涌的大數(shù)據(jù),尤其是數(shù)量龐大的科技論文,科技期刊的組稿策劃如何在大數(shù)據(jù)時代脫穎而出,獲得創(chuàng)新發(fā)展,絕非編輯重復(fù)以往的工作模式即可達(dá)成的[2]。長久以來,從組稿環(huán)節(jié)入手彰顯刊物特色被科技期刊奉為圭臬,期刊界同仁從不同角度出發(fā),對組稿策劃的目的與效果、作用與意義、方法與途徑進(jìn)行了相當(dāng)多積極有益的深入研究[3]。但科技期刊的報道范圍廣泛,已有文獻(xiàn)介紹的傳統(tǒng)組稿形式主要包括文獻(xiàn)查新、追蹤課題、問卷調(diào)查、編委約稿、同行借鑒等,組稿途徑總體偏簡單,且過于依賴編輯的隱性知識[4],導(dǎo)致選題前瞻性不強(qiáng)、時效性較差、精準(zhǔn)性不足,傳統(tǒng)組稿模式在數(shù)字化時代對信息深度挖掘和優(yōu)勢重組方面已存在諸多不適應(yīng)性亟需優(yōu)化,利用“數(shù)據(jù)分析”輔助“經(jīng)驗(yàn)判斷”,精準(zhǔn)把握學(xué)科發(fā)展動態(tài)和讀者關(guān)注熱點(diǎn),將成為今后大數(shù)據(jù)輔助出版工作的新途徑之一。
近年來,CiteSpace作為一種文本數(shù)據(jù)挖掘與分析工具,已成為信息分析中最具特色與影響力的科學(xué)知識可視化軟件,它通過探尋某一研究領(lǐng)域演變的關(guān)鍵路徑及其知識拐點(diǎn),分析出學(xué)科演變發(fā)展趨勢及研究熱點(diǎn),在化學(xué)、醫(yī)藥、農(nóng)業(yè)、圖書情報等數(shù)十個學(xué)科領(lǐng)域被廣泛應(yīng)用[5]。但CiteSpace在期刊編輯出版領(lǐng)域介紹或被應(yīng)用于編輯與出版工作實(shí)踐的研究卻仍停留在表層[6],而在編輯實(shí)踐中的優(yōu)勢應(yīng)用一直未能得到充分展現(xiàn),如作者與機(jī)構(gòu)共現(xiàn)功能,尤其是新版本推出的勾畫學(xué)科領(lǐng)域演變的時間線聚類功能等。因此,筆者借助CiteSpace從組稿這一科技期刊的基礎(chǔ)和突破環(huán)節(jié)入手,在學(xué)科研究熱點(diǎn)和趨勢的可視化方面展開探索,以期為更多的編輯同人開拓選題策劃的研究途徑提供有益的思索。
本研究選取CNKI作為數(shù)據(jù)源,利用CNKI的“高級檢索”功能,文獻(xiàn)分類目錄選定“生物學(xué)”,時間設(shè)為2011—2020年,以“肺癌”(發(fā)病率和死亡率雙高的一種惡性腫瘤)為主題,搜索出89051篇文獻(xiàn),其中頻次最高的關(guān)鍵詞為“非小細(xì)胞肺癌”。因此,本文于2021年03月21日以發(fā)文量最高的“非小細(xì)胞肺癌”為主題詞進(jìn)行檢索,來源類別設(shè)置為SCI、核心和CSCD,在剔除非論文文獻(xiàn)(新聞報道、征稿啟示等)后,得到6 479篇文章。CiteSpace 5.3.R8軟件設(shè)置參數(shù)時間切片=1,即數(shù)據(jù)抽取10個時間分段排名靠前的數(shù)據(jù)生成最終網(wǎng)絡(luò)。
從文獻(xiàn)計量學(xué)的角度根據(jù)研究機(jī)構(gòu)與學(xué)者間的聯(lián)絡(luò)頻次及互引關(guān)聯(lián)度,構(gòu)建合作網(wǎng)絡(luò),以挖掘該領(lǐng)域研究的重點(diǎn)團(tuán)隊及核心學(xué)者,出現(xiàn)頻次高的成員是推動研究發(fā)展的中堅力量。本研究利用CiteSpace中的Institution與Author模塊,閾值設(shè)置為20,對論文中的機(jī)構(gòu)與學(xué)者同時作為檢索源進(jìn)行可視化分析,快速定位核心學(xué)者所在機(jī)構(gòu)及成員間的合作關(guān)系(見圖1)。圖譜呈現(xiàn)有662個節(jié)點(diǎn),1 712條連線,網(wǎng)絡(luò)密度為0.0078,結(jié)果顯示,該領(lǐng)域形成了以國家腫瘤臨床醫(yī)學(xué)研究中心(頻次156次)、天津市腫瘤防治重點(diǎn)實(shí)驗(yàn)室(138次)、廣東省醫(yī)學(xué)科學(xué)院(122次)等多團(tuán)簇、眾星云集的代表性發(fā)文機(jī)構(gòu),同時形成了以程穎、張力、王長利等為代表的核心作者群。由圖1以作者、機(jī)構(gòu)聯(lián)合建立的共現(xiàn)圖譜可知,可視化分析能夠幫助編輯迅速尋找到國內(nèi)核心科研團(tuán)隊及學(xué)者,為組稿約稿建立核心作者庫、挖掘優(yōu)秀作者資源等提供極為便利的條件。
圖1 :非小細(xì)胞肺癌研究領(lǐng)域機(jī)構(gòu)與學(xué)者共現(xiàn)圖
CiteSpace 3.0版本新推出了勾畫學(xué)科領(lǐng)域演變的時間線聚類功能,它創(chuàng)新性地將時間引入到聚類網(wǎng)絡(luò)中,重點(diǎn)勾畫每個聚類(即子領(lǐng)域)發(fā)展演變關(guān)鍵路徑的歷史軌跡和時間跨度,以此分析研究領(lǐng)域演變發(fā)展趨勢,展現(xiàn)研究領(lǐng)域的最新研究方向。本研究將力圖展現(xiàn)該軟件在編輯工作實(shí)踐中的新功能,選擇Timeline視圖后,生成拱橋型時間線聚類圖譜(見圖2),X軸為引文發(fā)表年份,Y軸為知識子群,圖譜呈現(xiàn)177個節(jié)點(diǎn),1189條連線,密度0.076 3且模塊值Q=0.341 9(Q>0.3表明劃分出來的社團(tuán)結(jié)構(gòu)是顯著的),平均輪廓值S=0.627 2(S>0.5代表聚類合理)。
圖2顯示,非小細(xì)胞肺癌研究領(lǐng)域的知識子群包括化學(xué)治療、免疫治療、分子靶向治療、生物學(xué)特性、基因表達(dá)、放射治療等六個,但細(xì)究其各自發(fā)展歷程卻略有不同,因此編輯的組稿策劃也應(yīng)作出不同的調(diào)整。如化學(xué)治療的研究在早期保持了很高的熱度,隨后逐漸減少,表明該方向雖然發(fā)文量較大,但傳統(tǒng)化學(xué)藥物治療已不再是研究的熱點(diǎn),因此,需適量控制此方向的刊載量;免疫治療等研究主題一直貫穿至今,表明這些研究內(nèi)容持續(xù)被關(guān)注,發(fā)文量大,關(guān)注度高,符合目標(biāo)讀者需求,是期刊編輯的重點(diǎn)組稿策劃方向。特別是免疫治療知識子群研究走向持續(xù)增強(qiáng),表明該方向是熱點(diǎn)論文易于涌現(xiàn)的新方向,期刊編輯應(yīng)把握機(jī)遇,積極組織相應(yīng)專題吸引閱讀量和提高轉(zhuǎn)引,增加潛在作者數(shù)量,以進(jìn)一步提升期刊影響力;放射治療雖然作為知識子群之一,但只在早期有少量研究,表明此方向關(guān)注人數(shù)較少,較少的受眾可能會拉長文章的被引周期,因此應(yīng)謹(jǐn)慎控制相關(guān)方向的刊載量,以免影響期刊的關(guān)注度。
圖2 :非小細(xì)胞肺癌研究領(lǐng)域關(guān)鍵詞時間線聚類圖譜
通過CiteSpace時間線分析圖還可發(fā)現(xiàn),主要前沿領(lǐng)域已由化療等轉(zhuǎn)變?yōu)榉肿影邢蛑委煛D-L1、長鏈非編碼RNA、微小RNA等。面對不斷涌現(xiàn)的新興研究熱點(diǎn),編輯需時刻保持高度的信息敏銳性,適時調(diào)整組稿策劃方向的突破口,在處理稿件時做到有的放矢,抓住重點(diǎn),從最大程度去吸引讀者,并引導(dǎo)學(xué)者對研究熱點(diǎn)進(jìn)行更深入的研究和探討,以發(fā)揮期刊學(xué)術(shù)媒介在學(xué)科發(fā)展中的導(dǎo)向功能,推動科研創(chuàng)新。
稿件質(zhì)量是期刊提升影響力的前提和基礎(chǔ),而組稿策劃是提升稿件質(zhì)量的關(guān)鍵環(huán)節(jié)和重要抓手,面對復(fù)雜、多層面的稿源,編輯需要精準(zhǔn)、高效地判斷學(xué)術(shù)發(fā)展動態(tài)和讀者關(guān)注熱點(diǎn)。本研究的亮點(diǎn)在于依托CiteSpace軟件,注重通過大數(shù)據(jù)有效捕捉研究熱點(diǎn)、焦點(diǎn),以客觀、理性的佐證手段,提升辦刊人對學(xué)術(shù)前沿的把握能力和選題判斷能力,為期刊選題策劃在大數(shù)據(jù)時代獲得創(chuàng)新發(fā)展提供參考和建議。
當(dāng)前,大多數(shù)科技期刊編輯并非直接從事科研一線研究工作,因此從客觀上導(dǎo)致其缺乏對前沿學(xué)術(shù)信息的了解,缺乏學(xué)術(shù)敏感性[7]。面對海量論文,期刊編輯應(yīng)在組稿策劃環(huán)節(jié)避免“盲人摸象”,積極主動地通過各種方式獲取學(xué)術(shù)前沿信息。CiteSpace作為一款實(shí)用的可視化分析軟件,安裝簡便,入門簡單,操作便捷。以本研究為例,目標(biāo)文本文件下載保存后,軟件每次分析結(jié)果生成圖像僅需2分鐘左右,因此,CiteSpace有望成為編輯做好選題策劃的制勝法寶之一。它通過數(shù)據(jù)庫中豐富文本信息的獲取,將文本數(shù)據(jù)的挖掘融入到科技期刊的組稿策劃環(huán)節(jié)之中,可深層次地挖掘數(shù)據(jù)背后潛在的發(fā)展趨勢,幫助期刊編輯精準(zhǔn)把握學(xué)科研究發(fā)展需要、動態(tài)變化和學(xué)科特色,提升編輯出版工作的效率與質(zhì)量。在大數(shù)據(jù)共享思維下,編輯作為科技共同體中的重要一環(huán),應(yīng)打破固有思維模式,構(gòu)建與時代相匹配的專業(yè)素質(zhì),如數(shù)據(jù)處理能力、網(wǎng)絡(luò)數(shù)據(jù)分析能力,對獲取的海量數(shù)據(jù)進(jìn)行學(xué)術(shù)趨勢和知識脈絡(luò)分析,從而得到更多的基于數(shù)據(jù)分析結(jié)果的組稿策劃思路,為期刊選題組稿呈現(xiàn)更多的精品和亮點(diǎn)。
高質(zhì)量的稿件是科技期刊發(fā)展之根本,高素質(zhì)的作者群則是高質(zhì)量稿件充滿生機(jī)與活力的源泉。傳統(tǒng)的組稿方式主要依賴編委的人脈和編輯的主觀意識,而CiteSpace通過大數(shù)據(jù)檢索分析相關(guān)領(lǐng)域論文的發(fā)文量和關(guān)鍵詞,通過頻次和中介中心性直接生成作者與機(jī)構(gòu)的可視化分析圖譜,據(jù)此快速構(gòu)建發(fā)文質(zhì)量高、科研能力強(qiáng)、引領(lǐng)研究發(fā)展方向的重點(diǎn)機(jī)構(gòu)及核心學(xué)者畫像,較為精準(zhǔn)地挖掘?qū)W者的科研能力、學(xué)術(shù)動態(tài)、擅長領(lǐng)域等,再根據(jù)其合作和互引圖譜,進(jìn)一步挖掘與其密切關(guān)聯(lián)的其他優(yōu)質(zhì)作者群體。立足核心機(jī)構(gòu)的優(yōu)質(zhì)作者群,針對領(lǐng)域內(nèi)細(xì)分的知識子群聚類,讓辦刊人在組稿策劃階段做到及時響應(yīng),快速選擇期刊主題,提升組稿策劃方向的精準(zhǔn)性、前瞻性和科學(xué)性。通過準(zhǔn)確預(yù)測讀者需求及對研究主題的深度挖掘和梳理,使選題方向更為準(zhǔn)確,選題過程更為科學(xué),辦刊資源配置更為合理。期刊編輯有意識地將工作重心轉(zhuǎn)移到影響力強(qiáng)的期刊主題上,有助于凝煉出期刊的特色專欄,對促進(jìn)期刊品牌發(fā)展產(chǎn)生廣泛而深遠(yuǎn)的學(xué)術(shù)影響。
本文基于CNKI數(shù)據(jù)庫,在前人工作基礎(chǔ)上,完善性地提出一種組稿策劃新思路——利用CiteSpace軟件對研究領(lǐng)域發(fā)表論文的文本大數(shù)據(jù)進(jìn)行挖掘和分析。當(dāng)前,大數(shù)據(jù)技術(shù)發(fā)展方興未艾,期刊編輯利用大數(shù)據(jù)的思維和技術(shù),以出版流程的組稿策劃環(huán)節(jié)為抓手,一方面可以大幅增加研究樣本量,對學(xué)科信息進(jìn)行深度挖掘,如核心機(jī)構(gòu)、優(yōu)質(zhì)作者群、研究前沿、發(fā)展趨勢等潛在信息,另一方面可以極大改善編輯出版工作的質(zhì)量與效率。本文提出將CiteSpace軟件應(yīng)用于編輯與出版學(xué)領(lǐng)域,對拓寬組稿策劃的研究途徑進(jìn)行了客觀分析,并進(jìn)行了較為全面的展示。鑒于此,本文希望通過此研究,為期刊編輯從事編輯出版學(xué)研究提供新技術(shù)、新方法和新思路,以此引發(fā)同行共鳴,為拓展完善該領(lǐng)域研究,起到拋磚引玉的作用。■