彭秋茹 閻素蘭
收稿日期:2020-07-17
基金項(xiàng)目:國(guó)家社會(huì)科學(xué)基金項(xiàng)目“融合ALTMETRICS的科研影響力綜合評(píng)價(jià)方法及實(shí)證研究”(項(xiàng)目編號(hào):15BTQ060);南京農(nóng)業(yè)大學(xué)中央高?;究蒲袠I(yè)務(wù)費(fèi)人文社會(huì)科學(xué)研究基金項(xiàng)目(項(xiàng)目編號(hào):SKYC2020023);江蘇高校哲學(xué)社會(huì)科學(xué)研究一般項(xiàng)目(項(xiàng)目編號(hào):2020SJA0055)。
作者簡(jiǎn)介:彭秋茹(1990-),女,助理研究員,博士,研究方向:信息計(jì)量與科研評(píng)價(jià)。
通訊作者:閻素蘭(1972-),女,副教授,碩士生導(dǎo)師,研究方向:信息計(jì)量。
摘要:[目的/意義]隨著社交媒體等網(wǎng)絡(luò)平臺(tái)在科學(xué)研究、傳播、交流中的普及應(yīng)用,一種基于社會(huì)媒體平臺(tái)和工具的影響力評(píng)價(jià)方法——Altmetrics應(yīng)運(yùn)而生并引起廣泛關(guān)注,但面向中文學(xué)術(shù)論文的Altmetrics指標(biāo)研究卻比較缺乏。[方法/過程]本文以《光明日?qǐng)?bào)》理論版論文為研究對(duì)象,利用百度搜索引擎技術(shù)采集中文報(bào)紙論文的Altmetrics數(shù)據(jù),構(gòu)建Altmetrics指標(biāo)體系,進(jìn)而分析不同網(wǎng)絡(luò)平臺(tái)關(guān)注中文報(bào)紙論文的程度,舉例探討中文報(bào)紙論文在網(wǎng)絡(luò)傳播的過程,研究中文報(bào)紙論文在網(wǎng)絡(luò)中受到關(guān)注的現(xiàn)象及特征。[結(jié)果/結(jié)論]研究結(jié)果表明利用搜索引擎技術(shù)可以有效解決Altmetrics本地化的問題,中文報(bào)紙論文在網(wǎng)絡(luò)中受到各類新聞媒體的關(guān)注較多,且傳播速度快,加工后的中文報(bào)紙論文可能會(huì)產(chǎn)生更為久遠(yuǎn)的影響。
關(guān)鍵詞:Altmetrics;中文學(xué)術(shù)論文;報(bào)紙論文;網(wǎng)絡(luò)關(guān)注
DOI:10.3969/j.issn.1008-0821.2021.04.014
〔中圖分類號(hào)〕G250.252〔文獻(xiàn)標(biāo)識(shí)碼〕A〔文章編號(hào)〕1008-0821(2021)04-0146-08
Research on Altmetrics Indicators for Chinese Academic Articles
——Taking Newspaper Articles for An Example
Peng QiuruYan Sulan*
(School of Information Management,Nanjing Agricultural University,Nanjing 210095,China)
Abstract:[Purpose/Significance]With the popularity and application of social media in scientific research and communication,Altmetrics,an impact evaluation method based on social media platforms and tools,came into being and attracted wide attention.However,there is a lack of research on Altmetrics for Chinese articles.[Method/Process]This paper took the articles published on the theoretical pages of Guangming Daily as the research objects,used Baidu search engine technology to collect the Altmetrics data,constructed the Altmetrics indicators system,and studied the phenomenon and characteristics of mention to Chinese newspaper articles online based on analysis on the attention degree from different sources and discussion about the process of transmission.[Result/Conclusion]The results showed that the localization of Altmetrics can be effectively solved by using search engine technology.Chinese newspaper articles attracted more attention from all kinds of news media online,and the dissemination speed was fast.The processed Chinese newspaper articles may have a longer-term impact.
Key words:Altmetrics;Chinese academic articles;newspaper articles;online attention
隨著網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,學(xué)術(shù)論文通過網(wǎng)絡(luò)媒體的傳播可以被更廣泛的社會(huì)公眾所認(rèn)識(shí)和利用,科學(xué)研究不再是象牙塔里的知識(shí)分子才能接觸的世界。網(wǎng)絡(luò)傳播有利于科學(xué)技術(shù)的普及與科研成果的推廣,進(jìn)一步傳播科學(xué)思想與弘揚(yáng)科學(xué)精神。同時(shí),科研人員之間也越來越喜歡通過網(wǎng)絡(luò)平臺(tái)對(duì)學(xué)術(shù)論文進(jìn)行討論和使用,學(xué)術(shù)論文在網(wǎng)絡(luò)媒體上越來越受到關(guān)注和傳播。通過考察學(xué)術(shù)論文在網(wǎng)絡(luò)媒體中的受到關(guān)注的情況,使得社會(huì)公眾閱讀和使用學(xué)術(shù)論文的交流過程可被計(jì)量。基于學(xué)術(shù)引用的引文分析方法[1]不再是測(cè)量學(xué)術(shù)論文影響力的唯一手段,學(xué)術(shù)論文在網(wǎng)絡(luò)社會(huì)中被傳播和關(guān)注的程度可以反映學(xué)術(shù)論文的社會(huì)影響力。
2010年P(guān)riem J等[2]首次提出Altmetrics,它是基于社會(huì)傳媒平臺(tái)和工具的、評(píng)價(jià)影響力的一種可選方法[3]。Altmetrics的提出是旨在衡量由網(wǎng)絡(luò)驅(qū)動(dòng)的學(xué)術(shù)交互[4],利用Altmetrics可以跟蹤和分析多種類型學(xué)術(shù)成果的網(wǎng)絡(luò)活動(dòng),借助Altmetrics指標(biāo)數(shù)據(jù)可以測(cè)量學(xué)術(shù)成果在網(wǎng)絡(luò)中受到不同網(wǎng)絡(luò)平臺(tái)關(guān)注的程度。本文意圖獲取中文學(xué)術(shù)論文的Altmetrics指標(biāo)數(shù)據(jù),分析中文學(xué)術(shù)論文在網(wǎng)絡(luò)中受到關(guān)注的現(xiàn)象及特征,從而探討中文學(xué)術(shù)論文的社會(huì)價(jià)值和意義。
1相關(guān)研究
早期國(guó)內(nèi)外針對(duì)學(xué)術(shù)論文的Altmetrics研究較多關(guān)注引文指標(biāo)與Altmetrics指標(biāo)之間的聯(lián)系[5-7],后來越來越多的研究探討學(xué)術(shù)論文在網(wǎng)絡(luò)中受到關(guān)注的現(xiàn)象和特征。Haustein S等[8]調(diào)查了學(xué)科、文獻(xiàn)類型、標(biāo)題長(zhǎng)度、頁數(shù)和參考文獻(xiàn)數(shù)等特征與5種不同Altmetrics指標(biāo)之間的聯(lián)系,研究發(fā)現(xiàn)社交媒體上提及學(xué)術(shù)論文的總體數(shù)量很少,社論和新聞這兩種論文類型很少被引用,但在Twitter上卻最受歡迎。Holmberg K等[9]則探討了學(xué)術(shù)論文獲得更多網(wǎng)絡(luò)關(guān)注和更高Altmetrics評(píng)分的原因,研究發(fā)現(xiàn)不同的網(wǎng)絡(luò)平臺(tái)對(duì)論文的關(guān)注程度存在著差異,在Mendeley上受到極大關(guān)注的論文更多是學(xué)術(shù)界的讀者所引起的,而在Twitter上引起關(guān)注的原因與更廣泛的社會(huì)公眾讀者有關(guān)。邱均平等[10]分析了2016—2018年Altmetrics前100名的學(xué)術(shù)論文的來源機(jī)構(gòu)、來源期刊、所屬學(xué)科及傳播途徑等特征,研究發(fā)現(xiàn)大多數(shù)論文受到News Stories、Blog Post、Twitter、Facebook、Reddit、Coogle+、Wikipedia Citations和Videos等網(wǎng)絡(luò)平臺(tái)的關(guān)注。除了研究學(xué)術(shù)論文受到網(wǎng)絡(luò)關(guān)注的來源平臺(tái)外,部分學(xué)者還從時(shí)間維度探討了學(xué)術(shù)論文發(fā)表后在網(wǎng)絡(luò)中受到關(guān)注的變化情況。Wang X W等[11]利用110篇學(xué)術(shù)論文的90天的Altmetrics指標(biāo)數(shù)據(jù),考察了學(xué)術(shù)論文發(fā)表后在社交媒體上受到關(guān)注的變化情況,研究發(fā)現(xiàn)Twitter和Facebook是兩種最重要的社交推薦方式,來自社交媒體的關(guān)注累積速度較快,但衰退速度也快。魏緒秋等[12]提出了學(xué)術(shù)論文階段重要性指標(biāo)和學(xué)術(shù)論文階段持續(xù)性指標(biāo),對(duì)學(xué)術(shù)論文的Altmetrics數(shù)據(jù)特征進(jìn)行了分析,研究發(fā)現(xiàn)大部分學(xué)術(shù)論文的社交活躍期相對(duì)較早且持續(xù)性較短。田玥等[13]利用Altmetrics數(shù)據(jù)分析了生物醫(yī)學(xué)領(lǐng)域?qū)W術(shù)論文在網(wǎng)絡(luò)中的關(guān)注度,探索了影響論文關(guān)注度的因素,研究發(fā)現(xiàn)論文發(fā)表后3天是關(guān)注的巔峰期。
由于缺少數(shù)據(jù)和工具的支持,現(xiàn)有的針對(duì)學(xué)術(shù)論文的Altmetrics研究主要以英文論文為主,個(gè)別國(guó)內(nèi)學(xué)者嘗試基于使用習(xí)慣或模仿以英文學(xué)術(shù)論文為對(duì)象的研究來獲取和分析中文學(xué)術(shù)論文的Altmetrics數(shù)據(jù)。王艷波等[14]和易淑瓊等[15]選擇了豆丁網(wǎng)、道客巴巴、百度文庫作為中文學(xué)術(shù)論文的Altmetrics數(shù)據(jù)來源。王蘿娜等[16]設(shè)計(jì)的Altmetrics數(shù)據(jù)來源更為廣泛,包括新聞媒體、文獻(xiàn)管理、百科智庫、社交媒體、學(xué)術(shù)社區(qū)5個(gè)大類,共搜集了科學(xué)網(wǎng)、百度文庫、豆丁網(wǎng)、道客巴巴、360個(gè)人圖書館、MBA智庫百科、新浪微博、新浪博客、微信公眾號(hào)、知乎、丁香園、小木蟲等12個(gè)平臺(tái)。但與國(guó)外研究相比,在研究?jī)?nèi)容廣度和深度上國(guó)內(nèi)網(wǎng)絡(luò)平臺(tái)用于Altmetrics的適用性分析研究都處于落后的狀態(tài)[17]。學(xué)者們主觀設(shè)計(jì)的Altmetrics指標(biāo)和數(shù)據(jù)來源也無法真實(shí)、客觀、全面地反映中文學(xué)術(shù)論文在網(wǎng)絡(luò)中受到關(guān)注的現(xiàn)象和特征。彭秋茹等[18]在構(gòu)建報(bào)紙論文影響力評(píng)價(jià)方法時(shí)提到利用搜索引擎作為搜集中文報(bào)紙論文的Altmetrics數(shù)據(jù)的手段,但文章沒有詳細(xì)描述數(shù)據(jù)采集和預(yù)處理的過程,也缺少對(duì)中文報(bào)紙論文在網(wǎng)絡(luò)中傳播的范圍和過程的分析和研究。因此,本文將設(shè)計(jì)中文學(xué)術(shù)論文的Altmetrics指標(biāo)數(shù)據(jù)獲取的方法,以中文報(bào)紙論文為例構(gòu)建Altmetrics指標(biāo)體系,分析關(guān)注中文報(bào)紙論文的網(wǎng)絡(luò)平臺(tái)分布范圍,舉例探討中文報(bào)紙論文發(fā)表后的網(wǎng)絡(luò)關(guān)注過程,研究中文報(bào)紙論文的網(wǎng)絡(luò)關(guān)注現(xiàn)象及特征。
2數(shù)據(jù)采集與預(yù)處理
Altmetrics考察的是學(xué)術(shù)成果在社會(huì)網(wǎng)絡(luò)上發(fā)生交互的情況,也就是說,學(xué)術(shù)成果的Altmetrics評(píng)價(jià)結(jié)果測(cè)量的是學(xué)術(shù)成果在不同的網(wǎng)絡(luò)平臺(tái)(例如社交媒體、主流新聞媒體和在線分享社區(qū)等)上的關(guān)注度。因此,Altmetric.com、ImpactStory、PlumX、PLOS ALMs等國(guó)外常用的Altmetrics數(shù)據(jù)聚合工具都以尋找更多樣、更全面的學(xué)術(shù)成果網(wǎng)絡(luò)關(guān)注數(shù)據(jù)源為主要任務(wù)。在中文環(huán)境下對(duì)學(xué)術(shù)論文網(wǎng)絡(luò)關(guān)注情況進(jìn)行研究時(shí),首先要考察學(xué)術(shù)論文在中文網(wǎng)絡(luò)中受到哪些平臺(tái)的關(guān)注,并且要盡量尋找全面和多樣的學(xué)術(shù)論文網(wǎng)絡(luò)關(guān)注數(shù)據(jù)源。
2.1數(shù)據(jù)采集方法
國(guó)外各大Altmetrics數(shù)據(jù)聚合工具在統(tǒng)計(jì)學(xué)術(shù)成果的Altmetrics指標(biāo)數(shù)據(jù)時(shí),一般是基于學(xué)術(shù)成果的唯一標(biāo)識(shí)符(例如DOI、PubMed ID、arXiv ID等)來捕獲提及學(xué)術(shù)成果的網(wǎng)頁數(shù)據(jù)[19]。但經(jīng)過調(diào)研發(fā)現(xiàn),國(guó)內(nèi)網(wǎng)絡(luò)平臺(tái)在關(guān)注中文學(xué)術(shù)論文時(shí)鮮有附帶表示論文出處的唯一標(biāo)識(shí)(例如URL),所以無法通過唯一標(biāo)識(shí)符來追蹤中文學(xué)術(shù)論文的網(wǎng)絡(luò)傳播痕跡。要想獲得中文學(xué)術(shù)論文較為全面的Altmetrics數(shù)據(jù),搜索引擎是一個(gè)很好的技術(shù)支持手段。搜索引擎是一種在網(wǎng)絡(luò)上對(duì)信息進(jìn)行收集、提取、組織、處理并提供檢索服務(wù)的工具,極大地改善了用戶的網(wǎng)絡(luò)信息獲取的過程和效果[20],可以通過搜索引擎來簡(jiǎn)化獲取網(wǎng)絡(luò)信息的過程。通過搜索引擎的檢索功能,可以較為全面和客觀地獲取中文學(xué)術(shù)論文在網(wǎng)絡(luò)中受到關(guān)注的信息。由于搜索引擎Google不能在境內(nèi)訪問,并且Google過濾了大量PR值較低的頁面,因此在網(wǎng)頁數(shù)據(jù)采集方面可能存在嚴(yán)重誤差。作為中國(guó)搜索引擎市場(chǎng)份額占比最大的中文搜索引擎[21],百度搜索索引了絕大多數(shù)較為權(quán)威的新聞網(wǎng)站、論壇、博客、政府、科技、教育和學(xué)術(shù)網(wǎng)站,可以最大程度上滿足網(wǎng)絡(luò)傳播分析中的數(shù)據(jù)采集覆蓋率要求。因此,本文將通過百度搜索來采集針對(duì)中文學(xué)術(shù)論文的Altmetrics數(shù)據(jù)并構(gòu)建相應(yīng)的指標(biāo)體系。
1)中文學(xué)術(shù)論文Altmetrics數(shù)據(jù)采集
本文將中文學(xué)術(shù)論文的加雙引號(hào)的“題名”作為檢索詞,在百度搜索中進(jìn)行檢索,并記錄每篇中文學(xué)術(shù)論文的相關(guān)結(jié)果數(shù)。由于題名不是表示特定中文學(xué)術(shù)論文身份的唯一標(biāo)識(shí),所以題名越簡(jiǎn)單越容易產(chǎn)生更多與目標(biāo)中文學(xué)術(shù)論文不相關(guān)的檢索結(jié)果。為了減少噪音數(shù)據(jù)的影響、提高數(shù)據(jù)清洗的可操作性,在檢索中文學(xué)術(shù)論文時(shí)可以分兩輪進(jìn)行。第一輪檢索先記錄每篇中文學(xué)術(shù)論文的檢索結(jié)果數(shù),將1 000條設(shè)為檢索結(jié)果是否合理的標(biāo)準(zhǔn)。第二輪檢索時(shí),對(duì)第一輪檢索結(jié)果合理范圍內(nèi)外的中文學(xué)術(shù)論文采取不同的檢索策略,對(duì)第一輪檢索結(jié)果合理的中文學(xué)術(shù)論文重新按照題名加雙引號(hào)進(jìn)行檢索,對(duì)其余中文學(xué)術(shù)論文增加文獻(xiàn)來源、發(fā)表年份、作者等檢索詞進(jìn)行檢索。然后利用爬蟲程序采集百度搜索的檢索結(jié)果數(shù)據(jù),記錄下每條中文學(xué)術(shù)論文檢索結(jié)果的檢索詞、檢索頁面文本數(shù)據(jù)、檢索結(jié)果百度鏈接、跳轉(zhuǎn)后的原文鏈接等信息。
2)中文學(xué)術(shù)論文Altmetrics數(shù)據(jù)清洗
根據(jù)百度搜索檢索結(jié)果可以獲取中文學(xué)術(shù)論文在網(wǎng)絡(luò)上受到關(guān)注的信息。匯總有關(guān)中文學(xué)術(shù)論文的檢索結(jié)果后,再對(duì)檢索結(jié)果中的原文鏈接數(shù)據(jù)進(jìn)行處理。首先截取原文鏈接的二級(jí)域名(如baidu.com)及三級(jí)域名(如wenku.baidu.com)并保存。然后利用域名查詢工具(whois.chianz.com)的備案查詢功能對(duì)二級(jí)域名進(jìn)行標(biāo)準(zhǔn)化處理,通過緩存數(shù)據(jù)更新等方法重復(fù)核查,并對(duì)域名數(shù)據(jù)進(jìn)行去重,排除未備案或備案取消的域名,最終獲得檢索結(jié)果中的有效域名。由于百度搜索存在擴(kuò)檢現(xiàn)象,結(jié)合域名信息進(jìn)一步通過人工校對(duì)的方式對(duì)檢索出來的中文學(xué)術(shù)論文Altmetrics數(shù)據(jù)進(jìn)行清洗。
3)中文學(xué)術(shù)論文Altmetrics數(shù)據(jù)統(tǒng)計(jì)
最后,通過對(duì)清洗過的中文學(xué)術(shù)論文檢索結(jié)果中的有效域名及備案信息進(jìn)行統(tǒng)計(jì)和分析,可以得到中文學(xué)術(shù)論文在網(wǎng)絡(luò)中受到關(guān)注的來源平臺(tái)情況。根據(jù)Altmetrics指標(biāo)構(gòu)建的思想,關(guān)注中文學(xué)術(shù)論文的網(wǎng)絡(luò)平臺(tái)決定了中文學(xué)術(shù)論文Altmetrics指標(biāo)。借鑒國(guó)外常用的Altmetrics數(shù)據(jù)聚合工具的指標(biāo)采集來源及分類方法[22-25],在網(wǎng)絡(luò)中關(guān)注學(xué)術(shù)成果的行為可以分為瀏覽、保存、提及、討論、推薦、引用等類型。針對(duì)中文學(xué)術(shù)論文的網(wǎng)絡(luò)關(guān)注研究也可以根據(jù)上述類型構(gòu)建相應(yīng)的Altmetrics指標(biāo),從而對(duì)中文學(xué)術(shù)論文的Altmetrics數(shù)據(jù)進(jìn)行統(tǒng)計(jì)和分析。與國(guó)外Altmetrics數(shù)據(jù)聚合工具的指標(biāo)體系不一致的是,由于中文學(xué)術(shù)論文的引用研究更適合利用傳統(tǒng)的引文數(shù)據(jù)庫數(shù)據(jù)進(jìn)行引文分析,本文關(guān)于中文學(xué)術(shù)論文的Altmetrics指標(biāo)研究不討論中文學(xué)術(shù)論文的引用特征。
2.2數(shù)據(jù)采集對(duì)象
中文報(bào)紙論文,指的是發(fā)表在中文報(bào)紙上的學(xué)術(shù)論文,不包括新聞稿件等,最典型的是國(guó)內(nèi)各大報(bào)紙的理論版所刊載的中文論文[18]。中文報(bào)紙論文有效地銜接了學(xué)術(shù)理論和大眾常識(shí),從而做到既以理性的視角展示了時(shí)代大局,又能切中普通大眾的興趣點(diǎn)[26]。中文報(bào)紙論文與期刊論文一樣是讀者利用文獻(xiàn)獲取知識(shí)的手段之一,是知識(shí)發(fā)現(xiàn)與傳播的有效途徑之一。除此之外,中文報(bào)紙論文依托報(bào)紙這類大眾媒體廣泛且不分層級(jí)的傳播方式得到了超越期刊論文的閱讀量和傳播量,其社會(huì)影響力更為廣泛。
本文以中文報(bào)紙論文的典型代表——《光明日?qǐng)?bào)》理論版論文為采集對(duì)象?!豆饷魅?qǐng)?bào)》理論版論文較其它中文報(bào)紙論文具有一定的優(yōu)勢(shì),其刊載的中文報(bào)紙論文學(xué)術(shù)性更強(qiáng),文章結(jié)構(gòu)更接近于一般學(xué)術(shù)論文;《光明日?qǐng)?bào)》理論版刊發(fā)數(shù)量較多,主題覆蓋面相對(duì)較廣;《光明日?qǐng)?bào)》理論版報(bào)紙論文受到學(xué)術(shù)界的引用相對(duì)較多,同時(shí)也受到網(wǎng)絡(luò)媒體和用戶的廣泛關(guān)注。在采集樣本的選擇上,考慮到最新發(fā)表的論文有一部分還未進(jìn)入大眾視野,而年代過于久遠(yuǎn)的論文與當(dāng)前時(shí)事存在脫節(jié)現(xiàn)象。本文選擇2014年發(fā)表于《光明日?qǐng)?bào)》理論版的1 363篇報(bào)紙論文作為采集對(duì)象,并利用百度搜索的搜索工具限定數(shù)據(jù)采集截止時(shí)間為2017年4月30日。通過采集這些中文報(bào)紙論文在百度搜索中的檢索結(jié)果數(shù)據(jù),可以進(jìn)一步分析中文報(bào)紙論文在網(wǎng)絡(luò)中受到關(guān)注的情況。
3數(shù)據(jù)分析和討論
經(jīng)過兩輪數(shù)據(jù)采集后得到中文報(bào)紙論文的檢索結(jié)果共51 862條,這51 862條數(shù)據(jù)中有50 605條數(shù)據(jù)的原始網(wǎng)址是有效鏈接,通過清洗后獲得有域名信息的49 932條數(shù)據(jù)。對(duì)這49 932條數(shù)據(jù)中的網(wǎng)址信息進(jìn)行域名標(biāo)準(zhǔn)化處理,去重后共獲得4 317個(gè)二級(jí)域名,其中3 552個(gè)二級(jí)域名有注冊(cè)備案信息,819個(gè)二級(jí)域名未備案或備案取消。將3 552個(gè)有效二級(jí)域名通過網(wǎng)站名稱、注冊(cè)單位等信息來對(duì)中文報(bào)紙論文檢索結(jié)果來源網(wǎng)站進(jìn)行分類,分類結(jié)果如表1所示。
由表1可知,中文報(bào)紙論文在百度搜索的檢索結(jié)果來源網(wǎng)站有約半數(shù)(1 550個(gè))為企業(yè)信息網(wǎng)站,而這些企業(yè)信息網(wǎng)站的工作原理是通過爬取不同來源的網(wǎng)頁進(jìn)行單純的網(wǎng)頁信息集成,大部分企業(yè)信息網(wǎng)站存在著大量的廣告信息,這些企業(yè)信息網(wǎng)站對(duì)報(bào)紙論文的傳播作用較小,因此本文不把該類型網(wǎng)站視為中文報(bào)紙論文的網(wǎng)絡(luò)關(guān)注來源。另外百度搜索檢索結(jié)果中還存在其它一些問題:由于百度搜索具有擴(kuò)檢功能,根據(jù)題名信息檢索得到的數(shù)據(jù)存在著大量與中文報(bào)紙論文實(shí)際內(nèi)容不相關(guān)的結(jié)果;檢索結(jié)果中含有中文報(bào)紙論文作為參考文獻(xiàn)的網(wǎng)頁內(nèi)容;部分網(wǎng)站對(duì)中文報(bào)紙論文的總關(guān)注次數(shù)過少。因此,為了更加準(zhǔn)確地考察中文報(bào)紙論文在網(wǎng)絡(luò)中受到關(guān)注的現(xiàn)象和特征,進(jìn)一步根據(jù)百度搜索檢索結(jié)果的文本內(nèi)容及相關(guān)網(wǎng)站信息進(jìn)行人工清洗和整理。參考已有的Altmetrics指標(biāo)體系,得到中文報(bào)紙論文Altmetrics指標(biāo)如表2所示。
表2羅列了中文報(bào)紙論文Altmetrics指標(biāo)及來源,可以知道中文報(bào)紙論文在網(wǎng)絡(luò)中受到國(guó)家新聞媒體、地方新聞媒體、社會(huì)新聞媒體、理論宣傳媒體、政府機(jī)構(gòu)、教育機(jī)構(gòu)、社會(huì)團(tuán)體、文檔分享平臺(tái)、微博、博客、在線交流社區(qū)等網(wǎng)絡(luò)平臺(tái)的關(guān)注。而根據(jù)國(guó)外常用的Altmetrics數(shù)據(jù)聚合工具的指標(biāo)采集來源[22-25]來看,英文學(xué)術(shù)論文受到主流新聞媒體、政府或非政府組織、在線交流社區(qū)、博客、微博等社交媒體、百科網(wǎng)站、問答網(wǎng)站、數(shù)據(jù)或文檔分享平臺(tái)、在線參考文獻(xiàn)管理工具等網(wǎng)絡(luò)平臺(tái)的關(guān)注。與英文學(xué)術(shù)論文不同的是,中文報(bào)紙論文的網(wǎng)絡(luò)關(guān)注來源平臺(tái)沒有出現(xiàn)在線參考文獻(xiàn)管理工具,可能的原因是國(guó)內(nèi)參考文獻(xiàn)管理工具以本地單機(jī)使用為主,而在線參考文獻(xiàn)管理平臺(tái)較少,所以百度搜索無法搜集參考文獻(xiàn)管理工具單機(jī)用戶的數(shù)據(jù)。關(guān)于百科和問答網(wǎng)站平臺(tái),研究對(duì)象受到百度百科、互動(dòng)百科、搜狗百科等百科網(wǎng)站以及百度知道、新浪愛問、搜狗問問、作業(yè)幫等問答平臺(tái)關(guān)注的總次數(shù)皆不大于10次,這兩類平臺(tái)對(duì)中文報(bào)紙論文的關(guān)注可以忽略不計(jì)。另外由于中文報(bào)紙論文具有新聞傳播特性,尤其受到各種類型新聞媒體的關(guān)注和傳播,關(guān)注數(shù)據(jù)也主要集中來源于各類型的新聞媒體網(wǎng)站,因此本文將新聞媒體提及量指標(biāo)根據(jù)新聞媒體類型的不同進(jìn)行了進(jìn)一步地分類。與其他形式的學(xué)術(shù)成果相比,中文報(bào)紙論文作為國(guó)家政策和方針理論宣傳的重要載體,成為理論宣傳媒體重點(diǎn)參考的文獻(xiàn)來源。然后對(duì)1 363篇中文報(bào)紙論文的Altmetrics指標(biāo)值進(jìn)行匯總計(jì)算,得到統(tǒng)計(jì)信息如表3所示。
由表3可以知道,1 363篇中文報(bào)紙論文在不同類型的新聞媒體、理論宣傳媒體、教育機(jī)構(gòu)網(wǎng)站、文檔分享平臺(tái)中受到的關(guān)注較多,在政府機(jī)構(gòu)網(wǎng)站、社會(huì)團(tuán)體網(wǎng)站、微博、博客、在線交流社區(qū)中受到的關(guān)注較少。Altmetrics指標(biāo)中社會(huì)新聞媒體提及量總和、均值和中值是所有指標(biāo)中最大的,說明中文報(bào)紙論文在網(wǎng)絡(luò)中最常被鳳凰新聞、和訊新聞、求是網(wǎng)等社會(huì)新聞媒體所提及。而微博討論量在所有指標(biāo)中總和、最大值、最小值、均值和中值都為最小,說明中文報(bào)紙論文在微博中的受到關(guān)注的程度較其它類型網(wǎng)絡(luò)平臺(tái)要小,以娛樂為主的社交媒體用戶對(duì)于具有學(xué)術(shù)性質(zhì)的中文報(bào)紙論文的討論熱情較低,但也有可能是由于微博平臺(tái)的限制導(dǎo)致百度搜索存在數(shù)據(jù)不全的現(xiàn)象。雖然中文報(bào)紙論文在文檔分享平臺(tái)保存量總和不足社會(huì)新聞媒體的一半,但最大值卻是所有指標(biāo)中的第一,高達(dá)44次,說明存在部分中文報(bào)紙論文被文檔分享平臺(tái)的用戶多次保存和轉(zhuǎn)發(fā),在文檔分享平臺(tái)中的影響較大。
將1 363篇中文報(bào)紙論文按總關(guān)注次數(shù)降序排列,選取前10名網(wǎng)絡(luò)關(guān)注度較高的中文報(bào)紙論文的Altmetrics指標(biāo)數(shù)據(jù)作進(jìn)一步分析,前10名的中文報(bào)紙論文Altmetrics指標(biāo)數(shù)據(jù)如圖1所示。
由圖1可以知道,總關(guān)注次數(shù)排名前10的中文報(bào)紙論文有8篇受到的網(wǎng)絡(luò)關(guān)注來源分布大體一致,源于地方新聞媒體和社會(huì)新聞媒體的關(guān)注占所有關(guān)注的較大部分。1 363篇中文報(bào)紙論文中網(wǎng)絡(luò)關(guān)注度最高的1號(hào)報(bào)紙論文,雖然在社會(huì)團(tuán)體網(wǎng)站和在線交流社區(qū)沒有產(chǎn)生影響,但是在地方新聞媒體和社會(huì)新聞媒體中皆受到較多的提及,說明該報(bào)紙論文常被新聞媒體所轉(zhuǎn)載和引用,產(chǎn)生的影響力較大。而6號(hào)報(bào)紙論文和8號(hào)報(bào)紙論文受到網(wǎng)絡(luò)關(guān)注來源平臺(tái)的分布情況與其它報(bào)紙論文有所不同。6號(hào)報(bào)紙論文比其它報(bào)紙論文更受到政府機(jī)構(gòu)網(wǎng)站的青睞。8號(hào)報(bào)紙論文則更為特別,較少受到常見的社會(huì)新聞媒體的關(guān)注,國(guó)家新聞媒體、地方新聞媒體、理論宣傳媒體、政府機(jī)構(gòu)網(wǎng)站、社會(huì)團(tuán)體網(wǎng)站、微博、在線交流社區(qū)等平臺(tái)更沒有關(guān)注該報(bào)紙論文,但該報(bào)紙論文的文檔分享平臺(tái)保存量指標(biāo)值卻在所有報(bào)紙論文排名第一,可以看出該報(bào)紙論文相關(guān)內(nèi)容被文檔分享平臺(tái)的用戶保存了很多次。
為了進(jìn)一步發(fā)現(xiàn)中文報(bào)紙論文發(fā)表后網(wǎng)絡(luò)關(guān)注變化過程,圖2展示了隨著發(fā)表天數(shù)增加,網(wǎng)絡(luò)關(guān)注度最高的1號(hào)報(bào)紙論文以及與其它報(bào)紙論文差異較大的8號(hào)報(bào)紙論文的Altmetrics指標(biāo)的變化情況。
由圖2可以知道,國(guó)家新聞媒體、地方新聞媒體、社會(huì)新聞媒體、理論宣傳媒體、政府機(jī)構(gòu)網(wǎng)站、教育機(jī)構(gòu)網(wǎng)站、社會(huì)團(tuán)體網(wǎng)站等平臺(tái)對(duì)中文報(bào)紙論文的關(guān)注主要集中在論文發(fā)表后的兩天時(shí)間內(nèi),這與報(bào)紙論文的新聞傳播特性相匹配,具有傳播速度快的特征。中文報(bào)紙論文發(fā)表兩年后仍有可能受到網(wǎng)絡(luò)平臺(tái)的關(guān)注,說明中文報(bào)紙論文在網(wǎng)絡(luò)中不僅傳播速度快,傳播時(shí)間還較長(zhǎng)。在傳播后期中文報(bào)紙論文主要受到文檔分享平臺(tái)的關(guān)注,可以看出文檔分享平臺(tái)對(duì)于中文報(bào)紙論文的傳播不受時(shí)間的限制。具體來看,1號(hào)報(bào)紙論文自發(fā)表當(dāng)天就迅速受到地方新聞媒體、社會(huì)新聞媒體以及部分國(guó)家新聞媒體和教育機(jī)構(gòu)網(wǎng)站的轉(zhuǎn)載和提及,并且第3天開始該報(bào)紙論文受到關(guān)注的現(xiàn)象越來越小。到了4個(gè)月后該報(bào)紙論文的網(wǎng)絡(luò)傳播之路暫停了,10個(gè)月后偶爾引起零星關(guān)注。而8號(hào)報(bào)紙論文在發(fā)表當(dāng)天除了受到幾個(gè)社會(huì)新聞媒體、教育機(jī)構(gòu)網(wǎng)站和博客的關(guān)注外,并沒有受到其他網(wǎng)絡(luò)平臺(tái)的關(guān)注。但5個(gè)月后該報(bào)紙論文的相關(guān)內(nèi)容突然受到文檔分享平臺(tái)用戶的保存,并一直持續(xù)了兩年以上。通過仔細(xì)觀察數(shù)據(jù)可以知道,8號(hào)報(bào)紙論文在發(fā)表后被寫進(jìn)中學(xué)語文現(xiàn)代文閱讀理解的試題中。不同中學(xué)在編制試題的過程中會(huì)在網(wǎng)絡(luò)中搜集和參考其它學(xué)校的試題,8號(hào)報(bào)紙論文也跟隨試題被文檔分享平臺(tái)的用戶保存和轉(zhuǎn)發(fā),從而得到更廣泛的傳播。由此可見,中文報(bào)紙論文內(nèi)容得到有效加工和轉(zhuǎn)化可能會(huì)產(chǎn)生更大的價(jià)值和影響。
4結(jié)語
本文利用搜索引擎技術(shù)設(shè)計(jì)了中文學(xué)術(shù)論文Altmetrics指標(biāo)構(gòu)建的思路,以《光明日?qǐng)?bào)》2014年1 363篇中文報(bào)紙論文為例,完成了中文報(bào)紙論文的Altmetrics數(shù)據(jù)獲取和指標(biāo)構(gòu)建的過程,進(jìn)而分析關(guān)注中文報(bào)紙論文的網(wǎng)站平臺(tái),揭示中文報(bào)紙論文受到網(wǎng)絡(luò)關(guān)注的范圍和過程。研究結(jié)果表明,百度搜索能很好地解決中文學(xué)術(shù)論文Altmetrics數(shù)據(jù)獲取和指標(biāo)構(gòu)建的問題。中文報(bào)紙論文受到國(guó)家新聞媒體、地方新聞媒體、社會(huì)新聞媒體、理論宣傳媒體、政府機(jī)構(gòu)網(wǎng)站、教育機(jī)構(gòu)網(wǎng)站、社會(huì)團(tuán)體網(wǎng)站、文檔分享平臺(tái)、微博、博客、在線交流社區(qū)等網(wǎng)絡(luò)平臺(tái)的關(guān)注,其中各類新聞媒體對(duì)中文報(bào)紙論文的關(guān)注較多。在網(wǎng)絡(luò)傳播的過程中,不同的中文報(bào)紙論文呈現(xiàn)出不一致的發(fā)展趨勢(shì)。較多中文報(bào)紙論文在發(fā)表后的兩天時(shí)間迅速受到大量的關(guān)注,隨后影響快速減弱。個(gè)別中文報(bào)紙論文剛開始在網(wǎng)絡(luò)中不受歡迎,加工成為試題后受到文檔分享平臺(tái)用戶的持續(xù)關(guān)注和傳播。
雖然可以從百度搜索引擎客觀地獲取中文學(xué)術(shù)論文真實(shí)的網(wǎng)絡(luò)關(guān)注數(shù)據(jù),但是仍然可能會(huì)存在個(gè)別缺漏的問題,同時(shí)人工清洗大規(guī)模噪音數(shù)據(jù)過于費(fèi)時(shí)費(fèi)力。下一步研究將基于本文實(shí)證研究的Altmetrics指標(biāo)構(gòu)建思路,探究期刊論文、會(huì)議論文、學(xué)術(shù)論文等其它類型的學(xué)術(shù)論文的網(wǎng)絡(luò)關(guān)注情況,對(duì)比不同類型學(xué)術(shù)論文受到網(wǎng)絡(luò)關(guān)注的異同,構(gòu)建更具備通用性的中文學(xué)術(shù)論文Altmetrics指標(biāo)體系。同時(shí)在利用搜索引擎構(gòu)建中文學(xué)術(shù)論文Altmetrics指標(biāo)體系的基礎(chǔ)上,補(bǔ)充微信等百度搜索引擎無法遍歷的社交媒體,進(jìn)一步利用網(wǎng)絡(luò)爬蟲全面采集中文學(xué)術(shù)論文的網(wǎng)絡(luò)關(guān)注數(shù)據(jù),通過自然語言處理和文本挖掘等相關(guān)技術(shù)實(shí)現(xiàn)內(nèi)容自動(dòng)識(shí)別和匹配,降低數(shù)據(jù)清洗的成本,進(jìn)而使得研究結(jié)論更加完善和充分。
參考文獻(xiàn)
[1]邱均平.信息計(jì)量學(xué)[M].武漢:武漢大學(xué)出版社,2007:317.
[2]Priem J,Taraborelli D,Groth P,et al.Altmetrics:A Manifesto[EB/OL].http://altmetrics.org/manifesto,2020-10-15.
[3]Piwowar H.Altmetrics:Value All Research Products[J].Nature,2013,493(7431):159.
[4]Howard J.Scholars Seek Better Ways to Track Impact Online[EB/OL].http://chronicle.com/article/As-Scholarship-Goes-Digital/130482/?sid=wc&utm_source=wc&utm_medium=en,2020-10-15.
[5]Thelwall M,Haustein S,Larivière V,et al.Do Altmetrics Work?Twitter and Ten Other Social Web Services[J].PLoS One,2013,8(5):e64841.
[6]劉春麗.基于PLOS API的論文影響力選擇性計(jì)量指標(biāo)研究[J].圖書情報(bào)工作,2013,57(7):89-95.
[7]由慶斌,湯珊紅.不同類型論文層面計(jì)量指標(biāo)間的相關(guān)性研究[J].圖書情報(bào)工作,2014,58(8):79-84.
[8]Haustein S,Costas R,Lariviere V.Characterizing Social Media Metrics of Scholarly Papers:The Effect of Document Properties and Collaboration Patterns[J].PLoS One,2015,10(3):e0120495.
[9]Holmberg K,Vainio J.Why Do Some Research Articles Receive More Online Attention and Higher Altmetrics?Reasons for Online Success According to the Authors[J].Scientometrics,2018,116(1):435-447.
[10]邱均平,陳麗婷.高社會(huì)影響力論文的特征分析——以2016—2018年Altmetrics TOP100論文為例[J].圖書館理論與實(shí)踐,2019,(8):20-25.
[11]Wang X W,F(xiàn)ang Z C,Guo X H.Tracking the Digital Footprints to Scholarly Articles from Social Media[J].Scientometrics,2016,106(2):1365-1376.
[12]魏緒秋,郭鳳嬌.基于動(dòng)態(tài)Altmetrics數(shù)據(jù)的學(xué)術(shù)論文持續(xù)關(guān)注度研究[J].情報(bào)理論與實(shí)踐,2019,42(5):128-133.
[13]田玥,賀培鳳,邰楊芳,等.科研論文在社交網(wǎng)絡(luò)中的關(guān)注度分析——以PLOS生物醫(yī)學(xué)論文為例[J].數(shù)字圖書館論壇,2019,(4):54-61.
[14]王艷波,汪雷,吳小蘭.基于Altmetrics與傳統(tǒng)文獻(xiàn)計(jì)量指標(biāo)的國(guó)內(nèi)學(xué)術(shù)論文影響力評(píng)價(jià)研究[J].情報(bào)理論與實(shí)踐,2020,43(6):76-81.
[15]易淑瓊,余波.基于國(guó)內(nèi)文獻(xiàn)管理平臺(tái)的Altmetrics與傳統(tǒng)文獻(xiàn)計(jì)量指標(biāo)的相關(guān)性研究[J].情報(bào)雜志,2019,38(7):193-198.
[16]王蘿娜,李端明,李星.在線科學(xué)交流中學(xué)術(shù)論文影響力動(dòng)態(tài)評(píng)價(jià)研究[J].圖書情報(bào)工作,2018,62(4):107-112.
[17]盧曉榮,張樹良.國(guó)內(nèi)社交媒體用于學(xué)術(shù)成果Altmetrics評(píng)價(jià)存在問題及對(duì)策[J].圖書情報(bào)工作,2019,63(21):87-96.
[18]彭秋茹,閻素蘭,楊波,等.融合引文與Altmetrics的報(bào)紙論文影響力綜合評(píng)價(jià)方法研究[J].圖書與情報(bào),2018,(5):11-21.
[19]Altmetric.What Metadata is Required to Track Our Content?[EB/OL].https://help.altmetric.com/support/solutions/articles/6000141419-what-metadata-is-required-to-track-our-content-,2020-10-15.
[20]馬費(fèi)成,望俊成,吳克文,等.國(guó)外搜索引擎檢索效能研究述評(píng)[J].中國(guó)圖書館學(xué)報(bào),2009,(4):72-79.
[21]StatCounter.Search Engine Host Market Share in China-June 2020[EB/OL].https://gsa.statcounter.com/search-engine-host-market-share/all/china,2020-10-15.
[22]Altmetric.What Outputs and Sources Does Altmetric Track?[EB/OL].https://help.altmetric.com/support/solutions/articles/6000060968-what-outputs-and-sources-does-altmetric-track-,2020-10-15.
[23]Plum Analytics.About PlumX Metrics[EB/OL].https://plumanalytics.com/learn/about-metrics/,2020-10-15.
[24]Impactstrory.About the Data[EB/OL].https://profiles.impactstory.org/about/data,2020-10-15.
[25]ALM.Sources[EB/OL].http://alm.plos.org/sources,2020-10-15.
[26]李曉莉.悅讀時(shí)代需要怎樣的報(bào)紙理論文章[J].新聞傳播,2014,(5):73-74.
(責(zé)任編輯:孫國(guó)雷)