蘭 雪,韓 毅
(西南大學(xué)計(jì)算機(jī)與信息科學(xué)學(xué)院,重慶 400715)
隨著互聯(lián)網(wǎng)的發(fā)展,人們通過(guò)社交網(wǎng)絡(luò)粘合于虛擬社區(qū)之中。人們的某些行為或習(xí)慣在互聯(lián)網(wǎng)的影響下慢慢發(fā)生改變,獲取知識(shí)的閱讀行為與方式也在網(wǎng)絡(luò)的推動(dòng)下發(fā)生了潛移默化的改變,互聯(lián)網(wǎng)時(shí)代的閱讀正逐漸演變?yōu)橐环N集體行為、社會(huì)化行為。人們閱讀書籍、標(biāo)記書籍、分享書籍,或是在社交網(wǎng)站發(fā)布書評(píng),與陌生的網(wǎng)友溝通交流,社會(huì)化閱讀平臺(tái)應(yīng)運(yùn)而生,豆瓣讀書、天涯讀書、Goodreaders 等是其中的典型代表。豆瓣讀書是中國(guó)最具代表性的網(wǎng)絡(luò)讀書社區(qū),它以圖書為中心,建立起關(guān)于圖書的社區(qū)[1],是當(dāng)前運(yùn)營(yíng)比較成功、比較成熟的社會(huì)化閱讀平臺(tái)。
豆瓣評(píng)分是由許多閱讀過(guò)該書的用戶基于個(gè)人認(rèn)知對(duì)圖書進(jìn)行評(píng)價(jià)所得到的平均分,它成為許多用戶閱讀選擇的一個(gè)重要參考,社會(huì)化閱讀平臺(tái)中的圖書評(píng)分也被學(xué)者作為圖書評(píng)價(jià)指標(biāo)體系中的一個(gè)指標(biāo),尤其在Altmetrics 評(píng)價(jià)提出之后,社交平臺(tái)的各項(xiàng)指標(biāo)也被嘗試納入科技評(píng)價(jià)中。然而,各社會(huì)化閱讀平臺(tái)圖書評(píng)分?jǐn)?shù)據(jù)是否可用值得商榷。本文以豆瓣讀書平臺(tái)為例,分析其圖書評(píng)分?jǐn)?shù)據(jù)作為圖書Altmetrics 評(píng)價(jià)的數(shù)據(jù)可用性。
社會(huì)化閱讀是一種以讀者為核心,注重讀者與讀者之間、讀者與內(nèi)容之間的分享、互動(dòng)與傳播的全新閱讀模式。與以書為核心內(nèi)容的傳統(tǒng)閱讀模式相比,該方式更加注重人和閱讀社交,倡導(dǎo)UGC(User Generated Content,用戶生成內(nèi)容),注重共同傳播與營(yíng)利,在多方位互動(dòng)的基礎(chǔ)上,實(shí)現(xiàn)閱讀價(jià)值的無(wú)限放大[2]。梁育浩[3]以豆瓣網(wǎng)旗下的“豆瓣讀書”和“豆瓣閱讀”兩個(gè)板塊構(gòu)成的社會(huì)化閱讀平臺(tái)為研究對(duì)象,梳理出豆瓣網(wǎng)從“豆瓣讀書”以圖書評(píng)論推介為主的平臺(tái)發(fā)展為兼具數(shù)字閱讀和自出版功能的社會(huì)化閱讀平臺(tái)的發(fā)展過(guò)程,探究了其發(fā)展過(guò)程中的優(yōu)勢(shì)和阻力。
圖書評(píng)價(jià)方法多樣,包括書評(píng)、基于圖書館的圖書評(píng)價(jià)、圖書被引、基于Altmetrics 的圖書評(píng)價(jià)和綜合圖書評(píng)價(jià)等。同行評(píng)議直接反映圖書的創(chuàng)新程度、學(xué)術(shù)價(jià)值和內(nèi)容質(zhì)量[4]。何峻[5]指出書評(píng)反映了讀者對(duì)一本書質(zhì)量的主觀性見解和價(jià)值判斷,對(duì)于圖書宣傳促銷、引導(dǎo)讀者閱讀、提高圖書質(zhì)量都有積極的作用,是中國(guó)當(dāng)前圖書評(píng)價(jià)的一種重要形式,但是各種書評(píng)魚龍混雜,真正優(yōu)秀、有質(zhì)量的書評(píng)為數(shù)不多。陳芳芳[6]根據(jù)模糊綜合評(píng)價(jià)理論,建立了一個(gè)用于定量評(píng)價(jià)圖書使用效益的數(shù)學(xué)模型,將圖書館圖書使用效益的指標(biāo)劃分為6 個(gè):借閱次數(shù)、預(yù)約次數(shù)、點(diǎn)擊次數(shù)、收藏次數(shù)、一般讀者評(píng)分、專家評(píng)分。張海營(yíng)[7]將營(yíng)銷學(xué)上常用的RFM(Recency、Frequency 和Monetary)模型應(yīng)用于圖書館研究領(lǐng)域,將RFM 重新定義為圖書最近被借閱時(shí)間(R)、被借閱次數(shù)(F)和被借閱總時(shí)間(M),最終將這3 個(gè)指標(biāo)整合成圖書評(píng)價(jià)因子,提出基于RFM 模型的圖書評(píng)價(jià)系統(tǒng)。WHITE 等[8]認(rèn)為目前對(duì)人文社會(huì)科學(xué)類圖書的評(píng)價(jià)相比報(bào)刊或技術(shù)類的研究成果不夠多,提出采用引文指標(biāo)的圖書質(zhì)量評(píng)價(jià)測(cè)量方式。楊思洛等[9,10]從引文分析角度分別對(duì)圖書情報(bào)、檔案學(xué)圖書影響力進(jìn)行統(tǒng)計(jì),從圖書影響力、出版社影響力、作者影響力和年代影響力以及高影響力圖書同被引情況等方面進(jìn)行了統(tǒng)計(jì)分析。
美國(guó)學(xué)者PRIEM 在其Twitter 上提出了Altmetrics,它是在以數(shù)字圖書館、開放存取(OA)、Web2.0、移動(dòng)及社交網(wǎng)絡(luò)、自媒體、在線科研及MOOCs、大數(shù)據(jù)等為代表的新學(xué)術(shù)信息環(huán)境下的一系列新的計(jì)量指標(biāo)及方法,雷淑義等[11]認(rèn)為Altmetrics 正在成為一種更易實(shí)施的學(xué)術(shù)圖書影響力分析評(píng)價(jià)新方法。魏佳文等[12]對(duì)豆瓣讀書平臺(tái)上中文學(xué)術(shù)圖書短評(píng)的產(chǎn)生動(dòng)機(jī)進(jìn)行分析,認(rèn)為“討論”類短評(píng)數(shù)據(jù)可用于評(píng)價(jià)中文學(xué)術(shù)圖書價(jià)值,而“分享”“消遣娛樂”“外界壓力”“情感宣泄”和“資料獲取”等動(dòng)機(jī)相對(duì)來(lái)說(shuō)難以較好地反映用戶對(duì)圖書的態(tài)度和認(rèn)知。姜春林等[13]研究發(fā)現(xiàn),由于不同學(xué)科知識(shí)屬性與研究范式不同,理學(xué)學(xué)科的基礎(chǔ)性與專業(yè)性、工學(xué)學(xué)科的實(shí)踐性、人文學(xué)科的歷史性、社科類的社會(huì)廣泛性、醫(yī)學(xué)類學(xué)科的兼具基礎(chǔ)性與實(shí)踐性,導(dǎo)致不同學(xué)科的產(chǎn)出量、引用行為、討論度存在差異,Bookmetrix 各指標(biāo)數(shù)值特征存在學(xué)科差異,指標(biāo)間相關(guān)性亦呈現(xiàn)學(xué)科差異。肖敖夏等[14]基于Bookmetrix 指標(biāo)建立學(xué)術(shù)圖書因子綜合得分模型,對(duì)學(xué)術(shù)圖書的影響力進(jìn)行綜合分析,并討論利用Bookmetrix 指標(biāo)對(duì)學(xué)術(shù)圖書影響力進(jìn)行評(píng)價(jià)的價(jià)值,研究發(fā)現(xiàn)利用Bookmetrix 指標(biāo)評(píng)價(jià)學(xué)術(shù)圖書對(duì)傳統(tǒng)計(jì)量指標(biāo)具有一定的補(bǔ)充價(jià)值,但仍存在較多不足。韓毅[15]認(rèn)為Altmetrics 的計(jì)量結(jié)果與傳統(tǒng)以引文為基礎(chǔ)的科技評(píng)價(jià)是相互補(bǔ)充關(guān)系,應(yīng)當(dāng)將兩者融合進(jìn)行綜合評(píng)價(jià)。
綜合圖書評(píng)價(jià)方法則融合多個(gè)維度對(duì)圖書進(jìn)行評(píng)價(jià)。張玉等[16]采用的定性綜合評(píng)價(jià)指標(biāo)主要有:書評(píng)、專家評(píng)價(jià)和網(wǎng)絡(luò)書評(píng),定量綜合評(píng)價(jià)指標(biāo)包含圖書引用、圖書利用和基金資助與獎(jiǎng)勵(lì)。王偉等[17]以人文社會(huì)科學(xué)外譯圖書為研究對(duì)象,從外譯圖書學(xué)術(shù)影響和社會(huì)影響兩個(gè)方面出發(fā)構(gòu)建10 個(gè)維度細(xì)化評(píng)價(jià)指標(biāo),利用熵權(quán)法計(jì)算各項(xiàng)指標(biāo)的權(quán)重,加權(quán)平均得到學(xué)術(shù)影響力和社會(huì)影響力得分,并對(duì)中華學(xué)術(shù)外譯項(xiàng)目資助的外譯圖書進(jìn)行實(shí)證分析。
在信息領(lǐng)域中,可用性的最初研究大都集中于計(jì)算機(jī)軟硬件,近年來(lái)可用性理念開始逐漸滲透到數(shù)據(jù)領(lǐng)域。數(shù)據(jù)可用性具有很多度量指標(biāo),李建中等[18]用數(shù)據(jù)一致性、數(shù)據(jù)精確性、數(shù)據(jù)完整性、數(shù)據(jù)時(shí)效性以及實(shí)體同一性來(lái)衡量數(shù)據(jù)可用性。聶磊等[19]參考社會(huì)調(diào)查數(shù)據(jù)評(píng)估已有研究,認(rèn)為網(wǎng)絡(luò)行為數(shù)據(jù)的適用性主要包括兩方面內(nèi)容,數(shù)據(jù)中樣本能有效推估總體的程度以及基于特定數(shù)據(jù)進(jìn)行的測(cè)量能在多大程度上反映研究概念的真實(shí)含義。
本文將以典型的社會(huì)化閱讀平臺(tái)——豆瓣讀書平臺(tái)上的圖書評(píng)分?jǐn)?shù)據(jù)為對(duì)象,將豆瓣圖書評(píng)分與傳統(tǒng)的圖書引文評(píng)價(jià)作相關(guān)性分析,分析豆瓣圖書評(píng)分?jǐn)?shù)據(jù)作為圖書Altmetrics 評(píng)價(jià)數(shù)據(jù)的可用性。
本文的研究對(duì)象是“豆瓣讀書”平臺(tái)上不同學(xué)科的圖書,聚焦于這些書籍的讀者評(píng)分?jǐn)?shù)據(jù)。
(1)樣本的選取采用分層抽樣方法,從 《讀秀中文圖書被引用情況報(bào)告(2020)》[20]22 個(gè)大類圖書分別選擇30 本圖書作為分析對(duì)象,在各大類中采取簡(jiǎn)單隨機(jī)抽樣,采集所對(duì)應(yīng)的書名、出版年、作者、被引用次數(shù)并保存到Excel 表中。由于《讀秀中文圖書被引用情況報(bào)告(2020)》 中部分大類圖書數(shù)量較少,為了對(duì)盡量多的大類圖書進(jìn)行分析,基于報(bào)告中各個(gè)大類圖書數(shù)量的綜合考量,選取了滿足相關(guān)性分析的最低樣本數(shù)量,即每個(gè)大類選擇30 本圖書進(jìn)行分析。而 《讀秀中文圖書被引用情況報(bào)告(2020)》 中的圖書被引用數(shù)據(jù)為圖書引用圖書的數(shù)據(jù),為保證圖書被引用數(shù)據(jù)的完整性,在中國(guó)引文數(shù)據(jù)庫(kù)(CCD)中檢索獲取每本圖書的期刊、學(xué)位論文及會(huì)議論文引用數(shù)據(jù),形成完整的圖書被引用數(shù)據(jù)。
(2)對(duì)于選定的圖書對(duì)象,于2021 年1 月15 日通過(guò)書名和作者在豆瓣讀書平臺(tái)中檢索相應(yīng)圖書(由于讀秀提供的出版年所對(duì)應(yīng)的圖書版本大多數(shù)不存在相對(duì)應(yīng)的豆瓣評(píng)分,因此未將出版年作為檢索項(xiàng)),獲取其豆瓣評(píng)分?jǐn)?shù)據(jù),對(duì)于豆瓣讀書平臺(tái)上不存在的圖書或沒有豆瓣評(píng)分的圖書,則將其刪除后重新在 《讀秀中文圖書被引用情況報(bào)告(2020)》 中隨機(jī)選擇圖書作為分析對(duì)象并獲取其豆瓣評(píng)分?jǐn)?shù)據(jù)。
將收集的數(shù)據(jù)按圖書大類分別整理錄入到Excel 表中,添加被引用次數(shù)排名和豆瓣評(píng)分排名數(shù)據(jù)。《讀秀中文圖書被引用情況報(bào)告(2020)》 中部分大類圖書對(duì)應(yīng)的豆瓣評(píng)分?jǐn)?shù)據(jù)量不足30 本,統(tǒng)計(jì)發(fā)現(xiàn)這些圖書大類均為自然科學(xué)部類,在數(shù)據(jù)分析時(shí)僅對(duì)數(shù)據(jù)量完整的部分圖書大類數(shù)據(jù)進(jìn)行單獨(dú)分析,其余數(shù)據(jù)將作為自然科學(xué)部類圖書整體分析樣本的一部分。各大類圖書數(shù)據(jù)的收集情況詳見表1。
表1 各個(gè)大類圖書數(shù)據(jù)收集情況 單位:本Table 1 Books data collection of various categories
為了識(shí)別圖書被引用次數(shù)與豆瓣評(píng)分之間的相關(guān)性大小,選擇的數(shù)據(jù)分析方法為相關(guān)分析。圖書被引用次數(shù)的數(shù)值相對(duì)較大,因此對(duì)其進(jìn)行自然對(duì)數(shù)轉(zhuǎn)換處理,對(duì)于滿足正態(tài)分布的連續(xù)數(shù)據(jù)采用皮爾遜相關(guān)分析,對(duì)于其他不滿足正態(tài)分布的連續(xù)數(shù)據(jù),則對(duì)其數(shù)據(jù)采用斯皮爾曼相關(guān)分析。
4.1.1 單樣本K-S 檢驗(yàn)
單樣本K-S 檢驗(yàn)是利用樣本數(shù)據(jù)推斷總體是否服從某一理論分布的方法,適用于探索連續(xù)型隨機(jī)變量的分布形態(tài)。對(duì)所有數(shù)據(jù)量完整的圖書大類(A、B、C、D、E、F、G、H、I、J、K、R、T、Z)以及各圖書部類和全部圖書的數(shù)據(jù)分別進(jìn)行單樣本K-S 檢驗(yàn),分析判斷各大類圖書數(shù)據(jù)是否滿足正態(tài)分布(由于被引用次數(shù)相差甚大,因而先對(duì)其進(jìn)行自然對(duì)數(shù)轉(zhuǎn)換再進(jìn)行單樣本K-S 檢驗(yàn))。A 類圖書被引用次數(shù)對(duì)數(shù)轉(zhuǎn)換數(shù)據(jù)和豆瓣評(píng)分?jǐn)?shù)據(jù)的單樣本K-S 檢驗(yàn)分析結(jié)果詳見表2。
表2 A 類圖書數(shù)據(jù)單樣本K-S 檢驗(yàn)結(jié)果Table 2 Single sample K-S test results of class A books
由表2 可見,A 類圖書被引用次數(shù)對(duì)數(shù)轉(zhuǎn)換數(shù)據(jù)和豆瓣評(píng)分?jǐn)?shù)據(jù)的漸進(jìn)顯著性均小于顯著性水平0.05,因此拒絕原假設(shè),即被A 類圖書的被引用次數(shù)對(duì)數(shù)轉(zhuǎn)換數(shù)據(jù)和豆瓣評(píng)分?jǐn)?shù)據(jù)的總體分布與正態(tài)分布存在顯著差異,不滿足正態(tài)分布。對(duì)各大類數(shù)據(jù)及各部類數(shù)據(jù)進(jìn)行單樣本K-S 檢驗(yàn),最終得到被引用次數(shù)對(duì)數(shù)轉(zhuǎn)換數(shù)據(jù)和豆瓣評(píng)分?jǐn)?shù)據(jù)均符合正態(tài)分布的圖書大類為C、D、E、F、H、I、J、R 和T 共計(jì)9 類,A、B、G、K 和Z 5 個(gè)大類的被引用次數(shù)對(duì)數(shù)轉(zhuǎn)換數(shù)據(jù)和豆瓣評(píng)分?jǐn)?shù)據(jù)不能同時(shí)滿足正態(tài)分布。就五大圖書部類而言,兩個(gè)變量數(shù)據(jù)均不能同時(shí)滿足正態(tài)分布,因此采用斯皮爾曼相關(guān)分析。
4.1.2 皮爾遜相關(guān)分析
針對(duì)符合正態(tài)分布的圖書大類,即C、D、E、F、H、I、J、R 和T 類圖書,采用皮爾遜相關(guān)系數(shù)來(lái)分析被引用次數(shù)對(duì)數(shù)變換數(shù)據(jù)與豆瓣評(píng)分兩個(gè)變量之間的相關(guān)性。各類圖書的兩個(gè)變量之間的皮爾遜相關(guān)系數(shù)詳見表3。
表3 C、D、E、F、H、I、J、R 和T 類圖書的被引用次數(shù)對(duì)數(shù)變換數(shù)據(jù)與豆瓣評(píng)分變量之間的皮爾遜相關(guān)系數(shù)Table 3 Pearson correlation coefficient between logarithmic transformation data of book citations of C,D,E,F,H,I,J,R and T and Douban rating score
在以上9 個(gè)大類中,E 類、J 類、R 類和T 類4 個(gè)大類圖書的被引用次數(shù)與豆瓣評(píng)分排名的斯皮爾曼相關(guān)性的顯著性均大于0.05,即兩變量之間不存在顯著相關(guān)性。對(duì)于D、F 和I 這3 個(gè)大類,被引用次數(shù)對(duì)數(shù)轉(zhuǎn)換數(shù)據(jù)與豆瓣評(píng)分之間的皮爾遜相關(guān)系數(shù)在0.3~0.5之間,且D 類的顯著性小于0.01,F(xiàn) 和I 類的顯著性小于0.05,認(rèn)為兩個(gè)變量之間存在低度相關(guān)。在C、D所在的2 個(gè)大類中,圖書的被引用次數(shù)對(duì)數(shù)轉(zhuǎn)換與豆瓣評(píng)分的皮爾遜相關(guān)系數(shù)均介于0.5~0.8 之間,且顯著性均小于0.01,表示兩個(gè)變量之間存在顯著中度相關(guān)關(guān)系。
4.1.3 斯皮爾曼相關(guān)分析
對(duì)于數(shù)據(jù)量為30 但數(shù)據(jù)不符合正態(tài)分布的圖書大類(即A、B、G、K 和Z 這5 個(gè)圖書大類)的圖書被引用次數(shù)排名與豆瓣評(píng)分排名采用斯皮爾曼相關(guān)分析,斯皮爾曼相關(guān)系數(shù)用于度量?jī)蓚€(gè)等級(jí)變量之間的線性相關(guān)。各大類圖書的兩個(gè)變量之間的斯皮爾曼相關(guān)系數(shù)詳見表4。
表4 A、B、G、K 和Z 類圖書的被引用次數(shù)排名與豆瓣評(píng)分排名變量之間的斯皮爾曼相關(guān)系數(shù)Table 4 Spearman correlation coefficient between the book citation ranking of A,B,G,K and Z and Douban ranking score
在以上5 個(gè)大類中,圖書的被引用次數(shù)排名與豆瓣評(píng)分排名的斯皮爾曼相關(guān)系數(shù)均介于0.5~0.8 之間,且顯著性均小于0.01,表示兩個(gè)變量之間存在顯著中度相關(guān)關(guān)系。
按照學(xué)科部類整理統(tǒng)計(jì)數(shù)據(jù),并分析各部類圖書的被引用次數(shù)排名數(shù)據(jù)與豆瓣評(píng)分排名數(shù)據(jù)的相關(guān)性,得到各部類圖書兩個(gè)變量之間的斯皮爾曼相關(guān)系數(shù),結(jié)果詳見表5。
表5 各部類圖書的被引用次數(shù)排名與豆瓣評(píng)分排名變量的斯皮爾曼相關(guān)系數(shù)Table 5 Spearman correlation coefficient between the book citation ranking for each category and Douban rating score
由表5 可見,自然科學(xué)部類圖書的被引用次數(shù)與豆瓣評(píng)分兩變量之間的斯皮爾曼相關(guān)系數(shù)為0.191,小于0.3,可認(rèn)為不存在相關(guān)關(guān)系。社會(huì)科學(xué)部類圖書的被引用次數(shù)排名與豆瓣評(píng)分排名變量之間的斯皮爾曼相關(guān)系數(shù)為0.418,存在低度相關(guān)關(guān)系。馬克思主義列寧主義毛澤東思想鄧小平理論、哲學(xué)及綜合性圖書的被引用次數(shù)與豆瓣評(píng)分兩個(gè)變量之間的斯皮爾曼相關(guān)系數(shù)均在0.5~0.8 之間,存在中度相關(guān)關(guān)系。整體而言,圖書被引用次數(shù)與豆瓣評(píng)分變量之間的斯皮爾曼相關(guān)系數(shù)為0.468,即兩個(gè)變量之間存在低度相關(guān)關(guān)系。
4.2.1 各大類圖書的社會(huì)化閱讀平臺(tái)評(píng)分?jǐn)?shù)據(jù)可用性
從以上研究結(jié)果可以看到,馬克思主義列寧主義毛澤東思想鄧小平理論(A)、哲學(xué)宗教(B)、社會(huì)科學(xué)總論(C)、政治法律(D)、經(jīng)濟(jì)(F)、文化科學(xué)教育體育(G)、語(yǔ)言文字(H)、文學(xué)(I)、歷史地理(K)、綜合性圖書(Z)共計(jì)10 個(gè)大類圖書的被引用次數(shù)與豆瓣評(píng)分?jǐn)?shù)據(jù)之間的相關(guān)系數(shù)大于0.3,且顯著性小于0.05,即存在一定的相關(guān)性,因此可以認(rèn)為這些大類的豆瓣評(píng)分?jǐn)?shù)據(jù)可在一定程度上反映了圖書的社會(huì)影響力,社會(huì)化閱讀平臺(tái)評(píng)分?jǐn)?shù)據(jù)一定的可用性,可以作為圖書Altmetrics 評(píng)價(jià)指標(biāo)的數(shù)據(jù)來(lái)源。
其中,社會(huì)科學(xué)總論(C)、政治法律(D)、經(jīng)濟(jì)(F)、文化科學(xué)教育體育(G)、語(yǔ)言文字(H)、文學(xué)(I)、歷史地理(K)7 個(gè)大類圖書均屬于社會(huì)科學(xué),社會(huì)科學(xué)部類中僅軍事(E)和藝術(shù)(J)大類圖書的被引用次數(shù)與豆瓣評(píng)分?jǐn)?shù)據(jù)之間不存在相關(guān)關(guān)系,進(jìn)一步說(shuō)明社會(huì)科學(xué)類圖書的社會(huì)影響力更容易凸顯。
而自然科學(xué)各個(gè)大類圖書被引用次數(shù)相關(guān)數(shù)據(jù)與豆瓣評(píng)分相關(guān)數(shù)據(jù)之間的相關(guān)性均不顯著,因此對(duì)自然科學(xué)圖書進(jìn)行評(píng)價(jià)時(shí),應(yīng)慎重考慮是否將社會(huì)化閱讀平臺(tái)的評(píng)分?jǐn)?shù)據(jù)作為評(píng)價(jià)指標(biāo)。并且,在數(shù)據(jù)搜集過(guò)程中發(fā)現(xiàn),相對(duì)于其他部類圖書而言,更多的自然科學(xué)圖書在豆瓣讀書平臺(tái)中由于評(píng)分人數(shù)小于10 人而無(wú)法獲取到其豆瓣評(píng)分?jǐn)?shù)據(jù),部分存在豆瓣評(píng)分的自然科學(xué)圖書,其評(píng)分人數(shù)也遠(yuǎn)遠(yuǎn)小于其他部類圖書的評(píng)分人數(shù)。這些表明,自然科學(xué)圖書,由于其知識(shí)社會(huì)擴(kuò)散壁壘較高,其社會(huì)影響力較難展現(xiàn)出來(lái)。
4.2.2 各部類圖書的社會(huì)化閱讀平臺(tái)評(píng)分?jǐn)?shù)據(jù)可用性
馬克思主義列寧主義毛澤東思想鄧小平理論、哲學(xué)和綜合性圖書3 個(gè)部類的社會(huì)化閱讀平臺(tái)圖書評(píng)分?jǐn)?shù)據(jù)具有較好的可用性。這3 個(gè)部類圖書被引用次數(shù)相關(guān)數(shù)據(jù)與豆瓣評(píng)分相關(guān)數(shù)據(jù)之間的相關(guān)系數(shù)介于0.5~0.8 之間,存在中度相關(guān)關(guān)系,且數(shù)據(jù)搜集過(guò)程中發(fā)現(xiàn)只有小部分圖書在豆瓣讀書平臺(tái)中沒有形成豆瓣評(píng)分,評(píng)分人數(shù)差距甚大,最多的有萬(wàn)余名用戶對(duì)圖書進(jìn)行了評(píng)分。因此可認(rèn)為這3 個(gè)部類圖書的豆瓣評(píng)分能夠在一定程度上反映圖書的社會(huì)影響力,在對(duì)這3個(gè)部類圖書進(jìn)行評(píng)價(jià)時(shí),社會(huì)化閱讀平臺(tái)評(píng)分?jǐn)?shù)據(jù)具有較好的可用性,可以作為圖書Altmetrics 評(píng)價(jià)指標(biāo)的數(shù)據(jù)來(lái)源。
社會(huì)科學(xué)部類的社會(huì)化閱讀平臺(tái)圖書評(píng)分?jǐn)?shù)據(jù)具有一定的可用性。其圖書被引用次數(shù)與豆瓣評(píng)分之間的相關(guān)系數(shù)為0.418,兩個(gè)變量之間存在低度相關(guān)關(guān)系,豆瓣評(píng)分能體現(xiàn)一定的圖書社會(huì)影響力。社會(huì)科學(xué)部類圖書在所有圖書中評(píng)分人數(shù)相對(duì)較多,文學(xué)大類圖書尤為顯著,文學(xué)作品較其他專業(yè)圖書的受眾更為廣泛,《百年孤獨(dú)》 《挪威的森林》 等的評(píng)價(jià)人數(shù)在30 萬(wàn)左右,少量異常評(píng)分不影響圖書豆瓣評(píng)分的最終結(jié)果,能反映社會(huì)化閱讀平臺(tái)大眾對(duì)圖書社會(huì)影響力的評(píng)價(jià)。雖然社會(huì)科學(xué)部類各大類圖書被引用次數(shù)與豆瓣評(píng)分?jǐn)?shù)據(jù)之間的相關(guān)程度不一,但是豆瓣評(píng)分?jǐn)?shù)據(jù)總體而言能夠在一定程度上反映圖書的社會(huì)影響力,將豆瓣評(píng)分作為社會(huì)科學(xué)圖書Altmetrics 評(píng)價(jià)指標(biāo)數(shù)據(jù)來(lái)源有一定的可行性。
對(duì)自然科學(xué)部類圖書而言,社會(huì)化閱讀平臺(tái)評(píng)分?jǐn)?shù)據(jù)可用性較差。其圖書被引用次數(shù)與豆瓣評(píng)分之間的相關(guān)系數(shù)為0.195,可以認(rèn)為兩個(gè)變量之間不存在顯著相關(guān)關(guān)系,表明豆瓣評(píng)分?jǐn)?shù)據(jù)所反映的社會(huì)影響力與圖書學(xué)術(shù)影響力間是完全不同的兩個(gè)變量,主要原因可能在于自然科學(xué)部類圖書受眾相對(duì)較小,圖書專業(yè)性更強(qiáng),普通的社會(huì)化閱讀平臺(tái)用戶并不關(guān)注自然科學(xué)部類圖書,少量受其影響較大的用戶評(píng)分就會(huì)對(duì)整體評(píng)分產(chǎn)生較大的影響,導(dǎo)致評(píng)分?jǐn)?shù)據(jù)的可靠性、可信性不強(qiáng)。因此在對(duì)自然科學(xué)部類圖書社會(huì)影響力進(jìn)行評(píng)價(jià)時(shí),不建議將社會(huì)化閱讀平臺(tái)的圖書評(píng)分作為圖書Altmetrics 評(píng)價(jià)指標(biāo)的數(shù)據(jù)來(lái)源。
總體而言,社會(huì)化閱讀平臺(tái)圖書評(píng)分?jǐn)?shù)據(jù)具有一定的可用性。在具體大類圖書質(zhì)量評(píng)價(jià)時(shí),確定圖書評(píng)價(jià)數(shù)據(jù)來(lái)源時(shí)要審慎選擇。對(duì)于馬克思主義列寧主義毛澤東思想鄧小平理論、哲學(xué)圖書、社會(huì)科學(xué)圖書以及綜合性圖書進(jìn)行評(píng)價(jià)時(shí),可以考慮將社會(huì)化閱讀平臺(tái)的評(píng)分?jǐn)?shù)據(jù)納入其中,作為圖書Altmetrics 評(píng)價(jià)指標(biāo)的數(shù)據(jù)來(lái)源。而針對(duì)自然科學(xué)圖書的質(zhì)量評(píng)價(jià),暫時(shí)不宜選擇社會(huì)化閱讀平臺(tái)的評(píng)分?jǐn)?shù)據(jù)。
本研究分析結(jié)果表明,圖書豆瓣評(píng)分與被引用次數(shù)之間存在顯著正相關(guān);不同學(xué)科豆瓣平臺(tái)圖書評(píng)分?jǐn)?shù)據(jù)可用性存在差異。因此,社會(huì)化閱讀平臺(tái)圖書評(píng)分?jǐn)?shù)據(jù)具有一定的可用性,在對(duì)不同大類圖書進(jìn)行評(píng)價(jià)時(shí)應(yīng)謹(jǐn)慎考慮是否使用社會(huì)化閱讀平臺(tái)圖書評(píng)分作為圖書Altmetrics 評(píng)價(jià)指標(biāo)的數(shù)據(jù)來(lái)源。
(1)對(duì)馬克思主義列寧主義毛澤東思想鄧小平理論、哲學(xué)和綜合性圖書3 個(gè)部類的圖書質(zhì)量進(jìn)行評(píng)價(jià)時(shí),社會(huì)化閱讀平臺(tái)圖書評(píng)分?jǐn)?shù)據(jù)具有較好的可用性,可以作為圖書Altmetrics 評(píng)價(jià)指標(biāo)的數(shù)據(jù)來(lái)源。這3 個(gè)部類圖書在社會(huì)化閱讀平臺(tái)普遍能夠獲取對(duì)應(yīng)的圖書評(píng)分,且有較多用戶參與評(píng)分,能夠在一定程度上反映大眾對(duì)該類圖書社會(huì)影響力的認(rèn)知和評(píng)價(jià),圖書評(píng)分與圖書被引用次數(shù)之間存在較高的相關(guān)性,因而能較好地反映圖書的社會(huì)價(jià)值。將社會(huì)化閱讀平臺(tái)圖書評(píng)分作為這3 個(gè)部類圖書的評(píng)價(jià)指標(biāo)數(shù)據(jù)來(lái)源是可靠、可行的。
(2)在對(duì)社會(huì)科學(xué)部類圖書評(píng)價(jià)時(shí),可根據(jù)圖書具體大類有選擇地決定是否使用社會(huì)化閱讀平臺(tái)圖書評(píng)分?jǐn)?shù)據(jù)作為圖書Altmetrics 評(píng)價(jià)指標(biāo)的數(shù)據(jù)來(lái)源??傮w而言,社會(huì)科學(xué)部類圖書在社會(huì)化閱讀平臺(tái)中都存在圖書評(píng)分,且相當(dāng)一部分圖書的評(píng)分人數(shù)數(shù)量巨大,能夠很好反映大眾對(duì)圖書的評(píng)價(jià)。大部分圖書大類的評(píng)分?jǐn)?shù)據(jù)與圖書被引用次數(shù)之間存在一定的相關(guān)性,僅軍事大類和藝術(shù)大類圖書的兩個(gè)變量之間相關(guān)性不顯著,軍事大類圖書可能因?yàn)樵谄胀ㄓ脩糁惺鼙娤鄬?duì)較小,專業(yè)性較高,導(dǎo)致圖書評(píng)分?jǐn)?shù)據(jù)不能很好地反映圖書社會(huì)影響力價(jià)值,而在豆瓣讀書中對(duì)藝術(shù)大類圖書進(jìn)行評(píng)分的普通用戶在打分時(shí),可能更關(guān)注作品的藝術(shù)價(jià)值,因而與圖書被引用次數(shù),即學(xué)術(shù)價(jià)值,相關(guān)性不顯著。因此在對(duì)這兩類圖書進(jìn)行評(píng)價(jià)時(shí),不建議采用社會(huì)化閱讀平臺(tái)的圖書評(píng)分?jǐn)?shù)據(jù)作為其圖書Altmetrics 評(píng)價(jià)指標(biāo)的數(shù)據(jù)來(lái)源。而對(duì)于社會(huì)科學(xué)部類中的其他大類圖書,社會(huì)化閱讀平臺(tái)圖書評(píng)分?jǐn)?shù)據(jù)具有較好的可用性。
(3)對(duì)于自然科學(xué)部類圖書而言,社會(huì)化閱讀平臺(tái)圖書評(píng)分?jǐn)?shù)據(jù)可用性較差,不建議將其作為圖書Altmetrics 評(píng)價(jià)指標(biāo)的數(shù)據(jù)來(lái)源。一方面,自然科學(xué)圖書專業(yè)性較強(qiáng),一般為專業(yè)人士所閱讀學(xué)習(xí),社會(huì)化閱讀平臺(tái)的用戶大多不會(huì)在此類平臺(tái)上對(duì)自然科學(xué)圖書進(jìn)行評(píng)分,因此導(dǎo)致社會(huì)化閱讀平臺(tái)中自然科學(xué)圖書評(píng)分?jǐn)?shù)據(jù)較少。另一方面,由于只有少量用戶對(duì)這些圖書進(jìn)行評(píng)分,所以每個(gè)用戶的圖書評(píng)分會(huì)對(duì)平均評(píng)分產(chǎn)生較大影響,評(píng)分?jǐn)?shù)據(jù)的穩(wěn)定性較差。因此在對(duì)自然科學(xué)圖書進(jìn)行評(píng)價(jià)時(shí),建議不把社會(huì)化閱讀平臺(tái)圖書評(píng)分?jǐn)?shù)據(jù)納入Altmetrics 評(píng)價(jià)指標(biāo)的數(shù)據(jù)來(lái)源。
總體而言,雖然社會(huì)化閱讀平臺(tái)圖書評(píng)分與圖書被引用次數(shù)之間存在相關(guān)性,但是不同大類的圖書社會(huì)化閱讀平臺(tái)圖書評(píng)分?jǐn)?shù)據(jù)可用性存在明顯差異,因此在考慮是否使用社會(huì)化閱讀平臺(tái)圖書評(píng)分?jǐn)?shù)據(jù)作為圖書Altmetrics 評(píng)價(jià)指標(biāo)的數(shù)據(jù)來(lái)源時(shí),應(yīng)當(dāng)根據(jù)圖書類別謹(jǐn)慎選擇。肖敖夏等[13]和姜春林等[14]的研究也表明,社會(huì)化評(píng)價(jià)指標(biāo)在學(xué)科之間的表現(xiàn)具有較大差異,針對(duì)不同學(xué)科的評(píng)價(jià)應(yīng)該區(qū)別考量。區(qū)別在于,肖敖夏以Springer 出版的學(xué)術(shù)圖書為對(duì)象,分析發(fā)現(xiàn)自然科學(xué)和應(yīng)用科學(xué)的Bookmetrix 指標(biāo)表現(xiàn)優(yōu)于人文學(xué)科和社會(huì)科學(xué),而本研究發(fā)現(xiàn)社會(huì)科學(xué)部類的社會(huì)化閱讀平臺(tái)圖書評(píng)分?jǐn)?shù)據(jù)可用性優(yōu)于自然科學(xué)部類。
豆瓣讀書平臺(tái)作為社會(huì)化閱讀平臺(tái)的代表,該平臺(tái)用戶數(shù)量巨大,圖書量巨大,運(yùn)營(yíng)管理時(shí)間已有多年,形成了較為成熟的圖書評(píng)價(jià)管理機(jī)制,是社會(huì)大眾公認(rèn)的典型社會(huì)化閱讀平臺(tái)。因此其大規(guī)模的社會(huì)化閱讀平臺(tái)評(píng)分?jǐn)?shù)據(jù),具有較高的可靠性,以其作為圖書社會(huì)影響力評(píng)價(jià)的Altmetrics 評(píng)價(jià)數(shù)據(jù)指標(biāo)來(lái)源,具有可行性,只是在具體操作時(shí)要選擇性使用。
本研究對(duì)于每個(gè)圖書大類僅隨機(jī)選擇了30 本圖書進(jìn)行分析,樣本數(shù)量較小,且樣本來(lái)源為 《讀秀中文圖書被引用情況報(bào)告(2020)》 中提到的圖書,對(duì)結(jié)論推廣到所有圖書時(shí)可能會(huì)出現(xiàn)一定的偏差。
不同大類圖書社會(huì)化閱讀平臺(tái)評(píng)分?jǐn)?shù)據(jù)可用性存在差異,對(duì)于差異存在的原因本文未進(jìn)行深入探討,圖書本身、用戶、平臺(tái)等因素都有可能會(huì)對(duì)數(shù)據(jù)可用性產(chǎn)生影響,因此未來(lái)的研究可以進(jìn)一步分析用戶在社會(huì)化閱讀平臺(tái)上對(duì)圖書進(jìn)行評(píng)分時(shí)會(huì)受到哪些因素的影響及其影響程度。
農(nóng)業(yè)圖書情報(bào)學(xué)刊2021年11期