周海晨+陸和建
摘要從“985工程”高校圖書館微信公眾號(hào)推送文章及其相關(guān)數(shù)據(jù)出發(fā),采用基于Python語言的爬蟲程序獲取36所高校推文數(shù)據(jù)作為樣本數(shù)據(jù),使用Tableau繪制有關(guān)圖表,并結(jié)合微信傳播指數(shù)(WeChat Communication Index,WCI),分析“985工程”高校圖書館微信公眾號(hào)推送文章的特征及規(guī)律,由此提出改進(jìn)建議。
關(guān)鍵詞 高校圖書館 微信 爬蟲程序P ython WCI
1我國高校圖書館微信服務(wù)研究綜述
微信服務(wù)在高校圖書館中的重要性逐漸上升,有關(guān)其應(yīng)用情況的研究逐漸被專家學(xué)者所重視。其中包含大量對(duì)高校圖書館微信服務(wù)現(xiàn)狀的分析研究。2014年,張秋等從微信號(hào)開通情況、開通時(shí)間、發(fā)帖量以及發(fā)布內(nèi)容等幾個(gè)角度,分析發(fā)展現(xiàn)狀,提出對(duì)策。葉佩珍則從平臺(tái)建設(shè)、運(yùn)營狀況、服務(wù)內(nèi)容及宣傳推廣等方面對(duì)我國高校圖書館微信服務(wù)狀況進(jìn)行調(diào)查,分析其發(fā)展?fàn)顩r及存在問題,并提出相應(yīng)對(duì)策。張駿毅等選取“211工程”高校圖書館作為研究對(duì)象,分析微信在圖書館中的應(yīng)用率、服務(wù)內(nèi)容的深度與廣度以及關(guān)鍵詞與互動(dòng)咨詢模式等存在的不足,在此基礎(chǔ)上提出微信服務(wù)發(fā)展建議。陳雨雪則對(duì)“985工程”高校圖書館微信公眾號(hào)的名稱、類型、是否認(rèn)證、首條推送消息等細(xì)節(jié)進(jìn)行記錄,并統(tǒng)計(jì)微信號(hào)提供的服務(wù)情況。
同時(shí),也有部分針對(duì)實(shí)踐經(jīng)驗(yàn)、營銷策略等方面的研究。2013年,王靜等從新媒體環(huán)境下對(duì)高校圖書館如何開展微博、微信相結(jié)合的微營銷展開論述,作者指出,高校圖書館可以通過整合運(yùn)營模式設(shè)立營銷團(tuán)隊(duì)、細(xì)分粉絲群體來將二者進(jìn)行整合,提高傳播效率。史梅以南京大學(xué)圖書館作為研究對(duì)象,分析經(jīng)營策略,總結(jié)成功經(jīng)驗(yàn):如積極運(yùn)用微信OpenAPI接口,嵌入館藏查詢、書刊續(xù)借等實(shí)用功能。徐彩霞等提出加強(qiáng)高校圖書館間的合作交流,跳出微博思維,分配專職運(yùn)營人員等建議。
然而,上述研究多圍繞應(yīng)用現(xiàn)狀、實(shí)踐經(jīng)驗(yàn)、營銷策略等展開,鮮有對(duì)高校圖書館微信服務(wù)效果的定量分析研究,特別是采集長期、海量微信推送文章作為研究對(duì)象的成果更是少見。萬慕晨等通過對(duì)“985工程”高校圖書館微信數(shù)據(jù)中閱讀推廣相關(guān)信息的提取,結(jié)合微信傳播指數(shù)WCI進(jìn)行實(shí)證研究。劉曉莉等則將互動(dòng)性引入圖書館學(xué)研究領(lǐng)域,構(gòu)建出高校圖書館微信公眾平臺(tái)的用戶滿意度影響機(jī)制模型。
文章通過構(gòu)建基于Python的爬蟲程序系統(tǒng),從新媒體指數(shù)平臺(tái)——清博指數(shù)(www.gsdata.cn)中收集2015年8月1日至2016年7月31日“985工程”高校圖書館微信號(hào)所發(fā)布的推送文章、閱讀量、點(diǎn)贊數(shù)等相關(guān)信息作為原始數(shù)據(jù),結(jié)合微信傳播指數(shù)WCI與數(shù)據(jù)可視化分析軟件Tableau分析,找出當(dāng)前“985工程”高校圖書館微信服務(wù)存在的優(yōu)缺點(diǎn),并據(jù)此提出實(shí)質(zhì)性改進(jìn)建議。
2研究過程
2.1數(shù)據(jù)來源
清博指數(shù)擁有目前國內(nèi)最大的第三方“兩微一端”(微信、微博、APP)數(shù)據(jù)庫,旗下的微信傳播指數(shù)WCI、微博傳播指數(shù)BCI(Micro-blog CommunicationIndex)因其獨(dú)特權(quán)威的算法公式已成為行業(yè)領(lǐng)域標(biāo)桿。目前已有超過1.9萬家單位使用該平臺(tái)來制作榜單。選擇該平臺(tái)作為研究數(shù)據(jù)來源的原因如下:①來源領(lǐng)域權(quán)威專家;②收錄完整推送文章;③獨(dú)創(chuàng)量化分析標(biāo)準(zhǔn)。微信傳播指數(shù)WCI(計(jì)算公式如表1所示)通過微信公眾號(hào)推送文章的傳播度、覆蓋度及賬號(hào)的影響力,來反映微信整體熱度發(fā)展趨勢。
2.2數(shù)據(jù)采集
為了使得數(shù)據(jù)采集過程更為清晰,同時(shí)獲得更為規(guī)范、結(jié)構(gòu)化的原始信息。文章以Python語言為基礎(chǔ)構(gòu)建出一套針對(duì)性的網(wǎng)絡(luò)爬蟲(如圖1所示)。整體采集流程可以分為五個(gè)步驟。
第一步,查找39所“985工程”高校圖書館微信公眾號(hào),手工收集開通微信公眾號(hào)且有推送文章的ID(如廈門大學(xué):xmulib)。經(jīng)過篩選,排除電子科技大學(xué)(開通,目標(biāo)時(shí)間段內(nèi)未推送文章)、國防科技大學(xué)(開通,目前尚未投入使用)、中國農(nóng)業(yè)大學(xué)(未開通),共獲得36個(gè)高校圖書館微信ID。
第二步,將36個(gè)ID放入爬蟲列表內(nèi),啟動(dòng)推文鏈接爬蟲,爬蟲便會(huì)依照程序遍歷所有ID,并爬取每個(gè)ID下2015年8月1日至2016年7月31日內(nèi)的所有推文標(biāo)題、閱讀量、點(diǎn)贊數(shù)、摘要、鏈接、發(fā)布時(shí)間、發(fā)布者名稱,以字典形式插入到非關(guān)系型數(shù)據(jù)庫MongoDB中的URL-list集合中儲(chǔ)存。
第三步,從URL-list集合中抽取所有推文鏈接地址,得到推文鏈接列表。
第四步,啟動(dòng)推文詳情爬蟲,遍歷所有推文鏈接并抓取公眾號(hào)推文中的文本、標(biāo)題、鏈接等。
第五步,以字典形式插入到MongoDB中的In-fo_list集合,完成采集、以待調(diào)用。
在數(shù)據(jù)處理前,需先將MongoDB數(shù)據(jù)庫中的數(shù)據(jù)導(dǎo)出為CSV格式文件,分別命名為wechat-url.CSV與wechat info.CSV。
2.3數(shù)據(jù)處理與分析
使用Excel進(jìn)行數(shù)據(jù)去重、字段格式規(guī)范化等功能進(jìn)行數(shù)據(jù)處理。如利用文章URL是否相同作為篩選標(biāo)準(zhǔn),剔除重復(fù)的數(shù)據(jù)記錄,得到wechaturl.CSV含5782條記錄,且最終得到wechat info.CSV含5681條記錄。其中記錄缺失的主要原因?yàn)椋孩偻莆囊虺u被舉報(bào)或涉及敏感內(nèi)容而無法查看;②推文被刪除,無法采集。
數(shù)據(jù)分析階段,首先利用Tableau(一款無需用戶編寫自定義代碼、數(shù)據(jù)可拓展性強(qiáng)的可視化工具,能幫助使用者挖掘海量信息中的內(nèi)在關(guān)聯(lián)。)以所有數(shù)據(jù)為對(duì)象繪制圖表,并依據(jù)WCI進(jìn)行“985工程”高校圖書館微信公眾號(hào)排名,對(duì)36個(gè)公眾號(hào)運(yùn)營情況產(chǎn)生初步了解。隨后,深入分析,以幾所特色高校為對(duì)象繪制圖表,并將數(shù)據(jù)處理后得到的兩個(gè)CSV格式文件導(dǎo)入Tableau,匹配擁有相同URL的記錄,最終得到5778條記錄(數(shù)據(jù)格式如表2所示)。
3討論與分析
3.1WCI指數(shù)排名
WCI指數(shù)評(píng)價(jià)合理全面,能科學(xué)體現(xiàn)各微信公眾號(hào)整體運(yùn)營情況。同時(shí)該指數(shù)按照日、周、月為周期進(jìn)行統(tǒng)計(jì)。為體現(xiàn)“985工程”高校圖書館微信運(yùn)營整體最佳實(shí)力,選取推送文章數(shù)最多的4月作為統(tǒng)計(jì)月。因4月23日是世界讀書日,各高校圖書館開展微信推送服務(wù)的意愿與實(shí)際行動(dòng)能得到良好體現(xiàn)。同時(shí),根據(jù)清博指數(shù)相關(guān)數(shù)據(jù)可知,4月是熱文數(shù)量與閱讀量最高的月,分別為875篇熱文與36萬以上閱讀量。從清博指數(shù)總榜單中,將2016年4月作為統(tǒng)計(jì)區(qū)間,選擇36所高校圖書館微信公眾號(hào)作為統(tǒng)計(jì)對(duì)象,其中東北大學(xué)、西北農(nóng)林科技大學(xué)未納入統(tǒng)計(jì)(二者微信號(hào)開通時(shí)間均在6月)。同時(shí),因中央民族大學(xué)、電子科技大學(xué)與中國海洋大學(xué)在4月沒有推送文章,故最終得到31所“985工程”高校圖書館微信WCI排名(見表3)。
分析可知,“985工程”高校圖書館WCI存在輕微程度的兩極分化,排名第一為重慶大學(xué)(489.49),排名最末為北京理工大學(xué)(88.18),二者相差401.31;WCI平均值為315.4,19所高校圖書館高于平均水平,12所低于平均水平;指數(shù)在400以上有重慶大學(xué)、清華大學(xué)、武漢大學(xué)、廈門大學(xué)圖書館。
3.2微信推文、平均閱讀量、平均點(diǎn)贊數(shù)統(tǒng)計(jì)
通過WCI排名分析“985工程”高校圖書館微信整體營運(yùn)水平,可更加直觀地識(shí)別具有參考價(jià)值的高校圖書館微信號(hào),通過數(shù)據(jù)挖掘與分析,嘗試提出具有實(shí)際意義的建議。
使用Tableau進(jìn)行統(tǒng)計(jì)分析,將高校圖書館作為行參數(shù),推送文章數(shù)、平均閱讀量以及平均點(diǎn)贊數(shù)作為列參數(shù),按照推送文章數(shù)量多少排列(如圖2)。
推送文章數(shù)指2015年8月1日至2016年7月31日微信公眾號(hào)所推送文章數(shù)目總和。從圖中可知,山東大學(xué)、湖南大學(xué)、浙江大學(xué)圖書館的推文數(shù)遙遙領(lǐng)先,分別為530、507與484。而WCI排名為9、15、7,較推文數(shù)量排名較差。
平均閱讀量的計(jì)算方法是將所有推文的閱讀量求和后取平均值。不難發(fā)現(xiàn),四川大學(xué)、廈門大學(xué)及大連理工大學(xué)圖書館平均閱讀量最高。
平均點(diǎn)贊數(shù)是將所有推文點(diǎn)贊數(shù)求和后取平均值。排名前3位的高校圖書館微信公眾號(hào)為:四川大學(xué)、大連理工大學(xué)、武漢大學(xué)。WCI排名分別為5、13、3,整體靠前。另外,這三所高校的平均閱讀量排名靠前,由此可推知,平均點(diǎn)贊數(shù)與平均閱讀量可能存在一定的關(guān)聯(lián)性,即平均閱讀量越多,平均點(diǎn)贊數(shù)多的可能性更大。
根據(jù)差異可將高校圖書館分為兩類:第一類擁有較多推文數(shù)量,閱讀量與點(diǎn)贊數(shù)卻只處于平均水平,即推文數(shù)量排名遠(yuǎn)高于平均閱讀量、點(diǎn)贊數(shù)排名。這類高校圖書館以山東大學(xué)、湖南大學(xué)及浙江大學(xué)最為典型。第二類高校圖書館推文數(shù)量處于或低于平均水平,卻擁有較高的平均閱讀量與點(diǎn)贊數(shù),即推文數(shù)量排名遠(yuǎn)次于平均閱讀量、點(diǎn)贊數(shù)排名。第二類以四川大學(xué)、廈門大學(xué)及大連理工大學(xué)為代表。圍繞以上兩類圖書館,結(jié)合Python爬蟲采集的相關(guān)數(shù)據(jù),嘗試分析出形成差異的主要原因。
3.3推文內(nèi)容分析
基于第一類、第二類共6所高校圖書館推送的1923篇微信推送文章,篩選出閱讀量大于3千次的文章,按照微信公眾號(hào)進(jìn)行羅列(見表4)。四川大學(xué)以12篇文章高居榜首,其次是大連理工大學(xué)為11篇文章,廈門大學(xué)與山東大學(xué)分別是4篇與2篇。
推送的28篇文章按照內(nèi)容可劃分為:公告通知、問卷投票、趣味推薦、實(shí)用技巧、數(shù)據(jù)可視化等。主題涵蓋的范圍并不全面,例如沒有信息素養(yǎng)講座、主題展覽、圖書活動(dòng)等常見主題,但這28篇文章產(chǎn)生高閱讀量之原因仍值得深入分析。
根據(jù)企鵝智庫發(fā)布的《2016微信影響力報(bào)告》,在投票“向朋友圈或好友轉(zhuǎn)發(fā)文章時(shí)你的決策理由是”中排在前三名的答案是:內(nèi)容有價(jià)值(48.8%)、內(nèi)容有趣(39.2%)及情感觸動(dòng)(38.6%)。
四川大學(xué)圖書館在微信號(hào)運(yùn)營上取得了“低投入、高回報(bào)”的效果,即推送文章數(shù)量上略低于“985工程”高校圖書館微信公眾號(hào)的平均水平,但其平均閱讀量與平均點(diǎn)贊數(shù)均排名第一,可謂微信運(yùn)營成本低投入、高產(chǎn)出的最佳范本。在兩類高校圖書館微信公眾號(hào)篩選出的28篇文章中,四川大學(xué)占了12篇,接近43%。從內(nèi)容角度分析這12篇文章,充分說明了趣味性和情感觸動(dòng)是引發(fā)閱讀、轉(zhuǎn)載的重要因素。
《江安閉館音樂大放送無論何時(shí),惟愿你聽歌如見我》一文的閱讀量驚人地達(dá)到了近3.7萬次,遠(yuǎn)超閱讀量排名第二位的清華大學(xué)圖書館的《北館有些啥》(閱讀量1.8萬次)。觀其內(nèi)容,只是發(fā)布了圖書館的閉館音樂,并告知其名稱,結(jié)果卻形成海量閱讀與傳播。其原因包括:(1)觸動(dòng)受眾內(nèi)心情感。閉館音樂伴隨著開館10年的每一天,由于流傳久遠(yuǎn),優(yōu)美的音樂已成為無數(shù)川大學(xué)子心中關(guān)于大學(xué)時(shí)光的最好印記,成為川大人共同的回憶。許多畢業(yè)或在讀的川大學(xué)子在閱讀到這篇文章的第一時(shí)刻便進(jìn)行轉(zhuǎn)載,引發(fā)大量關(guān)注;(2)滿足受眾迫切需求。由于閉館音樂本身的優(yōu)美,使得許多學(xué)子心存好奇,想探其究竟。在了解到這一潛在需求后,川大圖書館便以懷舊抒情的風(fēng)格創(chuàng)作了該推文,滿足了大部分訂閱者這份存在已久的好奇。
《畢業(yè)數(shù)據(jù)大放送你有一封來自圖書館的不二情書》取得了近1.2萬次閱讀的成績,是少數(shù)破萬閱讀量的文章。該文以一封私密情書的形式,展示了大部分畢業(yè)生第一次到館時(shí)間、當(dāng)天天氣、大學(xué)4年借書名單及擁有時(shí)間最長的書籍。許多畢業(yè)已久的川大學(xué)子,紛紛關(guān)注微信號(hào)并閱讀該文章,相互轉(zhuǎn)發(fā),掀起一股懷舊風(fēng)潮。該文章的成功同樣離不開對(duì)服務(wù)對(duì)象需求的把握:(1)在該文前發(fā)布的《這些年,我在川大讀過的書——致2015屆畢業(yè)生》,由于在去年取得了良好的反響,不少校友紛紛留言希望能看到自己當(dāng)年的到館或借閱圖書情況。在了解到這一需求后,川大圖書館今年專門將2005年后入學(xué)的校友數(shù)據(jù)整理出來,一并放送;(2)在該文發(fā)布后,大量校友留言找不到當(dāng)年的學(xué)號(hào),無法看到屬于自己的不二情書。川大圖書館便迅速制作并推送了《忘記卡號(hào)畢業(yè)生如何找回和綁定當(dāng)年卡號(hào)(小游戲)》一文,用游戲通關(guān)的方式獲得學(xué)號(hào),充滿趣味性,再次獲得了大量關(guān)注,成為川大所推送文章中超越不二情書并排名第二的推文。
同時(shí)川大圖書館還結(jié)合當(dāng)下熱點(diǎn):如《羋月傳如何優(yōu)雅而專業(yè)地八卦》利用當(dāng)時(shí)正在熱播的電視劇作為切入點(diǎn),演示如何利用圖書館資源進(jìn)行學(xué)術(shù)檢索,生動(dòng)有趣地完成一次信息素養(yǎng)培訓(xùn)?!?016情人節(jié)特別篇圖書館愛神,請(qǐng)賜予我力量!》一文則結(jié)合情人節(jié),推薦了文學(xué)世界中的情侶及其愛情名言,并附書籍序列號(hào)。該文巧妙地將熱點(diǎn)話題與閱讀推廣相結(jié)合,獲得了3220次的閱讀量。
大連理工大學(xué)、廈門大學(xué)以及山東大學(xué)圖書館在28篇文章中分別占有11篇、4篇與2篇,占總比重的39%、14%以及7%。大連理工大學(xué)上榜文章主要為公告通知,體現(xiàn)了圖書館微信公眾號(hào)作為第一手消息發(fā)布的重要功能。除此之外,結(jié)合生活中的痛點(diǎn)、熱點(diǎn)進(jìn)行創(chuàng)作也能取得良好的效果。大連理工大學(xué)的《你才不是借書不還的女同學(xué)》一文,將替人借書不還這一不少人的遭遇作為切入點(diǎn),用充滿無奈、自嘲的口吻表達(dá)了借書人的不滿,同時(shí)給出相關(guān)建議,最終獲得3796次的閱讀量。廈門大學(xué)的《圕·時(shí)光:給畢業(yè)生的一份禮物》與四川大學(xué)的“不二情書”有著異曲同工之妙,此處不再贅述。
上榜名單中,第一類高校圖書館(山東大學(xué)、湖南大學(xué)、浙江大學(xué)圖書館)只有山東大學(xué)的2篇文章在列,且均為活動(dòng)投票類文章。其閱讀量并不能充分反映出文章的受歡迎程度?;诘谝活惛咝F毡楦咄度搿⒌突貓?bào)的情況,需從文章的“質(zhì)”入手,而非一味地大量產(chǎn)出。
4“985工程”高校圖書館微信號(hào)運(yùn)營建議
4.1結(jié)合指數(shù),客觀評(píng)價(jià)
結(jié)合前文分析,可以發(fā)現(xiàn)“985工程”高校圖書館在運(yùn)營水平與能力上參差不齊,每所高校圖書館所面臨的運(yùn)營問題也不盡相同。亟待一套能將微信運(yùn)營量化的指標(biāo),以便各高校圖書館能獲得及時(shí)、客觀的評(píng)價(jià),并與其他同類微信號(hào)或歷史情況比較,清楚當(dāng)前自身所處位置。如前文所述,WCI很好的滿足了高校圖書館這一需求,高校圖書館結(jié)合WCI,定期分析相關(guān)指數(shù),結(jié)合具體評(píng)價(jià)指標(biāo),發(fā)現(xiàn)并解決問題(如發(fā)現(xiàn)某類主題推文平均閱讀量持續(xù)走低,則可減少該類主題推文數(shù)量),而非憑感覺、隨意制定運(yùn)營計(jì)劃。
4.2走出誤區(qū),質(zhì)量兼顧
統(tǒng)計(jì)可知,部分高校擁有高推文量的同時(shí)未能取得良好的效果反饋。高推文數(shù)反映了該微信公眾號(hào)擁有較為積極的態(tài)度,筆耕不輟。但推文數(shù)量與推文的影響力并不存在顯著相關(guān)性,量變未必引起質(zhì)變。同時(shí),存在部分高校圖書館推文數(shù)量遠(yuǎn)低于平均水平,折射出圖書館并未對(duì)微信服務(wù)引起足夠重視。這兩類微信公眾號(hào)均需在文章的質(zhì)量與數(shù)量上取得平衡,做到質(zhì)量兼顧。
4.3形式活潑,聆聽反饋
對(duì)比分析兩類圖書館微信公眾號(hào),可以發(fā)現(xiàn),期望創(chuàng)作出高閱讀量、高點(diǎn)贊數(shù)的優(yōu)質(zhì)文章以下四點(diǎn)可作為參考:
(1)提升文章趣味屬性。高校圖書館微信公眾號(hào)受眾主要為在校學(xué)生,輕松活潑的行文風(fēng)格更易吸引該類受眾,可選拔一批幽默活潑善于表達(dá)的同齡大學(xué)生參與創(chuàng)作。如四川大學(xué)、大連理工大學(xué)在語言風(fēng)格上緊貼網(wǎng)絡(luò)潮流,靈活運(yùn)用表情包、熱門段子等網(wǎng)絡(luò)素材,拉近與服務(wù)對(duì)象的距離,保持用戶粘性。
(2)結(jié)合當(dāng)下熱點(diǎn)話題。熱點(diǎn)話題是某段時(shí)間及區(qū)域內(nèi)被廣泛討論的話題,有突發(fā)事件(如《羋月傳》熱播)也有節(jié)假日等固定事件。創(chuàng)作者要善于觀察,靈活地結(jié)合時(shí)下熱點(diǎn)話題進(jìn)行推文創(chuàng)作,吸引受眾眼球,以達(dá)到推文本身所期望的目的(如結(jié)合情人節(jié)推送文學(xué)大家著作的閱讀推廣推文)。
(3)重視受眾需求反饋。2014年末,微信文章開通評(píng)論功能,該功能的開啟使得公眾號(hào)運(yùn)營者有了重要的文章效果反饋渠道。運(yùn)營者需要重視評(píng)論、深入了解受眾需求,針對(duì)受眾需求進(jìn)行創(chuàng)作才能取得更好的傳播效果。
(4)挖掘受眾情感痛點(diǎn)。每類受眾都有自身所特有的情感痛點(diǎn)。高校圖書館微信公眾號(hào)的推送對(duì)象以學(xué)生為主,瞄準(zhǔn)該類對(duì)象的情感需求,往往能取得不錯(cuò)的效果。如四川大學(xué)圖書館針對(duì)應(yīng)屆和往屆畢業(yè)生對(duì)過往大學(xué)歲月的追憶與懷念的情感痛點(diǎn),使閱讀量輕松過萬,且獲得許多校友的關(guān)注。