摘要:文章運(yùn)用主成分分析法和相關(guān)分析法,對(duì)我國35所大學(xué)網(wǎng)站的鏈接指標(biāo)和流量指標(biāo)進(jìn)行研究,探索了關(guān)于高校網(wǎng)站評(píng)價(jià)的方法。研究結(jié)果表明:鏈接指標(biāo)分析法與流量指標(biāo)分析法均是網(wǎng)站測(cè)度的有效方法,流量指標(biāo)分析法的效度要高于鏈接指標(biāo)分析法,然而鑒于鏈接指標(biāo)和流量指標(biāo)對(duì)網(wǎng)站評(píng)價(jià)各有側(cè)重,有必要將二者綜合;對(duì)于一些單一指標(biāo),指出了網(wǎng)絡(luò)影響因子作為網(wǎng)站測(cè)評(píng)指標(biāo)的不足,Alexa流量排名作為網(wǎng)站評(píng)價(jià)的指標(biāo)具有很高的效度。
關(guān)鍵詞:網(wǎng)絡(luò)計(jì)量;鏈接分析;流量分析
隨著網(wǎng)絡(luò)技術(shù)的發(fā)展和信息資源的數(shù)字化,網(wǎng)絡(luò)已成為人們工作生活中不可或缺的工具。然而網(wǎng)絡(luò)信息魚龍混雜,給人們獲取高質(zhì)量的信息帶來了一定的障礙,如何客觀地評(píng)價(jià)網(wǎng)絡(luò)信息成為了研究的熱點(diǎn)之一,并由此引出了一個(gè)新的研究領(lǐng)域——網(wǎng)絡(luò)計(jì)量學(xué)。網(wǎng)絡(luò)計(jì)量學(xué)是采用數(shù)學(xué)、統(tǒng)計(jì)學(xué)等各種定量研究方法,對(duì)網(wǎng)上信息的組織、存儲(chǔ)、分布、傳遞和開發(fā)利用等進(jìn)行定量描述和統(tǒng)計(jì)分析的一門學(xué)科,其主要研究網(wǎng)站的鏈接指標(biāo)和流量指標(biāo)。近年來,我國信息化水平不斷提高,各高校的信息化水平也逐漸成為衡量高校核心競爭力的重要標(biāo)準(zhǔn)之一。而高校的網(wǎng)站建設(shè)狀況是其信息化水平的直接反映,運(yùn)用網(wǎng)絡(luò)計(jì)量學(xué)的方法研究高校網(wǎng)站的建設(shè)狀況與其整體實(shí)力之間的關(guān)系,對(duì)于高校網(wǎng)站評(píng)價(jià)方法的研究及以后高校評(píng)價(jià)體系中引入網(wǎng)站建設(shè)情況都有很大的幫助。
一、研究對(duì)象與指標(biāo)數(shù)據(jù)
(一)研究對(duì)象
為了方便研究,本文選取中國校友會(huì)發(fā)布的《2014中國大學(xué)評(píng)價(jià)研究報(bào)告》中排名前50的高校為研究對(duì)象,研究網(wǎng)站指標(biāo)與排名得分之間的關(guān)系。
(二)研究指標(biāo)與獲取方法
本文運(yùn)用網(wǎng)絡(luò)計(jì)量學(xué)中的鏈接指標(biāo)分析法和網(wǎng)絡(luò)流量指標(biāo)分析法,選取了7個(gè)鏈接指標(biāo),包括總網(wǎng)頁數(shù)、總鏈接數(shù)、外鏈接數(shù)、內(nèi)鏈接數(shù)、總網(wǎng)絡(luò)影響因子、外部網(wǎng)絡(luò)影響因子、內(nèi)部網(wǎng)絡(luò)影響因子。流量指標(biāo)選取Alexa官方網(wǎng)站中關(guān)于某網(wǎng)站最新(2014)呈現(xiàn)的流量指標(biāo),包括網(wǎng)站的流量排名、網(wǎng)站的蹦失率、網(wǎng)站的平均訪問頁面數(shù)、網(wǎng)站的平均訪問時(shí)間。
鏈接指標(biāo)數(shù)據(jù)通過搜索引擎的高級(jí)搜索語言獲取。本文選用必應(yīng)作為鏈接指標(biāo)的獲取工具。以北京大學(xué)為例,只需在檢索框內(nèi)輸入表1中的高級(jí)檢索式,即可獲取鏈接指標(biāo)數(shù)據(jù)。
流量指標(biāo)是通過Alexa網(wǎng)站(www.alexa.com)進(jìn)行搜集,Alexa網(wǎng)站是美國亞馬遜公司旗下的一個(gè)網(wǎng)站,提供網(wǎng)站流量監(jiān)測(cè)和排名,是目前比較權(quán)威的第三方流量統(tǒng)計(jì)工具。
二、數(shù)據(jù)的處理與分析
(一)數(shù)據(jù)的預(yù)處理
由于網(wǎng)絡(luò)上的信息每天都在不斷地更新,因此搜索引擎在不同時(shí)間上獲得的數(shù)據(jù)不同,為了保證數(shù)據(jù)一致,本文將所有檢索任務(wù)統(tǒng)一在2014年8月10日上午8點(diǎn)至12點(diǎn)之間完成。50所高校中,中國地質(zhì)大學(xué)有北京和武漢兩個(gè)分校,兩所分校均具有自己的學(xué)校網(wǎng)站,得到兩組鏈接指標(biāo)數(shù)據(jù),為了方便研究,本文剔除中國地質(zhì)大學(xué)樣本。廈門大學(xué)、大連理工大學(xué)、北京協(xié)和醫(yī)學(xué)院、重慶大學(xué)、電子科技大學(xué)、南京理工大學(xué)的總網(wǎng)頁數(shù)小于100,作為排行前50的知名學(xué)校,其學(xué)校網(wǎng)站的網(wǎng)頁數(shù)如此之少,與本文的認(rèn)知是不相符的,所以將這6所學(xué)校剔除。對(duì)于總鏈接數(shù),北京師范大學(xué)、南開大學(xué)、南京農(nóng)業(yè)大學(xué)、中國海洋大學(xué)的數(shù)據(jù)都比其他大學(xué)高出數(shù)個(gè)數(shù)量級(jí),本文將這幾所大學(xué)剔除。外鏈接數(shù)是指某網(wǎng)站范圍之外的搜索引擎搜索到的鏈接到該網(wǎng)站的網(wǎng)頁總數(shù),高校網(wǎng)站的外鏈接數(shù)小于零是不可能的,因此我們將外鏈接數(shù)小于零的學(xué)校也剔除。綜上所述,對(duì)于特殊數(shù)據(jù)的處理共剔除了15所高校的數(shù)據(jù)。
(二)數(shù)據(jù)的分析與討論
1. 鏈接指標(biāo)分析
(1)主成分分析
利用spss19對(duì)鏈接指標(biāo)數(shù)據(jù)做降維因子分析,得到兩個(gè)主成分F1、F2,方差分別是75.217%和21.386%,累計(jì)方差為96.602%,兩個(gè)主成分累計(jì)方差超過80%,能夠很好地反映所有信息,因此得到的主成分計(jì)算公式和鏈接綜合得分公式如下。
F1=0.1×總網(wǎng)頁數(shù)+0.942×總鏈接數(shù)+0.968×外連接數(shù)+0.885×內(nèi)鏈接數(shù)+0.939×外鏈接網(wǎng)絡(luò)影響因子+0.939×內(nèi)鏈接網(wǎng)絡(luò)影響因子+0.939×總鏈接網(wǎng)絡(luò)影響因子
F2=0.958×總網(wǎng)頁數(shù)+0.291×總鏈接數(shù)+0.091×外連接數(shù)+0.454×內(nèi)鏈接數(shù)-0.306×外鏈接網(wǎng)絡(luò)影響因子-0.306×內(nèi)鏈接網(wǎng)絡(luò)影響因子-0.306×總鏈接網(wǎng)絡(luò)影響因子
z鏈接=0.75217×F1+0.21386×F2
(2)相關(guān)分析
將各鏈接指標(biāo)、鏈接總分與網(wǎng)站的排名得分之間進(jìn)行相關(guān)性比較,得到如下結(jié)果。
從表2中可以看出,Z鏈接、總網(wǎng)頁數(shù)、總鏈接數(shù)、外鏈接數(shù)、內(nèi)鏈接數(shù)與排名總分之間,在雙側(cè)置信度為0.01下顯著相關(guān),說明排名總分越高的學(xué)校,實(shí)力越強(qiáng),網(wǎng)站的規(guī)模趨于更大,指向網(wǎng)站的鏈接數(shù)越多,這與邱均平、段宇峰等的研究結(jié)果一致。網(wǎng)絡(luò)影響因子與排名總分之間的相關(guān)性并沒有得到理想的結(jié)果,本文認(rèn)為其原因有以下兩點(diǎn):首先,網(wǎng)絡(luò)影響因子的提出來源于期刊影響因子,期刊與學(xué)術(shù)性網(wǎng)站在很多方面的特征相同,但目前國內(nèi)大學(xué)網(wǎng)站主要是介紹性、發(fā)布性的內(nèi)容,真正純學(xué)術(shù)性的內(nèi)容較少,完全照搬期刊影響因子的應(yīng)用勢(shì)必得不到理想的結(jié)果;其次,商業(yè)搜索引擎的抓取能力有限,無法搜集到全部的鏈接數(shù)和網(wǎng)站下所有的網(wǎng)頁數(shù),用平均年每頁的被鏈接率來評(píng)價(jià)大學(xué)網(wǎng)站并不合適。因此,將網(wǎng)絡(luò)影響因子作為大學(xué)網(wǎng)站測(cè)評(píng)的指標(biāo),還有待探究。
2. 流量指標(biāo)分析
(1)主成分分析
蹦失率是指用戶瀏覽一個(gè)頁面就離開的訪問次數(shù)占該入口總訪問次數(shù)的比例,蹦出率越高,網(wǎng)頁越不受用戶歡迎。流量排名和蹦失率是兩個(gè)“負(fù)概念”,流量排名和蹦失率數(shù)值越大,網(wǎng)站的質(zhì)量越差,所以在進(jìn)行主成分分析前,本文將這兩個(gè)負(fù)概念轉(zhuǎn)為“正概念”,得到新的關(guān)于流量排名和蹦失率的兩組數(shù)據(jù)。然后進(jìn)行主成分分析,得到兩個(gè)主成分F1、F2,貢獻(xiàn)率分別為56.409%和27.620%,累計(jì)貢獻(xiàn)率為84.029%>80%,F(xiàn)1、F2的成分矩陣如表3所示。
同鏈接指標(biāo)的主成分分析,根據(jù)F1、F2的因子得分,計(jì)算出各高校的流量指標(biāo)綜合得分Z流量。
(2)相關(guān)分析
用spearman等級(jí)相關(guān)數(shù)檢驗(yàn)流量總分、流量排名、蹦失率、平均訪問頁面數(shù)、平均訪問時(shí)間與排名總分之間的相關(guān)性,得到結(jié)果如表4所示。
流量總分、流量排名、平均訪問頁面數(shù)、平均訪問時(shí)間均與排名總分顯著相關(guān),流量指標(biāo)可以較好地反映大學(xué)的綜合實(shí)力。其中流量排名與排名總分最相關(guān),且為負(fù)相關(guān),即高校的排名得分越高,其Alexa流量排名的值越?。磁琶娇壳埃?,因此Alexa流量排名對(duì)高校網(wǎng)站的評(píng)價(jià)具有較高的效率。分析結(jié)果顯示,蹦失率與排名總分之間并無顯著相關(guān)性,其原因是一些排名靠前的學(xué)校網(wǎng)站的蹦失率反而高于排名靠后的學(xué)校,用戶喪失嚴(yán)重,因此蹦失率高的學(xué)校要引起重視,加強(qiáng)網(wǎng)站信息整合,提高網(wǎng)站質(zhì)量,增強(qiáng)對(duì)用戶的吸引度。
3. 鏈接特征與流量特征綜合分析
鏈接指標(biāo)與流量指標(biāo)綜合得分均與高校排名得分顯著相關(guān),說明在網(wǎng)站進(jìn)行測(cè)評(píng)時(shí)鏈接指標(biāo)分析法和流量指標(biāo)分析法均具有一定的科學(xué)性和可行性。流量指標(biāo)綜合得分的相關(guān)性高于鏈接指標(biāo)綜合得分,并且流量指標(biāo)數(shù)據(jù)是通過Alexa網(wǎng)站,其具有一定的專業(yè)性和權(quán)威性,而鏈接指標(biāo)的獲取通過商業(yè)搜索引擎,商業(yè)搜索引擎有其局限性。因此,從專業(yè)性角度來說,流量指標(biāo)分析法效度高于鏈接指標(biāo)分析法,而綜合運(yùn)用兩種方法能夠更加全面地對(duì)網(wǎng)站進(jìn)行評(píng)價(jià)。
三、結(jié)語
大學(xué)網(wǎng)站評(píng)價(jià)與大學(xué)綜合實(shí)力排名相關(guān),在一定程度上大學(xué)網(wǎng)站評(píng)價(jià)可以作為學(xué)校綜合實(shí)力評(píng)價(jià)的輔助和參考。一般情況下,排名越靠前的高校,實(shí)力越強(qiáng),科研水平越高,且由于具有豐富的辦學(xué)資源和良好的學(xué)校形象,勢(shì)必帶來大量的鏈接和用戶流量。就網(wǎng)站評(píng)價(jià)中鏈接分析法和流量分析法而言,二者均是網(wǎng)站測(cè)度的有效方法,流量分析法評(píng)價(jià)高校網(wǎng)站的效度高于鏈接分析法,但為了使評(píng)價(jià)結(jié)果更全面準(zhǔn)確,可以綜合運(yùn)用兩種方法。
參考文獻(xiàn):
[1]邱均平,陳敬全.網(wǎng)絡(luò)信息計(jì)量學(xué)及其應(yīng)用研究[J].情報(bào)理論與實(shí)踐,2001(03).
[2]郭亞寧,徐偉.高校網(wǎng)站評(píng)價(jià)應(yīng)用研究——以國內(nèi)15所農(nóng)林類院校網(wǎng)站為例[J].農(nóng)業(yè)圖書情報(bào)學(xué)刊,2014(02).
[3]劉文云,翟羽佳,王文穎.基于鏈接分析法的高校圖書館網(wǎng)站影響力評(píng)價(jià)研究[J].情報(bào)科學(xué),2013(06).
[4]曹梅.教育網(wǎng)站評(píng)價(jià)的網(wǎng)絡(luò)計(jì)量模式初探[J].開放教育研究,2011(05).
[5]邱均平,張洋.網(wǎng)絡(luò)信息計(jì)量學(xué)綜述[J].高校圖書館工作,2005(01).
[6]Ingwersen P. The Calculation of Web impact factors[J].Journal of Documentation, 1998(02).
[7]邱均平,陳敬全,段宇鋒.中國大學(xué)網(wǎng)站鏈接分析及網(wǎng)絡(luò)影響因子探討[J].中國軟科學(xué),2003(06).
(作者單位:江蘇大學(xué)工商管理學(xué)院)