徐芳
〔摘 要〕以我國20個(gè)省級教育信息綜合網(wǎng)站為樣本,運(yùn)用Google搜索引擎和網(wǎng)絡(luò)鏈接分析方法獲取樣本網(wǎng)站的總鏈接數(shù)、內(nèi)部鏈接數(shù)、外部鏈接數(shù)和網(wǎng)頁總數(shù)等鏈接分析指標(biāo)數(shù)據(jù),并對網(wǎng)絡(luò)影響因子進(jìn)行計(jì)算。然后使用灰關(guān)聯(lián)排序的方法對其中八項(xiàng)指標(biāo)數(shù)值進(jìn)行測度,在此基礎(chǔ)上對我國省級教育信息綜合網(wǎng)站的建設(shè)狀況、利用狀況和影響力情況進(jìn)行分析研究。
〔關(guān)鍵詞〕教育信息網(wǎng)站;鏈接分析法;評價(jià)
〔中圖分類號(hào)〕G250.2 〔文獻(xiàn)標(biāo)識(shí)碼〕A 〔文章編號(hào)〕1008-0821(2012)09-0168-04
隨著信息技術(shù)和互聯(lián)網(wǎng)的日益普及,網(wǎng)絡(luò)成為人們獲取和交流教育信息的重要平臺(tái)。教育信息網(wǎng)站為社會(huì)提供教育信息政策,宣傳地區(qū)的教育成果和經(jīng)驗(yàn),囊括了教學(xué)、招生、學(xué)校宣傳等方面的信息,它的建設(shè)、利用和影響力情況直接關(guān)系到教育信息傳播的廣泛性、及時(shí)性和公眾易獲取性。
網(wǎng)站影響力是指網(wǎng)站的信息資源與服務(wù)通過網(wǎng)絡(luò)實(shí)現(xiàn)傳遞、交流和利用,從而改變他人的思想和行動(dòng)的能力[1]。評價(jià)網(wǎng)站影響力的方法主要可分為兩種:一種是主觀定性評價(jià),該方法主要是從用戶的角度出發(fā),通過用戶直接評價(jià)、用戶獲取信息后行為改變等方面進(jìn)行評價(jià)。它主要包括問卷調(diào)查法、社會(huì)效益評價(jià)等。而另外一種方法是客觀定量評價(jià),定量評價(jià)是以實(shí)際數(shù)據(jù)為主要評價(jià)依據(jù),其評價(jià)結(jié)果更為客觀、科學(xué),因此定量評價(jià)是目前最為常用的評價(jià)方法[2]。鏈接分析法是客觀定量評價(jià)中比較重要的方法之一。網(wǎng)站的不同鏈接體現(xiàn)的是不同的信息功能,具有不同的特征和規(guī)律,對網(wǎng)站的鏈接特征進(jìn)行分析是了解網(wǎng)站建設(shè)情況和影響力的一個(gè)重要途徑。鏈接分析法是運(yùn)用網(wǎng)絡(luò)數(shù)據(jù)庫、數(shù)學(xué)分析軟件等工具,利用數(shù)學(xué)(主要是統(tǒng)計(jì)學(xué)和拓?fù)鋵W(xué))和情報(bào)學(xué)的方法,對網(wǎng)絡(luò)鏈接自身屬性、鏈接對象、鏈接網(wǎng)絡(luò)等各種對象進(jìn)行分析,以便揭示其數(shù)量特征和內(nèi)在規(guī)律,并用以解決各方面問題的一種研究方法[3]。本文運(yùn)用網(wǎng)絡(luò)鏈接分析的方法對我國20個(gè)省級教育信息綜合網(wǎng)站進(jìn)行定量評價(jià),并結(jié)合評價(jià)結(jié)果對其影響力、利用和建設(shè)現(xiàn)狀進(jìn)行研究,以期對教育信息網(wǎng)站的建設(shè)起到推進(jìn)作用。
1 研究方法
1.1 研究對象的選取
研究對象源自《中國教育信息化》的2011年第12期上所刊登的的中國省級教育信息綜合網(wǎng)站排行榜。上榜的20個(gè)省級教育網(wǎng)站的具體信息見表1。
1.2 研究指標(biāo)的選取
在研究指標(biāo)的選取方面,本文根據(jù)研究性質(zhì)和需求,選取以下9個(gè)指標(biāo):
1.2.1 總鏈接數(shù)
鏈接總數(shù)是衡量網(wǎng)站鏈接數(shù)量特征最重要的指標(biāo)之一,反映了網(wǎng)站被鏈接的總數(shù),體現(xiàn)了該網(wǎng)站的影響力和網(wǎng)絡(luò)輻射力。通常,網(wǎng)站中的鏈接數(shù)量越多,信息的揭示程度就越高,組織體系越完備[4],用戶通過訪問此類型的網(wǎng)站所能獲取的信息資源會(huì)越豐富。
1.2.2 外部鏈接數(shù)
網(wǎng)站的外部鏈接數(shù)是評價(jià)網(wǎng)站影響力和價(jià)值的重要尺度。外部鏈接數(shù)是指運(yùn)用搜索引擎,針對某網(wǎng)站范圍外搜索到的與該網(wǎng)站存在鏈接的網(wǎng)頁數(shù)。該指標(biāo)能夠更好地反映網(wǎng)站的質(zhì)量。
1.2.3 內(nèi)部鏈接數(shù)
內(nèi)鏈接數(shù)是來自網(wǎng)站自身內(nèi)部鏈接情況的指標(biāo),集中反映了該網(wǎng)站內(nèi)部層次結(jié)構(gòu)的完備性。
1.2.4 網(wǎng)頁總數(shù)
網(wǎng)頁總數(shù)是指一個(gè)網(wǎng)站所包含的所有網(wǎng)頁的數(shù)量,主要反映網(wǎng)站的規(guī)模和內(nèi)容豐富程度。
1.2.5 鏈接效率
鏈接效率是指外部鏈接數(shù)占總鏈接數(shù)的比例。鏈接效率能夠客觀地表明網(wǎng)站鏈接來源的組成結(jié)構(gòu)。外部鏈接所占的比例越高,其鏈接效率就越高,即間接網(wǎng)站的相對影響力就越大。
1.2.6 網(wǎng)絡(luò)影響因子
網(wǎng)站規(guī)模大,被其他網(wǎng)站鏈接的次數(shù)就多,而規(guī)模小的網(wǎng)站則會(huì)處于劣勢。為了準(zhǔn)確地評價(jià)網(wǎng)站影響力,需要消除網(wǎng)站因?yàn)橐?guī)模不同造成的影響,網(wǎng)絡(luò)影響因子的出現(xiàn)在一定程度上可以實(shí)現(xiàn)此要求。網(wǎng)絡(luò)影響因子可以反應(yīng)網(wǎng)站網(wǎng)頁被鏈接的總平均水平,其值為總鏈接數(shù)和網(wǎng)頁數(shù)之比。
1.2.7 內(nèi)部網(wǎng)絡(luò)影響因子
網(wǎng)站內(nèi)鏈接數(shù)和網(wǎng)頁數(shù)的比值即為內(nèi)部網(wǎng)絡(luò)影響因子,它反映的是網(wǎng)站網(wǎng)頁的自鏈接的總平均水平。
1.2.8 外部網(wǎng)絡(luò)影響因子
網(wǎng)站外鏈接數(shù)和網(wǎng)頁數(shù)的比值被稱為外部網(wǎng)絡(luò)影響因子,它反映了網(wǎng)站網(wǎng)頁被外部鏈接的總平均水平。
1.2.9 PR值
PR值是Google特有的衡量網(wǎng)頁重要程度的指標(biāo),用來標(biāo)識(shí)網(wǎng)頁的等級和重要性。級別從1級到10級,10級為滿分。由于PR值最直接的影響因素是來自鏈接,所以網(wǎng)站所得到的高質(zhì)量導(dǎo)入鏈接越多,網(wǎng)站PR值就可能越高,PR值越高則說明該網(wǎng)站網(wǎng)頁在搜索排名中的地位越重要[5]。
1.3 研究工具的選擇
搜索引擎作為網(wǎng)絡(luò)計(jì)量學(xué)研究中最基本的研究工具之一,被廣泛應(yīng)用于對網(wǎng)站鏈接特征進(jìn)行數(shù)據(jù)收集和分析?,F(xiàn)階段,可用于鏈接分析的搜索引擎的種類很多,其中被選用最多的依次是AllTheWeb、AltaVista、Google[6]。三者中更新速度快且搜索精度高而受到廣泛關(guān)注的AllTheWeb于2011年4月4日被雅虎關(guān)閉。另外由于AltaVista對于中文數(shù)據(jù)查詢的支持不是很好且不夠穩(wěn)定[7],所以本文選用檢索功能強(qiáng)且對中文數(shù)據(jù)查詢支持較好的Google作為數(shù)據(jù)搜集工具。
對于PR值,利用“站長工具”網(wǎng)站(http:∥tool.chinaz.com/)中的PR查詢功能,逐一查詢獲取樣本網(wǎng)站的相關(guān)信息。
1.4 數(shù)據(jù)檢索指令
使用Google對各網(wǎng)站的總鏈接數(shù)、內(nèi)部鏈接數(shù)、外部鏈接數(shù)和網(wǎng)頁總數(shù)進(jìn)行數(shù)據(jù)收集時(shí),檢索指令如表2:
2 數(shù)據(jù)獲取及測度
本文的數(shù)據(jù)獲取時(shí)間為2012年2月17日21∶00~23∶00。各網(wǎng)站的各項(xiàng)指標(biāo)具體情況如表3所示。
網(wǎng)站的建設(shè)、影響力和輻射力情況受表3中各指標(biāo)數(shù)值大小的影響。各項(xiàng)指標(biāo)的數(shù)值越大,其網(wǎng)站的結(jié)構(gòu)、內(nèi)容、影響力、搜索排名等情況越好,但是表3中的各項(xiàng)指標(biāo)數(shù)值不夠統(tǒng)一,難以對20個(gè)樣本網(wǎng)站進(jìn)行綜合的分析評價(jià),所以本文借用灰關(guān)聯(lián)排序的方法來對各網(wǎng)站進(jìn)行綜合排名?;谊P(guān)聯(lián)排序分析的目的是對信息不完全的系統(tǒng)作因子間的量化、序化。它的實(shí)質(zhì)是整體比較,是有參考系的、有測度的比較[8]。按照關(guān)聯(lián)度進(jìn)行排序,綜合各個(gè)指標(biāo)的優(yōu)點(diǎn)和特性,所獲得的排序結(jié)果將更為科學(xué)、客觀、可靠。其具體方法是:首先選取各個(gè)指標(biāo)中最大數(shù)值作為參考數(shù)值,記作x0。然后分別計(jì)算各行其他數(shù)據(jù)x1,x2…xn與其參考數(shù)值之間的絕對差值,從每項(xiàng)指標(biāo)的差值中,分別選出一個(gè)最大值和一個(gè)最小值,記作maxx0(k)-xi(k)和minx0(k)-xi(k)。然后再從maxx0(k)-xi(k)和minx0(k)-xi(k)的數(shù)值中選出一個(gè)最大值和一個(gè)最小值,分別記作maxmaxx0(k)-xi(k)和minminx0(k)-xi(k)。ζ∈[0,1]為分辨系數(shù),一般按最少信息原理取為0.5,即ζ=0.5[5]。
借用灰關(guān)聯(lián)排序的方法對這20個(gè)教育信息網(wǎng)站進(jìn)行8項(xiàng)指標(biāo)(總鏈接數(shù)、內(nèi)部鏈接數(shù)、外部鏈接數(shù)、網(wǎng)頁總數(shù)、網(wǎng)絡(luò)影響因子、內(nèi)部網(wǎng)絡(luò)影響因子、外部網(wǎng)絡(luò)影響因子和PR值)的綜合排名,計(jì)算過程中剔除異常數(shù)據(jù),最終結(jié)果如表4所示。
3 數(shù)據(jù)分析與結(jié)論
3.1 數(shù)據(jù)獲取分析
在各指標(biāo)數(shù)據(jù)的搜索獲取過程中,由于受所運(yùn)用搜索引擎的穩(wěn)定性、網(wǎng)站服務(wù)器穩(wěn)定性和病毒、網(wǎng)頁制作技術(shù)等各方面因素的影響,存在著一些異常數(shù)據(jù)。
(1)部分網(wǎng)站的總鏈接數(shù)與站外鏈接數(shù)數(shù)值過于接近。如海南省教育網(wǎng)、河南省基礎(chǔ)教育信息網(wǎng)、山西基礎(chǔ)教育網(wǎng)等。
(2)河南省基礎(chǔ)教育信息網(wǎng)的網(wǎng)頁總數(shù)過少。
(3)數(shù)據(jù)檢索結(jié)果不穩(wěn)定。
3.2 數(shù)據(jù)結(jié)果分析
從表3和表5的數(shù)據(jù)中可以看出我國省級教育信息綜合網(wǎng)站建設(shè)整體水平較好,但是網(wǎng)站影響力有待提高,其中部分網(wǎng)站內(nèi)部建設(shè)和網(wǎng)絡(luò)關(guān)注度方面需要得到重視。
表3的數(shù)據(jù)顯示,80%的網(wǎng)站的鏈接效率達(dá)到90%以上,在網(wǎng)站鏈接的組成中,外部鏈接所占比例高,表明教育信息網(wǎng)站具有一定的相對影響力,但是其中只有15%的網(wǎng)站的總鏈接數(shù)和外部鏈接數(shù)超過100 000,這說明具有較大影響力和輻射力的教育信息綜合網(wǎng)站所占比例不高,85%的網(wǎng)站需要注重加強(qiáng)自身的影響力,提升其被關(guān)注的程度。在網(wǎng)站的內(nèi)部鏈接方面,數(shù)據(jù)整體顯示出省級教育信息綜合網(wǎng)站的資源匱乏,內(nèi)部結(jié)構(gòu)建設(shè)水平不高。其中除安徽教育資源中心和寧夏教育網(wǎng)之外,90%的網(wǎng)站的內(nèi)部網(wǎng)絡(luò)影響因子不到0.1,這說明90%的網(wǎng)站的內(nèi)部層次結(jié)構(gòu)不夠完備,網(wǎng)站網(wǎng)頁的易獲性差,這些缺點(diǎn)直接影響到網(wǎng)站的影響力和網(wǎng)絡(luò)輻射力。在網(wǎng)站的網(wǎng)頁總數(shù)方面,有55%的網(wǎng)站的網(wǎng)頁總數(shù)達(dá)到10 000以上,說明半數(shù)以上的網(wǎng)站具有較大的規(guī)模且完備性較好。在網(wǎng)站的PR值方面,35%的網(wǎng)站PR值為5,50%的網(wǎng)站PR值為6,網(wǎng)站PR值為7的僅占10%,說明我國省級教育信息綜合網(wǎng)站的搜索關(guān)注度一般,這需要提高網(wǎng)站整體的質(zhì)量水平,從而提高自身的搜索關(guān)注度。從表5的灰關(guān)聯(lián)度數(shù)據(jù)值中可以看出,大多數(shù)省級教育信息綜合網(wǎng)站的關(guān)聯(lián)度相差層次不大,關(guān)聯(lián)度值在0.7和0.8之間。這表明從網(wǎng)站影響力的綜合評價(jià)角度來看,我國省級教育信息綜合網(wǎng)站的影響力整體有待提高。
針對鏈接分析數(shù)據(jù)所反映的情況,我國省級教育信息綜合網(wǎng)站的網(wǎng)站建設(shè)和網(wǎng)絡(luò)影響力的提升,一方面需要注重豐富網(wǎng)站內(nèi)容,強(qiáng)化網(wǎng)站的服務(wù)功能,提升信息發(fā)布的質(zhì)量,及時(shí)、真實(shí)、有效地傳播教育信息;另一方面可以從優(yōu)化網(wǎng)站內(nèi)部鏈接和網(wǎng)站友情鏈接以及加大宣傳力度等方面進(jìn)行加強(qiáng)和提升。網(wǎng)站內(nèi)部鏈接的優(yōu)化使網(wǎng)絡(luò)內(nèi)部層次架構(gòu)的合理化得以提升,便于用戶的訪問和瀏覽。友情鏈接可以為網(wǎng)站帶來相對穩(wěn)定的用戶訪問量,并且有助于提升網(wǎng)站在Google等搜索引擎中的排名。加大網(wǎng)站的宣傳力度,能夠提升網(wǎng)站的網(wǎng)絡(luò)知名度和普及力度,從而吸引更多網(wǎng)絡(luò)用戶的關(guān)注和使用。
參考文獻(xiàn)
[1]曾荷.電子政務(wù)信息資源的網(wǎng)絡(luò)影響力評價(jià)研究[D].上海:華東師范大學(xué),2007:6-7.
[2]陳太洋,任全娥.中外企業(yè)網(wǎng)站的鏈接分析與網(wǎng)站影響力評價(jià)[J].情報(bào)理論與實(shí)踐,2008,(4):614-615.
[3]唐高芳.基于鏈接分析的網(wǎng)絡(luò)信息資源評價(jià)研究[J].新世紀(jì)圖書館,2011,(5):62-64.
[4]邱均平,陳敬全.網(wǎng)絡(luò)信息計(jì)量學(xué)及其應(yīng)用研究[J].情報(bào)理論與實(shí)踐,2001,24(3):161-163.
[5]張倩,滕紅,袁小珊.基于鏈接分析法的我國主要商業(yè)網(wǎng)站影響力評價(jià)研究[J].情報(bào)科學(xué),2011,(6):833-837.
[6]楊木容.搜索引擎在網(wǎng)絡(luò)鏈接分析中的應(yīng)用研究[J].圖書情報(bào)工作,2006,50(11):90-94.
[7]張向先,袁小珊.基于鏈接分析法的我國省級科技信息研究所網(wǎng)站影響力評價(jià)研究[J].情報(bào)理論與實(shí)踐,2011,34(3):91-94.
[8]鄧聚龍.灰色系統(tǒng)基本方法[M].武漢:華中科技大學(xué)出版社,2005:74-103.
(本文責(zé)任編輯:王 涓)