楊 行
(蘇州大學(xué)社會(huì)學(xué)院信息資源管理系,江蘇 蘇州 215123)
教育部長袁貴仁在2010年全國普通高校畢業(yè)生就業(yè)工作視頻會(huì)議上指出:國際金融危機(jī)對我國就業(yè)的不利影響還沒有消除,如果說2010年是我國經(jīng)濟(jì)最困難的一年,2011年可能是最復(fù)雜的一年,整個(gè)宏觀層面的就業(yè)形勢非常嚴(yán)峻[1]。
2010年我國共有630萬大學(xué)畢業(yè)生,加上往屆沒有實(shí)現(xiàn)就業(yè)的學(xué)生,需要就業(yè)的畢業(yè)生數(shù)量之大可想而知。面對嚴(yán)峻的就業(yè)形勢,目前的大學(xué)生,尤其是即將畢業(yè)的學(xué)生應(yīng)當(dāng)及早準(zhǔn)備,做好各類信息的搜集工作,尋找適合自己的工作方向,同時(shí),也要考慮清楚自己大致可以面向哪些專業(yè)領(lǐng)域——這個(gè)時(shí)候,互聯(lián)網(wǎng)上眾多求職招聘類網(wǎng)站作為發(fā)布招聘信息的一個(gè)重要平臺(tái),成為大眾求職必不可少的工具。經(jīng)筆者不完全統(tǒng)計(jì),我國現(xiàn)有求職招聘類網(wǎng)站已經(jīng)超過400家。由于無法確認(rèn)所瀏覽的網(wǎng)站是否權(quán)威,很多求職者在增加工作量、重復(fù)無用功的同時(shí),也喪失了求職的最佳時(shí)機(jī)。
目前,在對網(wǎng)站的研究評價(jià)中,基于鏈接分析及網(wǎng)絡(luò)影響因子(Web影響因子)測度是一種應(yīng)用較為廣泛的網(wǎng)站評價(jià)方法。1998年,Peter Ingwersen提出WEB-IF的概念,他將WEB-IF(Web Impact Factors)定義為,在某一特定時(shí)刻,指向特定網(wǎng)站的鏈接總數(shù)與該網(wǎng)站總網(wǎng)頁數(shù)之比。指向網(wǎng)站的鏈接可分為外部鏈接(external-citations)和內(nèi)部鏈接(self-citations)。其中,外部鏈接的影響因子是測度網(wǎng)站影響力的重要指標(biāo),而內(nèi)部鏈接的影響因子體現(xiàn)的是服務(wù)器上網(wǎng)頁組織的邏輯結(jié)構(gòu)[2]。經(jīng)各國學(xué)者的大量研究,我們認(rèn)為WEB-IF可以作為網(wǎng)站評價(jià)的重要指標(biāo),而外部鏈接WEB-IF與網(wǎng)站的影響力有明顯的正向(肯定)聯(lián)系,更能夠真實(shí)反映網(wǎng)站的影響力大小,也可以說一個(gè)網(wǎng)站的ExternalWEB-IF越高,說明該網(wǎng)站越有影響力——這也是筆者利用網(wǎng)站外部影響因子來評價(jià)網(wǎng)站的理論依據(jù)。
筆者運(yùn)用鏈接分析方法和網(wǎng)絡(luò)影響因子測度方法,通過搜索引擎(Altavista)搜集相關(guān)數(shù)據(jù),對我國現(xiàn)有的求職招聘類網(wǎng)站的影響力進(jìn)行評價(jià),綜合鏈接分析及網(wǎng)絡(luò)影響因子測度結(jié)果和艾瑞網(wǎng)推出的招聘類網(wǎng)站排名,推選出10大權(quán)威求職網(wǎng)站,以求幫助眾多的求職者更為輕松高效地找到理想工作。
根據(jù)艾瑞網(wǎng)絡(luò)媒體精品推薦(www.iwebchoice.cn)中招聘類網(wǎng)站的排名,選取前30名網(wǎng)站作為鏈接分析的對象(該排名是艾瑞網(wǎng)招聘網(wǎng)站8、9、10這3個(gè)月的綜合排名,以下數(shù)據(jù)采集于2010年9月20日),研究樣本排名如表1。
表1 研究樣本
筆者采用的研究指標(biāo)包括[3]:
①總頁面數(shù)P:一個(gè)網(wǎng)站所包含的所有網(wǎng)頁數(shù)量,可以反映該網(wǎng)站的規(guī)模大小。
②總鏈接數(shù)L:指向該網(wǎng)站的所有鏈接數(shù),可以反映該網(wǎng)站的知名度。
③外部鏈接數(shù)EL:從網(wǎng)站外部指向該網(wǎng)站的鏈接數(shù),理論上,被廣泛鏈接的站點(diǎn)可以被認(rèn)為在互聯(lián)網(wǎng)上是具有較大影響力和較權(quán)威的信息源。
④內(nèi)部鏈接數(shù)SL:從網(wǎng)站內(nèi)部指向該網(wǎng)絡(luò)實(shí)體的鏈接數(shù),內(nèi)部鏈接可以將網(wǎng)站內(nèi)的相關(guān)信息很好地整合在一起,以完善信息的利用,內(nèi)部鏈接反映了網(wǎng)站的邏輯結(jié)構(gòu)。
⑤網(wǎng)絡(luò)影響因子WIF:總鏈接數(shù)與總頁面數(shù)的比值(L/P)。
⑥外部影響因子E-WIF:外部鏈接數(shù)與總網(wǎng)頁數(shù)的比值(EL/P)。
理論上某一網(wǎng)站的總鏈接數(shù)應(yīng)當(dāng)?shù)扔趦?nèi)外鏈接數(shù)的總和,但由于重復(fù)鏈接、不相干鏈接等眾多原因的干擾,會(huì)存在一定偏差(M)但如果偏差過大,可考慮剔除該樣本,確保最終結(jié)果合理可靠。
Altavista、Allthweb、Google這3個(gè)商業(yè)搜索引擎都可以用于數(shù)據(jù)的獲取,但根據(jù)相關(guān)文獻(xiàn)[5-7]及筆者的多次實(shí)驗(yàn),筆者最終選擇Altavista(www.altavista.com)作為研究工具。下面以前程無憂網(wǎng)(www.51job.com)為例,列出部分?jǐn)?shù)據(jù)的檢索語句(僅限在www.altavista.com、www.alltheweb中使用)以及在3個(gè)商業(yè)搜索引擎中的搜索結(jié)果。
表2 檢索語句
(備注:* 筆者用“host:51job.com”和“host:www.51job.com”這兩個(gè)檢索語句分別檢索,前者結(jié)果少于后者,為防止漏檢,最終統(tǒng)一選擇后一個(gè)檢索語句對網(wǎng)站的總頁面數(shù)進(jìn)行檢索。**檢索外部鏈接數(shù)時(shí)需注意“-”號前后的空格有無,正確的應(yīng)該是“-host”,如果使用“-host”,搜索引擎則會(huì)默認(rèn)檢索的是內(nèi)部鏈接數(shù)。)
表3 不同搜索引擎搜索結(jié)果比較
如表3所示,Google的搜索結(jié)果明顯少于前兩者,Altavista和Alltheweb的搜索結(jié)果相差無幾,但經(jīng)筆者多次試驗(yàn),Altavista相對比較穩(wěn)定,Alltheweb在檢索結(jié)果較大的時(shí)候,第1頁與第2頁的結(jié)果顯示往往會(huì)相差100甚至1000。因此為確保最終結(jié)果的可靠性,筆者選擇Altavista作為鏈接分析工具。
采用上述搜索引擎及檢索語句最終獲取的數(shù)據(jù)見表4。
表4 檢索結(jié)果
(注:以上數(shù)據(jù)采集于2010年9月21日,均為原始數(shù)據(jù);M列為檢索偏差,且檢索偏差
如表4所示,所選30個(gè)樣本經(jīng)檢索后發(fā)現(xiàn),其中有4個(gè)網(wǎng)站的檢索誤差超過20%,所以筆者在分析數(shù)據(jù)時(shí)剔除該4家網(wǎng)站:職友集、Job88人才網(wǎng)、杭州人才網(wǎng)和浙江人才網(wǎng)。僅分析剩余26個(gè)樣本網(wǎng)站,以保證最終結(jié)果的可靠性。
筆者利用EXCEL作為統(tǒng)計(jì)工具,借助Altavista檢索出的網(wǎng)站總頁面數(shù)、總鏈接數(shù)、外部鏈接數(shù)、內(nèi)部鏈接數(shù)計(jì)算得出各網(wǎng)站的網(wǎng)絡(luò)影響因子和外部鏈接影響因子,并按照外部鏈接影響因子將各網(wǎng)站重新排名(ORD列),結(jié)合艾瑞網(wǎng)的排名和按照E-WIF排列的新次序得出最終名次(N-ORD列)——把兩者的排名進(jìn)行算數(shù)相加。
表5 數(shù)據(jù)處理結(jié)果
通過對各招聘網(wǎng)站的鏈接情況分析,筆者得出如下結(jié)論:26個(gè)招聘網(wǎng)站中網(wǎng)絡(luò)影響力較大的十大網(wǎng)站分別是:智聯(lián)招聘(www.zhaopin.com)、前程無憂(www.51job.com)、應(yīng)屆生求職網(wǎng)(www.yingjiesheng.com)、英才網(wǎng)聯(lián)(www.800hr.com)、卓博網(wǎng)(www.jobcn.com)、中國人才熱線(www.cjol.com)、應(yīng)屆畢業(yè)生求職網(wǎng)(www.yjbys.com)、過來人求職網(wǎng)(www.guolairen.com)和賓果求職網(wǎng)(www.bingojob.cn)。
需要強(qiáng)調(diào)的是,由于各方面的局限,筆者的最終排名并不是此類網(wǎng)站的質(zhì)量排名,僅能說明這些網(wǎng)站在互聯(lián)網(wǎng)上有較大的影響力,因此所列權(quán)威招聘網(wǎng)站排名僅供廣大求職者參考。
另一個(gè)值得關(guān)注的問題是,英才網(wǎng)聯(lián)與過來人求職網(wǎng)外部鏈接的影響因子遠(yuǎn)遠(yuǎn)超出其他網(wǎng)站,原因筆者暫時(shí)還未能明確知曉。但網(wǎng)站的總鏈接數(shù)、內(nèi)外鏈接數(shù)的檢索結(jié)果又無明顯異常,筆者在連續(xù)一周內(nèi)利用Altavista以及Alltheweb對這兩個(gè)網(wǎng)站進(jìn)行不定期檢索,其結(jié)果的波動(dòng)也不是很大,因此筆者最終沒有剔除這兩個(gè)樣本。
大多數(shù)求職者在選擇招聘網(wǎng)站的時(shí)候多是通過各類網(wǎng)址導(dǎo)航或是百度、Google進(jìn)行查詢,無目的、無條理的同時(shí)也必然導(dǎo)致信息搜集的慢速低效。筆者雖然無法確保所選出網(wǎng)站的質(zhì)量,但影響力卻是客觀事實(shí),其結(jié)果也能從另外一個(gè)方面考量各大網(wǎng)站被利用、被重視的程度。求職者完全可以參考此研究成果,再結(jié)合自身需求進(jìn)行最終選擇。
從各網(wǎng)站頁面數(shù)、總鏈接數(shù)和內(nèi)外鏈接數(shù)的測度結(jié)果來看,有些數(shù)據(jù)明顯不合理,超過1/4的網(wǎng)站檢索偏差超出10%,雖然筆者剔除了檢索偏差超出20%的4個(gè)樣本,只針對剩下的26個(gè)樣本進(jìn)行分析,但仍無法保證最終結(jié)果百分之百的可靠。搜索結(jié)果的異常一直是鏈接分析法應(yīng)用過程中令人頭疼的問題,相關(guān)研究者認(rèn)為其主要原因在于:首先,網(wǎng)絡(luò)的動(dòng)態(tài)性會(huì)限制檢索鏈接的工具運(yùn)用,任何一個(gè)搜索引擎的覆蓋率都是有限的,并且目前只能利用國外的搜索引擎進(jìn)行鏈接分析,而國外的搜索引擎對中文網(wǎng)頁的覆蓋率又較低;其次,部分網(wǎng)站采用了flash技術(shù),使用了框架網(wǎng)頁結(jié)構(gòu)甚至是帶有病毒,加大了搜索引擎爬行器深入的難度[8];再者[9],招聘類網(wǎng)站上多有廣告鏈接,與相關(guān)招聘信息的鏈接相比其重要性明顯不是一個(gè)級別,而筆者研究的前提是假設(shè)所有鏈接同等重要,這對我們的搜索結(jié)果又產(chǎn)生了一定的影響,對于部分鏈入較少廣告卻提供較多信息的網(wǎng)站明顯不公平。
李江在《網(wǎng)絡(luò)影響因子的三大缺陷的探究》一文中對網(wǎng)絡(luò)影響因子在網(wǎng)站評價(jià)中的應(yīng)用從WIF的適用性、WIF算法本身的缺陷和WIF假設(shè)的前提難以成立這3個(gè)方面做了深入分析;同時(shí),其指出Google推出的Pagerank算法比WIF更為合理,假設(shè)前提成立的可能性也更大[10]。筆者在對數(shù)據(jù)進(jìn)行分析的時(shí)候雖然也綜合考慮了艾瑞網(wǎng)提供的排名(注:艾瑞網(wǎng)的數(shù)據(jù)來源于Alexa),但筆者將各指標(biāo)綜合考慮時(shí)僅是簡單的算數(shù)相加后再對各網(wǎng)站進(jìn)行綜合排名,此算法也并無具體的科學(xué)依據(jù),還有待進(jìn)一步考量。
[1]http://tuanwei.cdsu.edu.cn/jiuye/showNews.asp?newsid=724.
[2] Ingwersen Peter.The Calculation ofWeb Impact Factors[J].Journal of Documentation,1998(2):236-243.
[3] 龐景安.超鏈接網(wǎng)絡(luò)分析的理論與應(yīng)用研究[J].情報(bào)理論與實(shí)踐,2005(6):632-635.
[4] 付威風(fēng),鄭春厚.網(wǎng)絡(luò)計(jì)量學(xué)常用工具比較研究[J].圖書館學(xué)研究,2009(7):24-27.
[5] 潘浩.網(wǎng)絡(luò)鏈接分析法基本原理[J].科技情報(bào)開發(fā)與經(jīng)濟(jì),2009(1):116-117.
[6] 楊濤,曹文娟.網(wǎng)絡(luò)影響因子及其測度[J].圖書情報(bào)工作,2009(9):24-27.
[7]曹青.中國旅游企業(yè)電子商務(wù)網(wǎng)站評價(jià)研究——基于網(wǎng)絡(luò)鏈接與網(wǎng)絡(luò)影響因子測度的分析[J].廣東廣播電視大學(xué)學(xué)報(bào),2009(2):108-110.
[8] 楊濤.鏈接分析法存在的問題及改進(jìn)方法[J].圖書情報(bào)知識(shí),2002(3):62-63.
[9] 李江.網(wǎng)絡(luò)影響因子的三大缺陷探析[J].圖書情報(bào)工作,2008(5):107-109.