国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

搜索引擎優(yōu)化的作弊與防范

2010-08-15 00:48趙靜
辦公自動化 2010年22期
關(guān)鍵詞:搜索引擎作弊網(wǎng)頁

趙靜

(陜西財經(jīng)職業(yè)技術(shù)學(xué)院 信息工程系 咸陽 712000)

搜索引擎已逐漸成為人們?nèi)粘I钪斜夭豢缮俚墓ぞ?,而且人們對搜索引擎的依賴還在不斷增強?;ヂ?lián)網(wǎng)上存在的巨大利潤驅(qū)使著很多人使其站點和頁面變得有名,以期待人們在進行相關(guān)內(nèi)容查詢時,他們的網(wǎng)頁排在搜索結(jié)果的前列。當(dāng)訪問者使用關(guān)鍵字通過搜索引擎來查找相關(guān)網(wǎng)站時,哪個網(wǎng)站如果能在搜索結(jié)果中名列前茅,則無疑會獲得更好的點擊率。因此,伴隨而來的搜索引擎排名的作弊也孕育而生。

一、 搜索引擎優(yōu)化作弊的概念

搜索引擎作弊,或SEO作弊是指為了在搜索引擎中提高排名的目的而欺騙搜索引擎的行為。它與搜索引擎優(yōu)化最大的區(qū)別在于,搜索引擎優(yōu)化是一種利用搜索引擎的搜索規(guī)則來提高網(wǎng)站在有關(guān)搜索引擎內(nèi)的排名。

二、 搜索引擎優(yōu)化作弊的常見形式

1、 隱藏文本或隱藏鏈接

一般指網(wǎng)頁專為搜索引擎所設(shè)計,網(wǎng)頁內(nèi)含的文字不能被人們所看到,但是卻能被搜索引擎看到。在形形色色的隱藏技術(shù)中,最常見的就是把文本或鏈接文字的字體顏色設(shè)置為與背景色相同或十分接近。

2、 惡意更換頁面內(nèi)容

一般發(fā)生于先向搜索引擎提交一個網(wǎng)站,等該網(wǎng)站被收錄后再以其它頁面替換該網(wǎng)站。“誘餌行為”就屬于此類偷梁換柱之舉:創(chuàng)建一個優(yōu)化頁和一個普通頁,然后把優(yōu)化頁提交給搜索引擎,當(dāng)優(yōu)化頁被搜索引擎收錄后再以普通頁取而代之。

3、 關(guān)鍵詞堆砌

關(guān)鍵詞堆砌是指在頁面上堆放大量與頁面主題相關(guān)或無關(guān)的關(guān)鍵詞,這樣做是為了增加某些關(guān)鍵詞的詞頻以提高頁面相關(guān)性。它通常分為誤導(dǎo)性關(guān)鍵詞和重復(fù)性關(guān)鍵詞兩種形式。

4、 域名重定向

簡單的說就是通過各種方法,例如使用刷新標(biāo)記、CGI程序、JAVA等將各種網(wǎng)絡(luò)請求重新定個方向轉(zhuǎn)至其他位置。常見的重定向包括301 redirect,302 redirect和meta fresh三種。

5、 門頁

門頁是指針對搜索引擎而進行特別優(yōu)化的頁面,當(dāng)用戶訪問門頁時,會自動或被引導(dǎo)至另外一個內(nèi)容完全不同的頁面上。門頁可能是針對一個搜索引擎,也可能是針對多個不同的搜索引擎。由于每個搜索引擎的算法會存在或多或少的差異,不同的搜索引擎會有不同的門頁,在對不同的搜索引擎蜘蛛程序返回相應(yīng)的門頁。

6、 鏡像網(wǎng)站

廣義上的鏡像網(wǎng)站是指那些復(fù)制或者抄襲其他網(wǎng)站內(nèi)容的網(wǎng)站。常見的鏡像網(wǎng)站有三種:克隆網(wǎng)站,數(shù)據(jù)采集網(wǎng)站,多域名網(wǎng)站。

7、 作弊鏈接技術(shù)

指由大量網(wǎng)頁交叉連接而構(gòu)成的一個網(wǎng)絡(luò)系統(tǒng)。這些網(wǎng)頁可能來自同一個域或多個不同的域,甚至可能來自不同的服務(wù)器。這種方法在建站初期的時候可能影響不會太大,畢竟搜索引擎要發(fā)現(xiàn)這些網(wǎng)站群的關(guān)系是需要一定的時間的。假如這些網(wǎng)站的鏈接超過了半年,依舊大量的相互鏈接,,很有可能這幾十個網(wǎng)站都會被察覺。

三、 搜索引擎優(yōu)化作弊的防范措施

1、 搜索引擎要反作弊的重要性

搜索引擎是各大搜索公司的生命。因此,對于上述提到的搜索引擎作弊行為,谷歌,百度這些知名公司總是想方設(shè)法防范的。搜索引擎作弊不僅直接破壞了搜索引擎網(wǎng)站賴以生存的關(guān)鍵,而且也破壞了搜索引擎網(wǎng)站獲得收益的來源。近幾年來谷歌、百度等已經(jīng)在反作弊上做了很大的工作,并對這些作弊行為給出了相應(yīng)的懲罰措施。

2、 搜索引擎反作弊方法

像谷歌,百度等這樣的知名公司,總是不斷的運用各種技術(shù)提高自己的搜索質(zhì)量。因為作弊具有共性,只要抓住這些共性就可以解決一類問題,一類類問題的解決,作弊的影響就可以降到最低點。

(1)基于網(wǎng)頁特征分析的方法

從大規(guī)模的網(wǎng)頁實驗集中提取網(wǎng)頁特征,然后通過統(tǒng)計的方法對特征進行分析,得到作弊網(wǎng)頁和正常網(wǎng)頁的不同特征。根據(jù)這些特征建立一個網(wǎng)頁分類器來實現(xiàn)自動的把網(wǎng)頁分成作弊網(wǎng)頁和正常網(wǎng)頁。最常見的方法是建立常用的spam列表并對其分類和分級,通過常用的spam列表分析相關(guān)詞匯重復(fù)使用率,密度,分布等情況,進而判斷是否存在惡意重復(fù)現(xiàn)象。

(2)基于頁面鏈接結(jié)構(gòu)分析的方法

通過分析網(wǎng)頁的鏈接結(jié)構(gòu)來判斷某網(wǎng)頁是否是作弊頁面,這種方法主要通過算法來實現(xiàn),主要的思路是從正面出發(fā)的hilltop算法、trustrank算法和從反面出發(fā)的badrank算法。通過不同的算法對作弊進行防范,不同的排序算法會有不同的排序依據(jù),不斷的尋找作弊者不能控制的排序依據(jù)使其無法進行作弊行為。

(3)檢測隱藏技術(shù)的方法

通過分析使用隱藏技術(shù)的網(wǎng)頁的特征,一些簡單的隱藏技術(shù)很容易被檢測出來。例如:對于隱形頁面作弊如果發(fā)現(xiàn)頁面內(nèi)部大量文本采用和背景相同的顏色設(shè)置,則確定為作弊頁面;對于重定向、偽裝頁面可以使用網(wǎng)絡(luò)爬蟲來檢測。搜索引擎可以讓一部分爬蟲偽裝成普通用戶來訪問站點,對網(wǎng)站進行測試,看網(wǎng)站對用戶和搜索引擎返回的內(nèi)容是否一致,如果不一致則很大可能是在作弊。

(4)加強人工審查

雖然通過技術(shù)手段反作弊的精準(zhǔn)度接近于100%,但也不可能完全的消除,只能有效的減少。當(dāng)技術(shù)手段不能解決問題,就用人工來解決。人工審核是最后的補充,前面的技術(shù)方法可以將需要審核的作弊網(wǎng)站范圍大大縮小,人工審核是判斷搜索引擎作弊的最后方法,也是最準(zhǔn)確的方法。

四、 總結(jié)

如今,反作弊技術(shù)已經(jīng)日趨成熟,搜索引擎在對付網(wǎng)頁作弊的工作上取得了不錯的效果。但是,商業(yè)利益的誘惑讓作弊技術(shù)不斷的更新和改進,所以搜索引擎很難從根本上消除網(wǎng)頁作弊現(xiàn)象。因此,作弊和反作弊的斗爭將是一個長期的反復(fù)的過程,同時也變相的推動了互聯(lián)網(wǎng)搜索行業(yè)的不斷創(chuàng)新和發(fā)展。我們相信,隨著反作弊技術(shù)的發(fā)展和成熟,在識別和對付作弊網(wǎng)頁上一定可以取得更好的成績。

[1]網(wǎng)利剛,趙政文,趙鑫鑫。搜索引擎中的反SEO作弊研究[M].計算機應(yīng)用研究.2009.

[2]張興華.搜索引擎技術(shù)及研究[J].現(xiàn)代情報.2004.

[3]格拉夫,庫 辛.搜索引擎優(yōu)化[M].清華大學(xué)出版社.2007.

[4]馬張華.分類搜索引擎類目體系研究[M].圖書情報工作.2001.

猜你喜歡
搜索引擎作弊網(wǎng)頁
Chrome 99 Canary恢復(fù)可移除預(yù)置搜索引擎選項
作弊
基于HTML5與CSS3的網(wǎng)頁設(shè)計技術(shù)研究
世界表情符號日
有人要你幫忙作弊怎么辦
基于HTML5靜態(tài)網(wǎng)頁設(shè)計
防止作弊
搜索引擎怎樣對網(wǎng)頁排序
基于Lucene搜索引擎的研究
搜索引擎,不止有百度與谷歌
荔浦县| 石首市| 从江县| 界首市| 贵南县| 左贡县| 砀山县| 当雄县| 湘潭县| 永安市| 江城| 冷水江市| 博爱县| 堆龙德庆县| 成都市| 马公市| 开原市| 钦州市| 溆浦县| 蒙自县| 石河子市| 民和| 开原市| 寻甸| 南澳县| 安吉县| 仪征市| 关岭| 咸宁市| 社会| 那曲县| 丹阳市| 察隅县| 隆子县| 新昌县| 礼泉县| 鲁山县| 渭南市| 普定县| 布尔津县| 南京市|