文 | 王建東
我們網(wǎng)站從2012年1月5日上線至今已10月有余,其間網(wǎng)站業(yè)務(wù)逐步拓展,內(nèi)容更加豐富,流量持續(xù)增長。隨著網(wǎng)站的發(fā)展,對網(wǎng)站推廣工作的要求也越來越高——如何讓廣大網(wǎng)民更快的看到網(wǎng)站精彩的內(nèi)容,令其獲得更好的用戶體驗,這些都是我們接下來要關(guān)注的重點。
除了直接通過域名訪問主站之外,大多數(shù)網(wǎng)民都是通過搜索引擎的相關(guān)搜索結(jié)果訪問到我們的網(wǎng)站。因此如何將網(wǎng)民感興趣的內(nèi)容通過搜索引擎友好的呈獻給他們是我們面對的主要問題。而以搜索引擎為媒介來實現(xiàn)網(wǎng)站內(nèi)容推廣的最常見方式和手段就是搜索引擎優(yōu)化(SEO)。
搜索引擎優(yōu)化(SEO,Search Engine Optimization),指從自然搜索結(jié)果獲得網(wǎng)站流量的技術(shù)和過程,進一步講是在了解搜索引擎自然排名機制的基礎(chǔ)上,對網(wǎng)站進行內(nèi)部以及外部的調(diào)整優(yōu)化,改進網(wǎng)站在搜索引擎中的關(guān)鍵詞自然排名,獲得更多流量,從而達成網(wǎng)站銷售及品牌建設(shè)的目標。
SEO按其行為性質(zhì)可分為黑帽、白帽、灰帽三類。SEO行業(yè)內(nèi)一些不符合搜索引擎質(zhì)量規(guī)范的優(yōu)化手法,也就是通過一些“作弊”手段來實現(xiàn)SEO的手法稱為黑帽;正規(guī)的符合搜索引擎網(wǎng)站質(zhì)量規(guī)范的則稱之為白帽;由于搜索引擎公布的規(guī)范和準則較籠統(tǒng),有很大的解釋空間,因此一些不能明確歸入黑帽和白帽的優(yōu)化手法被稱為灰帽。本文探討的就是健康、長久的、也是搜索引擎鼓勵和支持的白帽SEO。
SEO是給網(wǎng)站帶來流量的最好方法,沒有“之一”。
※ 搜索流量質(zhì)量高。其他方法是把網(wǎng)站推到本來沒有訪問意圖的網(wǎng)民面前。來自搜索引擎的訪客則是主動尋找網(wǎng)站相關(guān)內(nèi)容,目標非常精準,轉(zhuǎn)化率高。
※ 性價比高。SEO雖不免費,但是成本是相對較低的,尤其是網(wǎng)站管理員自己掌握并實施SEO技術(shù)時。
※ 可擴展性。只要掌握了關(guān)鍵詞研究和內(nèi)容擴展方法,網(wǎng)站可以不斷增加目標關(guān)鍵詞及流量。
※ 長期有效。網(wǎng)絡(luò)廣告、PPC(搜索廣告)一旦停止投放,流量立即停止。事件營銷效果明顯,但話題過去后流量也會消失。但只要不作弊,搜索排名一旦上去,可以維持相當長時間,可以保證一定的流量。
※ 提高網(wǎng)站易用性,改善用戶體驗。SEO是很少的必須修改網(wǎng)站才能實現(xiàn)的推廣方法之一,而SEO對頁面的要求很多是與易用性相通的。
為保證SEO工作有序進行,我們將其工作重心分為三個部分,并按以下三個階段來實施。
※ 第一階段是信息規(guī)范化建設(shè)。針對頁面信息和URL規(guī)范化問題進行整改,保證網(wǎng)站入口統(tǒng)一,權(quán)重集中并有效的繼承到子頁面,便于搜索引擎抓取。
※ 第二階段是關(guān)鍵詞建設(shè)。搜索引擎的訪問形式同普通用戶是一樣的,一篇文章的關(guān)鍵詞如果和正文內(nèi)容沒有較高的相關(guān)性,一定會影響用戶體驗,而搜索引擎可能會降低該頁面的權(quán)重,最終影響抓取效果,這也是通過內(nèi)容提高網(wǎng)站權(quán)重的重點之一。
※ 第三階段是外部鏈接建設(shè)。在保證頁面及URL規(guī)范和關(guān)鍵詞良性建設(shè)的同時,多途徑、多渠道拓展網(wǎng)站外部鏈接市場是本階段的重點工
作。良好的外部鏈接可以有效提升網(wǎng)站權(quán)重并帶來可觀的流量,是網(wǎng)站推廣工作的重要途徑之一。
網(wǎng)站SEO工作是協(xié)調(diào)統(tǒng)一的,三個階段也是相輔相成的,其劃分是以當前工作重點為標準,在特定條件下可以相互轉(zhuǎn)化。
本文主要討論的是第一階段,即信息規(guī)范化建設(shè)階段。
所謂信息規(guī)范化建設(shè)就是指為搜索引擎蜘蛛的抓取提供友好的途徑,包括域名設(shè)計、頁面設(shè)計、權(quán)重規(guī)劃、URL規(guī)范設(shè)計、網(wǎng)站結(jié)構(gòu)設(shè)計、內(nèi)容更新頻率規(guī)范等。
SEO的工作就是和搜索引擎打交道,目的是為了讓自己的頁面被搜索引擎更快更多地抓取并收錄。理論上蜘蛛能爬行和抓取所有頁面,但實際上是不可能的。網(wǎng)站想讓自己的更多頁面被收錄,就要想方設(shè)法吸引蜘蛛來抓取。蜘蛛所要做的就是盡量抓取重要頁面,蜘蛛判斷頁面重要性主要參考以下幾方面:
網(wǎng)站和頁面權(quán)重。質(zhì)量高、資格老的網(wǎng)站被認為權(quán)重比較高,這種網(wǎng)站上的頁面被爬行的深度也會比較高,會有更多頁面被收錄。
頁面更新度。如果頁面內(nèi)容經(jīng)常更新,蜘蛛會更加頻繁地訪問這種頁面,頁面上出現(xiàn)的新鏈接也會被蜘蛛更快地跟蹤。
導入鏈接。無論是外部鏈接還是網(wǎng)站內(nèi)部鏈接,蜘蛛都是靠導入鏈接進入頁面。高質(zhì)量的導入鏈接可使頁面上的導出鏈接爬行深度增加。
與首頁點擊距離。一般來說網(wǎng)站上權(quán)重最高的是首頁,大部分外部鏈接是指向首頁的,蜘蛛訪問最頻繁的也是首頁。離首頁點擊距離越近,頁面權(quán)重越高,被蜘蛛爬行的機會也越大。
蜘蛛抓取的原理是我們SEO工作的行為參考,從上述原則我們可以看出除第三條導入鏈接外,其他內(nèi)容均涉及到規(guī)范化建設(shè)的范疇。接下來我從以下幾個方面探討SEO的初期工作內(nèi)容:
域名是網(wǎng)民對網(wǎng)站的第一印象,令其記住域名對網(wǎng)站發(fā)展非常重要。域名選取一般遵從以下幾點:
※ 域名盡量簡短,越短的域名,網(wǎng)民的記憶成本就越低。
※ 域名可以和網(wǎng)站主題或網(wǎng)站名稱相呼應(yīng),讓人看到域名就能聯(lián)想到網(wǎng)站內(nèi)容,比如使用公司名稱、商標、網(wǎng)站名稱或者公司產(chǎn)品等信息來選擇域名。
※ 使用何種形式的域名后綴對搜索沒有影響,但域名后綴也需要考慮方便網(wǎng)民記憶。.com、.cn、.net等常見的域名后綴更容易記憶,一些不常見的后綴可能會讓人產(chǎn)生不信任感,增加其判斷成本。
參考消息網(wǎng)在挑選域名時充分考慮了上述原則,從網(wǎng)民的記憶成本以及對域名的信任程度等角度出發(fā),選取“cankaoxiaoxi.com”作為主域名?!秴⒖枷ⅰ啡站l(fā)行量300萬份以上,傳閱量超千萬,在國內(nèi)擁有相當龐大的讀者群體。網(wǎng)站域名采用其漢語拼音全拼的形式,既方便用戶記憶,也便于其產(chǎn)生良好的信任度從而提高用戶粘度,并有利于網(wǎng)民之間的口口相傳。
在品牌眾多的搜索引擎行業(yè)里,SEO工作有其廣泛的共性,也有針對某搜索引擎的個性化需求。就國內(nèi)市場而言,百度因其受眾面廣、影響力大等優(yōu)點,是我站以及國內(nèi)各大網(wǎng)站SEO工作的重點對象。
現(xiàn)階段我站在頁面設(shè)計方面主要考慮以下三個問題:
※ 一是鏈接標識問題。
百度通過蜘蛛程序抓取互聯(lián)網(wǎng)上的網(wǎng)頁,經(jīng)過處理后編錄到索引中。目前蜘蛛只能讀懂文本內(nèi)容,flash、
圖片等非文本內(nèi)容暫時不能處理,放置在flash、圖片中的文字,百度無法識別。我們在頁面設(shè)計時遵從業(yè)界通用方式,使用文字而不是flash、圖片、Javascript等來顯示重要的內(nèi)容或鏈接。
※ 二是頁面title和meta description設(shè)置問題。
網(wǎng)頁的title用于告訴網(wǎng)民和搜索引擎這個網(wǎng)頁的主要內(nèi)容是什么,搜索引擎在判斷一個網(wǎng)頁內(nèi)容權(quán)重時title是主要參考信息之一。網(wǎng)頁title是其主要內(nèi)容的概括,搜索引擎可以通過網(wǎng)頁標題迅速判斷網(wǎng)頁的主題。每個網(wǎng)頁的內(nèi)容都是不同的,每個網(wǎng)頁都應(yīng)該具有獨一無二的title。網(wǎng)民在百度中搜索到網(wǎng)頁時,title會作為最重要的內(nèi)容顯示在摘要中,一個主題明確的title可以幫助他們更方便地從搜索結(jié)果中判斷網(wǎng)頁上內(nèi)容是否符合其需求。title要對網(wǎng)民有吸引力,令其產(chǎn)生信任感。
參考消息網(wǎng)站頁面title格式如下:
首頁:網(wǎng)站名稱
頻道頁:頻道名稱_網(wǎng)站名稱
文章頁:文章title_頻道名稱_網(wǎng)站名稱
Meta description是對網(wǎng)頁內(nèi)容的精練概括。如果description描述與網(wǎng)頁內(nèi)容相符,百度會把description當作摘要的選擇目標之一,一個好的description會幫助網(wǎng)民更方便的從搜索結(jié)果中判斷網(wǎng)頁內(nèi)容是否和需求相符。
Meta description不是權(quán)值計算的參考因素,這個標簽存在與否不影響網(wǎng)頁權(quán)值,只會用做搜索結(jié)果摘要的一個選擇目標。目前網(wǎng)站description內(nèi)容顯示的是《參考消息》的簡要介紹。
※ 三是定期清除死鏈接。
網(wǎng)站死鏈過多,不僅影響網(wǎng)民的訪問體驗,也影響百度對網(wǎng)站質(zhì)量的判斷。百度站長平臺支持通過Sitemap向百度提交網(wǎng)站的死鏈列表。通過死鏈刪除的接口可以讓百度更快更全面的發(fā)現(xiàn)網(wǎng)站死鏈,從而進行有效刪除。
注:提交需要刪除的網(wǎng)址后,需要做如下處理,才能被百度有效刪除:
使用robots.txt阻止其被抓取。
或者返回404狀態(tài)碼表示當前頁面不存在。
權(quán)重是影響搜索引擎抓取的重要因素。參考消息網(wǎng)站權(quán)重目前偏低,同一篇稿件,參考消息在新華網(wǎng)專區(qū)的搜索結(jié)果排在參考消息官網(wǎng)頁面之前,這個結(jié)果是可以預(yù)料的。提高網(wǎng)站權(quán)重一是要靠良好的原創(chuàng)內(nèi)容吸引蜘蛛,二要靠合理的外部鏈接合作進行推廣,三則是規(guī)范化的URL設(shè)計以保證網(wǎng)站權(quán)重的集中和有效傳遞。這部分將在URL規(guī)范化設(shè)計中詳細探討。
權(quán)重問題是一個長期的工作,要堅持不懈才能展現(xiàn)效果。
創(chuàng)建具有良好的描述性、規(guī)范、簡單的URL,既有利于網(wǎng)民記憶和判斷網(wǎng)頁的內(nèi)容,也有利于搜索引擎更有效的抓取網(wǎng)站內(nèi)容。網(wǎng)站設(shè)計之初,就應(yīng)進行合理的URL規(guī)劃。
網(wǎng)站中同一網(wǎng)頁,只對應(yīng)一個URL。如果網(wǎng)站上多個URL都能訪問同樣的內(nèi)容,會引發(fā)如下問題:
1. 搜索引擎會選某一種URL作為標準,可能會與正式URL有所不同。
2. 用戶可能為同一網(wǎng)頁的不同
URL做推薦,多個URL分散了該網(wǎng)頁的權(quán)重。
URL設(shè)計還應(yīng)注意以下幾點:
※ 讓網(wǎng)民可以從URL判斷出網(wǎng)頁內(nèi)容以及網(wǎng)站結(jié)構(gòu)信息,并可以預(yù)測將要看到的內(nèi)容。
※ URL應(yīng)盡量簡短。長URL不僅不美觀,網(wǎng)民還很難從中獲取有用的額外信息。另一方面,短URL還有助于減小頁面文件大小,加快網(wǎng)頁打開速度,提升用戶體驗。
※ 正常的動態(tài)URL對搜索引擎沒有影響。URL是動態(tài)還是靜態(tài)對搜索引擎沒有影響,但盡量減少動態(tài)URL中包含的變量參數(shù),這樣既有助于減小URL長度,也可以減少讓搜索引擎掉入黑洞的風險。
參考消息網(wǎng)站建站之初首頁地址為http://www.cankaoxiaoxi.com,但其上“首頁”的鏈接地址為http://cankaoxiaoxi.com,搜索引擎蜘蛛會把這兩個URL當作不同的地址來對待,但這兩者其實是同一個地址。這會帶來以下問題:
※ CMS系統(tǒng)在不同的地方鏈接到不同的URL,分散了頁面權(quán)重,不利于排名。
※ 外部鏈接也可能指向不同的URL,分散權(quán)重。
※ 搜索引擎判斷的規(guī)范化網(wǎng)址可能不是我們想要的那個網(wǎng)址。
如果網(wǎng)址規(guī)范化問題嚴重,可能會影響收錄。對于搜索引擎來講,一個權(quán)重不高的域名,其被收錄的總頁面數(shù)和蜘蛛總爬行時間是有限的。搜索引擎把資源花在收錄不規(guī)范網(wǎng)址上,留給獨特內(nèi)容的資源就少了。更有甚者,搜索引擎在收錄了多個指向同一站點的URL地址后會導致內(nèi)容復制,復制內(nèi)容過多,搜索引擎可能認為網(wǎng)站存在作弊嫌疑。
針對上述情況,我們將所有http://cankaoxiaoxi.com的域名內(nèi)容都進行了301跳轉(zhuǎn);對于防止網(wǎng)民輸錯而啟用的備用域名也實現(xiàn)了301永久跳轉(zhuǎn)到主域名。并使用robots.txt禁止蜘蛛抓取本站不想向用戶展現(xiàn)的形式。
網(wǎng)站應(yīng)該有清晰的結(jié)構(gòu)和明晰的導航,這可以幫助網(wǎng)民快速從網(wǎng)站中找到自己需要的內(nèi)容,也可以幫助搜索引擎快速理解網(wǎng)站中每一個網(wǎng)頁所處的結(jié)構(gòu)層次。
網(wǎng)站一般應(yīng)采用樹型結(jié)構(gòu),樹型結(jié)構(gòu)通常分為以下三個層次:首頁——頻道——文章頁。像一棵大樹一樣,首先有一個樹干(首頁),然后再是樹枝(頻道),最后是樹葉(普通內(nèi)容頁)。樹型結(jié)構(gòu)的擴展性更強,網(wǎng)站內(nèi)容變多時,可以通過細分樹枝(頻道)來輕松應(yīng)對。
理想的網(wǎng)站結(jié)構(gòu)應(yīng)該是扁平化的,從首頁到內(nèi)容頁的層次要盡量少,這樣搜索引擎處理起來會更簡單。
同時,網(wǎng)站也應(yīng)該是一個網(wǎng)狀結(jié)構(gòu),網(wǎng)站上每個網(wǎng)頁都應(yīng)該有指向上、下級網(wǎng)頁以及相關(guān)內(nèi)容的鏈接:首頁有到頻道頁的鏈接,頻道頁有到首頁和普通內(nèi)容頁的鏈接、普通內(nèi)容頁有到上級頻道以及首頁的鏈接、內(nèi)容相關(guān)的網(wǎng)頁間互相有鏈接。網(wǎng)站中每一個網(wǎng)頁,都應(yīng)該是網(wǎng)站結(jié)構(gòu)的一部分,都應(yīng)該能通過其他網(wǎng)頁鏈接到。重要的內(nèi)容,應(yīng)該能從首頁或者網(wǎng)站結(jié)構(gòu)中比較淺的層次訪問到。
目前我站結(jié)構(gòu)體系分為首頁、頻道頁、欄目頁、內(nèi)容頁四個層面,符合網(wǎng)站結(jié)構(gòu)扁平化的要求,可以保證所有頁面在四次點擊之內(nèi)訪問到。
另外,網(wǎng)站還要有簡明、清晰的導航系統(tǒng),可以讓網(wǎng)民快速找到自己需要的內(nèi)容,同時也可以幫助搜索引擎更好的了解網(wǎng)站的結(jié)構(gòu)。
參考消息網(wǎng)站設(shè)計時為每個頁面都加上了導航欄,讓用戶可以方便的返回頻道、網(wǎng)站首頁,也可以讓搜索引擎方便的定位網(wǎng)頁在網(wǎng)站結(jié)構(gòu)中的層次;使用面包屑式導航,容易讓用戶理解當前所處的位置,如,網(wǎng)站首頁→頻道→當前瀏覽頁面。
還有一個非常需要注意的地方是了解子站和子目錄的區(qū)別。選擇使用子域名還是子目錄來合理的分配網(wǎng)站內(nèi)容,對網(wǎng)站在搜索引擎中的表現(xiàn)會有較大的影響。在某個頻道的內(nèi)容沒有豐富到可以當作一個獨立站點存在之前,使用目錄形式;等頻道下積累了足夠的內(nèi)容,再轉(zhuǎn)換成子域名的形式。一個網(wǎng)頁能否排到搜索結(jié)果的前面,“出身”很重要——如果其出自一個站點權(quán)重較高的網(wǎng)站,那排到前面的可能性就越大,反之則越小。通常情況下主站點的權(quán)重是最高的,子站點會從主站點繼承一部分權(quán)重,繼承的多少,視子站點質(zhì)量而定。在內(nèi)容沒有豐富到可以作為一個獨立站點之前,把內(nèi)容放到主站點下一個目錄中能在搜索引擎中獲得更好的表現(xiàn)。
內(nèi)容差異度較大或者關(guān)聯(lián)度不高,則使用子站點形式。搜索引擎會識別站點的主題,如果站點中內(nèi)容關(guān)聯(lián)度不高,可能導致搜索引擎識別錯誤。關(guān)聯(lián)度不高的內(nèi)容,放在不同的子域名下,可以幫助搜索引擎更好的理解站點的主題。
切記不要濫用子域名。無豐富內(nèi)容而濫用大量子域名,會被搜索引擎當作作弊行為而受到懲罰。
正如前面提到的,頁面內(nèi)容經(jīng)常更新,蜘蛛會更加頻繁地訪問這類頁面,頁面上出現(xiàn)的新鏈接也會被蜘蛛更快地跟蹤。
參考消息網(wǎng)作為一個新站點,內(nèi)容增加頻率要保持穩(wěn)定合理的上升趨勢,在保證高質(zhì)量原創(chuàng)稿件持續(xù)增長的同時還要避免盲目的增大轉(zhuǎn)發(fā)量。對于搜索引擎來說,如果一個網(wǎng)站在短期內(nèi)發(fā)稿數(shù)量出現(xiàn)指數(shù)增長,則有可能被認為存在作弊行為,不利于網(wǎng)站良性發(fā)展。
搜索引擎只是網(wǎng)站上一個普通的訪客,對網(wǎng)站的抓取方式、對網(wǎng)站/網(wǎng)頁的價值判斷,也都是從網(wǎng)民的角度出發(fā)的,任何對用戶體驗的改進,都是對搜索引擎改進。對搜索引擎的優(yōu)化,同時也會讓廣大網(wǎng)民受益。
網(wǎng)站內(nèi)容建設(shè)以服務(wù)網(wǎng)站核心價值為主,提供給搜索引擎收錄的也應(yīng)該是對自己核心價值有幫助的內(nèi)容。網(wǎng)站的內(nèi)容應(yīng)該是面向用戶的,提供符合用戶需求的原創(chuàng)內(nèi)容至關(guān)重要。資源較豐富的內(nèi)容,可以通過專題等更豐富的內(nèi)容組織形式提供給用戶,讓用戶以最低的成本獲取所有需要的信息。未來我站會向Web2.0類型的網(wǎng)站轉(zhuǎn)變,充分利用自己的優(yōu)勢,讓網(wǎng)民通過投票、評論等手段自己去判斷資源的質(zhì)量,形成有機的互動,這些互動可能會被搜索引擎用來判斷網(wǎng)站資源的價值。推薦信息會被搜索引擎用來判斷網(wǎng)站價值的高低。適當?shù)墓膭?、引導網(wǎng)民推薦網(wǎng)站,對網(wǎng)站在搜索引擎中的表現(xiàn)有很大幫助。
現(xiàn)在參考消息網(wǎng)還處于SEO工作的初級階段,主要針對頁面信息和URL規(guī)范化問題進行優(yōu)化,保證網(wǎng)站入口統(tǒng)一,權(quán)重集中并有效的繼承到子頁面,便于搜索引擎抓取。
接下來我們的工作重點將放在關(guān)鍵詞建設(shè)上。網(wǎng)站需要有效流量,對于新聞網(wǎng)站來說有效流量就是新聞內(nèi)容,也是網(wǎng)民搜索需要的內(nèi)容。這就要求選取的關(guān)鍵詞要和文章內(nèi)容有較高的關(guān)聯(lián)性。從用戶體驗角度來講,如果點擊搜索到的鏈接后,發(fā)現(xiàn)內(nèi)容與自己需求不符或者相差很大,訪客是不會繼續(xù)瀏覽網(wǎng)站的。因此即使帶來了一定的流量,但是其沒有可持續(xù)性,很快就衰減了。對于百度蜘蛛來講,如果關(guān)鍵詞和內(nèi)容相關(guān)性低,那么程序會認為該站點存在欺詐行為,會降低權(quán)重,從而導致抓取率下降。這也是通過內(nèi)容提高網(wǎng)站權(quán)重的重點之一。
SEO工作是一項長期的、細節(jié)化的工作,需要堅持不懈的努力才能看到成果,不能一蹴而就。
網(wǎng)站技術(shù)人員不可能對搜索引擎細節(jié)了解的很清楚,因此只有在共性的原則上不斷嘗試,摸清每個搜索引擎的脾氣才能達到預(yù)期的效果。當然,搜索引擎的各種算法也在不斷變化,這也意味著我們要緊盯搜索引擎的發(fā)展方向,做到與時俱進。