1、為什么搜索引擎要反作弊? 對于SEO的作弊行為,幾乎所有搜索引擎都是反對的。SEO spam 的破壞性是相當(dāng)巨大的,它不僅直接破壞了搜索引擎網(wǎng)站賴以生存的關(guān)鍵所在,即每日數(shù)以億計的用戶搜索體驗,同時也破壞了搜索引擎獲得收益的主要來源,如競價排名以及相關(guān)廣告。這個很容易理解,做SEO歸根結(jié)底要從客戶體驗出發(fā),不能為了SEO而SEO,搜索引擎算法的不斷更新,更科學(xué)更人性化就是為了能給客戶一個滿意的搜索結(jié)果,而作弊行為必將破壞這種搜索體驗,可以說觸及了搜索引擎的根本價值所在,因此被嚴(yán)厲打擊是情理之中。 搜索引擎反作弊類同于互聯(lián)網(wǎng)的病毒與反病毒。因此,作為搜索引擎,對待垃圾和作弊網(wǎng)站的態(tài)度也是高度一致:懲罰或者刪除。幾乎所有的搜索引擎官方站點也公布了一些原則,對作弊行為進(jìn)行界定,并給出了對應(yīng)的懲罰措施。 2、 如何反作弊 搜索引擎作弊其實不僅僅是損害了搜索引擎擁有者的利益。從長遠(yuǎn)看,如果網(wǎng)站的本身質(zhì)量并沒有提高,而是通過搜索引擎作弊來吸引瀏覽者,那么網(wǎng)站最終還是得不到用戶的青睞,無法留住瀏覽者,最終受到傷害的還是網(wǎng)站本身。 雖然通過技術(shù)手段不可能完全杜絕各種搜索引擎作弊行為,但還是能夠有效減少這些行為。解決辦法如下: a)加強(qiáng)頁面內(nèi)容的智能判斷。對于關(guān)鍵字堆砌和虛假關(guān)鍵字這兩種作弊行為,應(yīng)加強(qiáng)智能判斷。例如從頁面的部分提取,而非(title)(/title)或者(meta)(/meta)部分,判斷關(guān)鍵字是否僅在某一段落內(nèi)重復(fù),以去除惡意重復(fù)現(xiàn)象。 b)網(wǎng)絡(luò)爬蟲隱身。無論是隱形頁面、偷換頁面,還是重定向,都會對網(wǎng)站的當(dāng)前訪問者進(jìn)行判斷,從而對網(wǎng)絡(luò)爬蟲和普通用戶作出不同的反應(yīng)。搜索引擎應(yīng)該讓一部分網(wǎng)絡(luò)爬蟲隱身,裝扮成普通用戶來訪問網(wǎng)站,對網(wǎng)站進(jìn)行測試,便可以有效杜絕這種類型的作弊。 c)網(wǎng)站歷史記錄。對網(wǎng)站的頁面變更記錄其歷史。一般來說一個網(wǎng)站的非內(nèi)容部分的頁面變化是很小的,如網(wǎng)站目錄結(jié)構(gòu)、頁面結(jié)構(gòu)、很多特殊連接都是不經(jīng)常變化的。如果某一個網(wǎng)站變化較大,就有必要對此網(wǎng)站作進(jìn)一步的審核。這樣做可以杜絕偷換網(wǎng)頁這一作弊方法,并提高人工審核的效率。 d)網(wǎng)站評級。一般來說,好的網(wǎng)站上的鏈接質(zhì)量也會很高,而一些垃圾網(wǎng)站上的鏈接也多是與其相似的網(wǎng)站。也就是說,網(wǎng)站也是聚類生存的。因此,可以對網(wǎng)站進(jìn)行評級歸類,以有效預(yù)防通過垃鏈連接來作弊的網(wǎng)站。 通過以上四種方法,可以有效提高搜索引擎的反SEO作弊能力,但這樣并不能完全杜絕SEO作弊。要想提高搜索引擎的反作弊能力,還必須要人的加入,綜合使用各種方法,逐級分層審查: 第一層是提高技術(shù)手段。例如加強(qiáng)頁面的智能分析和網(wǎng)絡(luò)爬蟲的抓取能力,增加爬蟲隱身能力。其目的是進(jìn)行最底層的反作弊判斷,判斷的對象是頁面,由電腦進(jìn)行海量的重復(fù)性作業(yè)。 第二層是網(wǎng)站分析。通過網(wǎng)站的歷史記錄與網(wǎng)站評級系統(tǒng),對網(wǎng)站進(jìn)行分析評價。目的是從中篩去合法的,找出有SEO作弊嫌疑的網(wǎng)站,判斷的對象是網(wǎng)站,由電腦和人進(jìn)行比較篩選。 第三層是最終評審。由人對篩選出的嫌疑網(wǎng)站進(jìn)行試用、評審。判斷的對象是網(wǎng)站,完全由人完成,并得出最終結(jié)論。通過電腦與人工的合作作業(yè),可以基本上杜絕搜索引擎優(yōu)化中的作弊行為,使搜索引擎的結(jié)果更符合瀏覽者的需要。 3、google是如何做的 一個搜索引擎成功的反作弊策略一定是這樣的: a) 允許算法被探測出來,而且即使算法被公布,搜索結(jié)果的公正性都不會受太大影響。要這么做的原因就是不希望和作弊的人陷入到一種貓捉老鼠的死循環(huán)當(dāng)中。如果老是以堵漏洞的做法來修正算法,那永遠(yuǎn)都沒有盡頭。出于這樣的考慮,搜索引擎會把那些無法被作弊的的因素在排序算法里放到比較重要的程度。 b) 盡可能用一切技術(shù)手段自動檢測,當(dāng)技術(shù)手段不能解決問題,就用人工來解決。然后把人工發(fā)現(xiàn)的問題又反饋給自動檢測機(jī)制,使自動檢測越來越完善。 現(xiàn)在的google基本上就是這樣來做的。在現(xiàn)有的排序規(guī)則中,那些無法作弊的和能精確反應(yīng)內(nèi)容的因素,都是很重要的排序因素。 當(dāng)然Google也不排斥頻繁的調(diào)整算法,這也有出于給用戶一個最好的搜索體驗考慮的。至于技術(shù)檢測和人工審查,google也一直在做。 google很早就有匿名蜘蛛來檢測一個網(wǎng)站是不是在作弊的。如果去分析網(wǎng)站的服務(wù)器LOG日志,就會發(fā)現(xiàn)它們。你會發(fā)現(xiàn),有的爬蟲,通過IP查詢是來自google,但是它沒有自己的聲明(user-agent),這就是google的匿名爬蟲。它會判斷你有沒有對google爬蟲特別對待,做一些隱藏頁面,還會解析Javascript文件和CSS文件等等。Google也有人工審核機(jī)制,從webmaster tool 里提交的問題,都是有人工跟進(jìn)審核的。 4、對于廣大SEO愛好者的忠告: 往往對SEO了解得越多,就越發(fā)現(xiàn)作弊實在是費(fèi)力不討好了。作弊源于不了解,通過正常途徑提升SEO流量的方法有的是,為什么放棄那么多好的方法而選擇差的方法呢?在現(xiàn)在的SEO界,你會發(fā)現(xiàn)一個現(xiàn)象,越是SEO剛?cè)腴T的人越喜歡搞一些作弊的事情,而SEO從業(yè)越久的人,就越不會參與這些。想做一個優(yōu)秀SEOer的人,對所有這些因素都要有一定程度的了解的。這樣做既可以避開無意中犯下的錯,又可以避免不必要的恐慌,更好的幫助SEO這個產(chǎn)業(yè)良性發(fā)展,與搜索引擎一起帶給客戶真正滿意的搜索體驗! |