百度搜索引擎收錄習(xí)慣:百度是全球最大的中文搜索引擎,對中文網(wǎng)頁的搜索技術(shù)在某種程度上領(lǐng)先于Google,百度在某些方面與Google有相同或相似之處外它還有以下特點: 1、較重視第一次收錄印象 網(wǎng)站給百度的第一印象比較重要,相對Google而言,百度搜索引擎的人為參與度較高,也就是說在某些層面上可能由人來決定是否收錄網(wǎng)頁而不是由機器來決定。所以,網(wǎng)站在登錄百度搜索引擎之前最好把內(nèi)容做得豐富點、原創(chuàng)內(nèi)容多一點、網(wǎng)頁關(guān)鍵詞與內(nèi)容的相關(guān)度高一點,這樣才能給百度較好的初次印象。 2、對網(wǎng)頁的更新較敏感 百度對網(wǎng)頁的更新相對Google而言更加敏感,可能這與百度的本土性格有關(guān)。百度搜索引擎每周更新,網(wǎng)頁視重要性有不同的更新率,頻率在幾天至一月之間。所以在百度的搜索結(jié)果中基本上都標(biāo)明了收錄時間。 3、較重視首頁 百度對首頁的重視程度要比Google高得多,這與上面提到的“較重視第一次收錄印象”一脈相承。百度在顯示搜索結(jié)果時也常常把網(wǎng)站首頁顯示出來,而不具體到某個內(nèi)容頁(當(dāng)其認(rèn)為不夠重要時)。相對而言,其用戶體驗打了折扣,而增加了其“百度快照”的用戶量。 4、較重視絕對地址的鏈接 百度在收錄網(wǎng)頁時比較重視絕對地址的收錄,百度提供的網(wǎng)頁快照功能也沒有解析相對地址的絕對路徑,不知這是百度技術(shù)的疏忽還是其偏好的一大體現(xiàn)。 5、較重視收錄日期 百度對網(wǎng)頁的收錄日期非常看重,也是其搜索結(jié)果排名的參考點,被收錄得越早排名會較高,有時甚至不考慮相關(guān)性地把它認(rèn)為比較重要的內(nèi)容放在首位,而點擊進入之后才發(fā)現(xiàn)是早已過時的信息或者垃圾信息。這是百度需改進的技術(shù)。 百度使用的技術(shù) 百度使用以下技術(shù):“一種互聯(lián)網(wǎng)上鏡像和準(zhǔn)鏡像網(wǎng)站的識別方法”,這個方法解決了搜索引擎對雷同信息的重復(fù)獲取,節(jié)省網(wǎng)絡(luò)資源和本地資源,提高系統(tǒng)服務(wù)的質(zhì)量和效率;“一種基于詞匯的計算機索引和檢索方法”,該方法對一段連續(xù)的文字信息,經(jīng)過詞匯分析處理后,通過添加隱形詞匯的手段,實現(xiàn)對基于詞匯索引和檢索系統(tǒng)的檢索質(zhì)量提升,使用戶獲得更加準(zhǔn)確的檢索結(jié)果;“一種使用快照的方式實現(xiàn)對網(wǎng)上信息進行記錄和分析的方法”,該方法是通過對互聯(lián)網(wǎng)上一個特定信息,多次進行快照的方式,將信息當(dāng)時的狀態(tài)進行保留。并通過對一系列快照信息的分析,得到有效數(shù)據(jù),方便地得到網(wǎng)上信息的變動情況。 [小技巧一]如何提高百度的收錄 1.如果站點有論壇或者動態(tài)的經(jīng)常更新的東西的話baidu收錄和更新都很快... 2.做baidu最大感受就是自己不斷在往baidu的數(shù)據(jù)庫里添加內(nèi)容..不斷采集,篩選重排列,然后提交給baidu.而因為baidu強調(diào)更新率,本身對數(shù)據(jù)是喜新厭舊,所以新的內(nèi)容如果和別的站的老內(nèi)容重復(fù)的話,自己居然還能慢慢排到采集源頭的站前面... 3.baidu一般一個月大更新2到3次.小更新天天有...目標(biāo)主要是在小更新的時候提交目錄和索引頁(一般是分類頁或者sitemap頁)到baidu,在大更新時候爭取大量被收錄...每次更新后大概兩天時間調(diào)整...這短時間站點別做大動作.否則很容易被刪目錄或者被封... 4.一定要定期喂給baidu頁面..否則會連累同目錄的老頁面不斷被降權(quán)... [小技巧二]對于Google決定博客搜索排名的有利因素: 1)博客的流行程度 2)是否存在于其它博客中“博客鏈接”里 3)大量的訂閱數(shù):對于Blog的RSS訂閱數(shù),Google通過訂閱者的IP地址來判斷是否spam,以避免虛假的高訂閱數(shù)字。 4)標(biāo)簽的使用 5)在搜索結(jié)果里的Blog文章,其被點擊頻率高低,會影響排名,這就相當(dāng)于用戶用點擊所作的投票。 6)如果一個Blogroll里,絕大部分是高質(zhì)量的Blog鏈接,而你的鏈接在其中,對排名有正面的影響。 百度和Google的域名權(quán)威度分析 Google在顯示網(wǎng)頁排名的時候,有可能會給網(wǎng)頁賦予一個權(quán)威度值,這個權(quán)威度和網(wǎng)頁的PageRank是不同的,無法從外部看到,而這個網(wǎng)站權(quán)威度的算法,目前仍然是一個未公開的算法,可能和反向鏈接數(shù)量可能有關(guān)系,可能也和網(wǎng)站域名類型、注冊時間有關(guān)系,如果適當(dāng)提高域名的權(quán)威度,對于Google的排名有很大的好處。 百度其實也有類似權(quán)威度這樣的算法,但是一般看來百度顯示網(wǎng)頁排名和所謂的域名權(quán)威度的關(guān)系不是特別大。這和Google的算法是有一定區(qū)別的。根據(jù)一般觀察,注冊時間長的大型網(wǎng)站(頁面內(nèi)容多)往往在Google上有較高的權(quán)威度,而百度似乎比較注重論壇、社區(qū)、博客上的鏈接,而把這些鏈接作為衡量權(quán)威度的一個標(biāo)準(zhǔn)。 百度對于社區(qū)論壇的重視,主要也源于中國人的上網(wǎng)習(xí)慣。中國人天生下來就喜歡泡論壇,因此一般大型論壇的人氣都非常旺,百度也喜歡收錄各種論壇或者博客的頁面,并給于其較高排名,這樣就顯得百度收錄的文章較多,而Google則喜歡收錄大型網(wǎng)站的頁面,反而會影響收錄速度,對于某些類似個人原創(chuàng)文章的搜索也未必能有更好的搜索體驗。建議Google能夠針對中國的國情和特色微調(diào)一下相關(guān)的搜索算法,相信會對搜索結(jié)果的用戶體驗得到不少提升 |