百度是全球最大的中文搜索引擎,對中文網(wǎng)頁的搜索技術在某種程度上領先于Google,百度在某些方面與Google有相同或相似之處外它還有以下特點:
1、較重視第一次收錄印象
網(wǎng)站給百度的第一印象比較重要,相對Google而言,百度搜索引擎的人為參與度較高,也就是說在某些層面上可能由人來決定是否收錄網(wǎng)頁而不是由機器來決定.所以,網(wǎng)站在登錄百度搜索引擎之前最好把內(nèi)容做得豐富點、原創(chuàng)內(nèi)容多一點、網(wǎng)頁關鍵詞與內(nèi)容的相關度高一點,這樣才能給百度較好的初次印象.
2、對網(wǎng)頁的更新較敏感
百度對網(wǎng)頁的更新相對Google而言更加敏感,可能這與百度的本土性格有關.百度搜索引擎每周更新,網(wǎng)頁視重要性有不同的更新率,頻率在幾天至一月之間.所以在百度的搜索結果中基本上都標明了收錄時間.
3、較重視首頁
百度對首頁的重視程度要比Google高得多,這與上面提到的“較重視第一次收錄印象”一脈相承.百度在顯示搜索結果時也常常把網(wǎng)站首頁顯示出來,而不具體到某個內(nèi)容頁(當其認為不夠重要時).相對而言,其用戶體驗打了折扣,而增加了其“百度快照”的用戶量.
4、較重視絕對地址的鏈接
百度在收錄網(wǎng)頁時比較重視絕對地址的收錄,百度提供的網(wǎng)頁快照功能也沒有解析相對地址的絕對路徑,不知這是百度技術的疏忽還是其偏好的一大體現(xiàn).
5、較重視收錄日期
百度對網(wǎng)頁的收錄日期非?粗,也是其搜索結果排名的參考點,被收錄得越早排名會較高,有時甚至不考慮相關性地把它認為比較重要的內(nèi)容放在首位,而點擊進入之后才發(fā)現(xiàn)是早已過時的信息或者垃圾信息.這是百度需要改進的技術.
百度使用的技術:
百度使用以下技術:“一種互聯(lián)網(wǎng)上鏡像和準鏡像網(wǎng)站的識別方法”,這個方法解決了搜索引擎對雷同信息的重復獲取,節(jié)省網(wǎng)絡資源和本地資源,提高系統(tǒng)服務的質(zhì)量和效率;“一種基于詞匯的計算機索引和檢索方法”,該方法對一段連續(xù)的文字信息,經(jīng)過詞匯分析處理后,通過添加隱形詞匯的手段,實現(xiàn)對基于詞匯索引和檢索系統(tǒng)的檢索質(zhì)量提升,使用戶獲得更加準確的檢索結果;“一種使用快照的方式實現(xiàn)對網(wǎng)上信息進行記錄和分析的方法”,該方法是通過對互聯(lián)網(wǎng)上一個特定信息,多次進行快照的方式,將信息當時的狀態(tài)進行保留.并通過對一系列快照信息的分析,得到有效數(shù)據(jù),方便地得到網(wǎng)上信息的變動情況.