首頁(yè)

客服
返回頂部
技術(shù)展示 NEWS

百度搜索引擎收錄習(xí)慣

62009-2
2009-2-6瀏覽:

百度是全球最大的中文搜索引擎,對(duì)中文網(wǎng)頁(yè)的搜索技術(shù)在某種程度上領(lǐng)先于Google,百度在某些方面與Google有相同或相似之處外它還有以下特點(diǎn):

1、較重視第一次收錄印象

網(wǎng)站百度的第一印象比較重要,相對(duì)Google而言,百度搜索引擎的人為參與度較高,也就是說(shuō)在某些層面上可能由人來(lái)決定是否收錄網(wǎng)頁(yè)而不是由機(jī)器來(lái)決定.所以,網(wǎng)站在登錄百度搜索引擎之前最好把內(nèi)容做得豐富點(diǎn)、原創(chuàng)內(nèi)容多一點(diǎn)、網(wǎng)頁(yè)關(guān)鍵詞與內(nèi)容的相關(guān)度高一點(diǎn),這樣才能給百度較好的初次印象.

2、對(duì)網(wǎng)頁(yè)的更新較敏感

百度對(duì)網(wǎng)頁(yè)的更新相對(duì)Google而言更加敏感,可能這與百度的本土性格有關(guān).百度搜索引擎每周更新,網(wǎng)頁(yè)視重要性有不同的更新率,頻率在幾天至一月之間.所以在百度的搜索結(jié)果中基本上都標(biāo)明了收錄時(shí)間.

3、較重視首頁(yè)

百度對(duì)首頁(yè)的重視程度要比Google高得多,這與上面提到的“較重視第一次收錄印象”一脈相承.百度在顯示搜索結(jié)果時(shí)也常常把網(wǎng)站首頁(yè)顯示出來(lái),而不具體到某個(gè)內(nèi)容頁(yè)(當(dāng)其認(rèn)為不夠重要時(shí)).相對(duì)而言,其用戶體驗(yàn)打了折扣,而增加了其“百度快照”的用戶量.

4、較重視絕對(duì)地址的鏈接

百度在收錄網(wǎng)頁(yè)時(shí)比較重視絕對(duì)地址的收錄,百度提供的網(wǎng)頁(yè)快照功能也沒(méi)有解析相對(duì)地址的絕對(duì)路徑,不知這是百度技術(shù)的疏忽還是其偏好的一大體現(xiàn).

5、較重視收錄日期

百度對(duì)網(wǎng)頁(yè)的收錄日期非?粗,也是其搜索結(jié)果排名的參考點(diǎn),被收錄得越早排名會(huì)較高,有時(shí)甚至不考慮相關(guān)性地把它認(rèn)為比較重要的內(nèi)容放在首位,而點(diǎn)擊進(jìn)入之后才發(fā)現(xiàn)是早已過(guò)時(shí)的信息或者垃圾信息.這是百度需要改進(jìn)的技術(shù).

百度使用的技術(shù):

百度使用以下技術(shù):“一種互聯(lián)網(wǎng)上鏡像和準(zhǔn)鏡像網(wǎng)站的識(shí)別方法”,這個(gè)方法解決了搜索引擎對(duì)雷同信息的重復(fù)獲取,節(jié)省網(wǎng)絡(luò)資源和本地資源,提高系統(tǒng)服務(wù)的質(zhì)量和效率;“一種基于詞匯的計(jì)算機(jī)索引和檢索方法”,該方法對(duì)一段連續(xù)的文字信息,經(jīng)過(guò)詞匯分析處理后,通過(guò)添加隱形詞匯的手段,實(shí)現(xiàn)對(duì)基于詞匯索引和檢索系統(tǒng)的檢索質(zhì)量提升,使用戶獲得更加準(zhǔn)確的檢索結(jié)果;“一種使用快照的方式實(shí)現(xiàn)對(duì)網(wǎng)上信息進(jìn)行記錄和分析的方法”,該方法是通過(guò)對(duì)互聯(lián)網(wǎng)上一個(gè)特定信息,多次進(jìn)行快照的方式,將信息當(dāng)時(shí)的狀態(tài)進(jìn)行保留.并通過(guò)對(duì)一系列快照信息的分析,得到有效數(shù)據(jù),方便地得到網(wǎng)上信息的變動(dòng)情況.