先簡單介紹下百度收錄的基本流程是,蜘蛛通過外部鏈接找到你的網(wǎng)站——爬行——存儲(chǔ)在數(shù)據(jù)庫中——展現(xiàn)。在了解了搜索引擎的基本原理后,下面小編說說網(wǎng)站文章不被收錄的問題。
一、蜘蛛沒有爬行網(wǎng)站
也就是說,蜘蛛沒有發(fā)現(xiàn)你的網(wǎng)站,所以就不會(huì)被收錄。你可以通過查看網(wǎng)站日志來判斷蜘蛛是否已經(jīng)爬過你的網(wǎng)站,如果沒有,你可以手動(dòng)提交搜索引擎,然后去高權(quán)重的網(wǎng)站發(fā)布外鏈。
二、頁面的質(zhì)量
從三個(gè)方面考慮,首先是頁面內(nèi)容的質(zhì)量,如果文章的內(nèi)容都是復(fù)制的,可以就會(huì)被百度的去重算法過濾掉,自然就無法收錄。另外,如果頁面中存在大量的死鏈接或者整個(gè)頁面使用Flash等不友好的設(shè)計(jì),也會(huì)影響到百度對(duì)站點(diǎn)的收錄。
三、網(wǎng)站中有違禁詞
包括網(wǎng)站標(biāo)題和頁面中出現(xiàn)的大量禁止用語,這些頁面也會(huì)被百度過濾。
四、度娘的特殊時(shí)期
在一些大會(huì)時(shí)期,度杜娘怕惹麻煩,會(huì)減少對(duì)新站的收錄。雖然它不承認(rèn),但經(jīng)過總結(jié)確實(shí)有這種現(xiàn)象。
五、網(wǎng)站設(shè)置不當(dāng)
很多程序員擔(dān)心在調(diào)試程序時(shí)會(huì)被百度抓取。采用robots.txt來屏蔽蜘蛛爬行,有時(shí)很容易忘記,所以檢查一下。
六、域名處于處罰期
這是一件很悲哀的事情,很多新手注冊(cè)了一個(gè)域名,結(jié)果網(wǎng)站就是不被收錄,反而百度的處罰時(shí)間越來越長。如果這個(gè)域名上有一個(gè)使用者的網(wǎng)站被懲罰,域名到期被你注冊(cè),且你使用時(shí)還處于懲罰期,名域名名義上你使用所以網(wǎng)站就不會(huì)被收錄。
網(wǎng)站不被收錄,無非就是以上幾點(diǎn)原因,如果你的網(wǎng)站未收錄,你可以參考以上幾點(diǎn)方法來排除。當(dāng)你知道問題所在,就可以對(duì)癥下藥了。