蜘蛛爬多少頁不是最重要的事。重要的是有多少頁面被索引,就像我們經(jīng)常調(diào)用的庫一樣。
對于網(wǎng)站管理員或SEO優(yōu)化器來說,搜索引擎索引庫是分級的,高質(zhì)量的頁面被分配給重要的索引庫,普通頁面留在公共庫中,更糟糕的頁面被分配給低級別的庫作為補(bǔ)充材料。目前,60%的檢索要求只能通過調(diào)用重要索引庫來滿足。
哪些頁面可以包含在百度搜索中事實(shí)上一般原則是:用戶的價(jià)值。
1 及時(shí)性和價(jià)值頁面:這里的及時(shí)性和價(jià)值是并列且不可或缺的。一些網(wǎng)站做了大量的收集工作來產(chǎn)生及時(shí)性內(nèi)容頁面,導(dǎo)致出現(xiàn)一些百度不想看到的一堆毫無價(jià)值的頁面,。
2 高質(zhì)量的主題頁面:頁面的內(nèi)容不一定是原創(chuàng)的,也就是說,可添加一些新鮮的內(nèi)容如視圖和評論,讓它可以與各方的內(nèi)容很好地集成,以豐富用戶的綜合內(nèi)容。
3 高價(jià)值原創(chuàng)內(nèi)容頁面:百度原創(chuàng)定義提取后積累了一定經(jīng)驗(yàn)成本的文章。不要再問我們原創(chuàng)是否是原創(chuàng)。
4 重要的個(gè)人頁面:這里只是一個(gè)例子。一位名人在新浪微博上開了一個(gè)賬戶即使他不定期更新它,它仍然是百度的一個(gè)非常重要的頁面。
事實(shí)上,大部分的互聯(lián)網(wǎng)網(wǎng)站都沒有被百度收錄。這不是因?yàn)榘俣葲]有找到它們,而是因?yàn)楹Y選鏈接之前的數(shù)據(jù)庫被過濾掉了。什么樣的網(wǎng)頁在初始鏈接中被過濾掉了?
1 使用一些無法被百度蜘蛛解析的技術(shù),如JS、AJAX蜘蛛陷阱,雖然用戶可以看到豐富的內(nèi)容,但仍然會被搜索引擎拋棄。
2 具有慢加載速度的頁面也可以被視為空頁或短頁。注意,廣告加載時(shí)間是在整個(gè)頁面加載時(shí)間中計(jì)算的。