作為一名SEO優(yōu)化員,你知道機器人協(xié)議是什么嗎?如何編寫Roopts.txt文件?我將在這里告訴你什么是機器人協(xié)議和寫RooTo.txt文件的方法。
機器人協(xié)議(也稱為爬蟲協(xié)議、機器人協(xié)議等)是互聯(lián)網(wǎng)爬蟲排除標(biāo)準(zhǔn)的全稱,TXT是搜索引擎訪問網(wǎng)站時首先查看的文件,當(dāng)我們不想把網(wǎng)站的一部分內(nèi)容由搜索引擎抓取時,我們可以使用Robots協(xié)議告訴搜索引擎哪些頁面不用抓取,它們中的大多數(shù)都可以保護網(wǎng)站的隱私,如一些死鏈重復(fù)的頁面等等。
用戶代理:指定哪些爬蟲將是有效的代表所有搜索引擎,如百度(BauSupIDE),谷歌(Google BooT),360(360蜘蛛)。
為了避免在新站點啟動之前或站點更新之前出現(xiàn)爬行錯誤或臨時鏈接,可以使用整個站點屏蔽爬行操作,在根目錄中建立機器人TXT,添加以下內(nèi)容:
篩選所有蜘蛛抓取SEO文件夾的根目錄和根目錄的所有內(nèi)容,將SEO目錄的根目錄下的HTML文件機器人添加以下內(nèi)容:
注意:上面已經(jīng)寫好了,SEO表示根目錄下的SEO目錄的內(nèi)容。它不禁止seotest中的文件夾和文件夾,比如根目錄的所有內(nèi)容。
網(wǎng)站被修改或刪除后,如果已經(jīng)由搜索引擎索引,則原始URL是404索引。一般做法如下:
如果鏈接已被替換,還可以使用301跳轉(zhuǎn)到新的鏈接,301跳過后原來的頁面和新的頁面處理方法;
會員中心、登陸界面、聯(lián)系我們等雖然這些都是有用的,蜘蛛也會爬行到這些頁面的鏈接,但這些頁面也會被分散,所以為了集中權(quán)重,一些不參與排名的頁面應(yīng)該被機器人阻擋應(yīng)該在頁面的頭部添加聲明,并向指向頁面的鏈接添加NoFLOLLT標(biāo)簽。
SITAMAP指數(shù)最好放在機器人的底部。蜘蛛會遵循前面的原理爬行站點地圖。