Seo研究人員必須知道以下返回代碼的含義。對于不熟悉的,也要了解一下基本情況,比如200是請求成功,301重定向,404找不到等等。首先介紹一下百度對各個狀態的處理邏輯。
百度蜘蛛對常用http返回碼的處理邏輯如下:
404404返回代碼的含義是“未找到”。百度會認為該網頁無效,所以一般會從搜索結果中刪除。短時間內,蜘蛛再找到這個網址就不會抓取了。
503503返回代碼表示“服務不可用”。百度會認為網頁暫時無法訪問,這通常發生在網站暫時關閉,帶寬有限的情況下。對于網頁返回503,百度蜘蛛不會直接刪除這個網址,短期內會再次訪問。如果到時候網頁已經恢復,會正常抓??;如果繼續回到503,短期內會訪問幾次。但是如果網頁長時間返回503,那么這個網址還是會被百度認為是無效鏈接,從搜索結果中刪除。
403403返回碼的意思是“禁止”,百度會認為該網頁目前禁止訪問。這種情況下,如果是新發現的網址,百度蜘蛛暫時不會抓取,短期內會再次檢查;如果百度已經收錄了網址,目前不會直接刪除,短期內會再次訪問。如果當時允許訪問該網頁,則正常抓??;如果還是不允許訪問,短期內還會重復幾次。但如果網頁長時間返回403,百度也會將其視為無效鏈接,從搜索結果中刪除。
301301返回碼表示“永久移動”,百度會認為該網頁當前跳轉到新的網址。如遇站點遷移、域名變更、站點改版,建議使用301返回碼,最大限度減少改版帶來的流量損失。雖然現在百度蜘蛛對301跳轉的反應期比較長,但是我們還是建議你這樣做。
如果網站暫時關閉,在網頁打不開的情況下,不要馬上返回404。建議使用503狀態。03可以告訴百度蜘蛛這個頁面暫時無法訪問,請稍后再試。
如果百度蜘蛛給你的站點壓力太大,請盡量不要用404,也建議回歸503。這樣過一段時間百度蜘蛛會再次嘗試抓取這個鏈接。如果該站點當時處于空閑狀態,則會被成功爬網。
有些網站希望百度只收錄一些內容,比如經過審核的內容,一段時間積累的新用戶頁面等等。在這種情況下,建議新內容暫時返回403,待審核或處理后再返回正常狀態的返回碼。
當站點遷移,或者域名變更時,請使用301返回碼。