服務器返回碼解讀
最近很多伙伴問我各種返回碼的概念,感覺很憂傷,其實這些知識在百度站長平臺wq可以得到解答。但是今天也給大家寫篇文章講解一下,老手就直接飄過吧。
網站返回碼是指瀏覽器請求一個網頁后得到網頁返回給瀏覽器的一個狀態碼。不同的返回數字代表著不同的狀態。一般記住幾個比較常用的就可以,比如2××就代表正常,3××代表重定向,4××網頁錯誤,5××服務器錯誤。下面以我的這個博客站為例講解一下。
站長平臺輸入網站的地址,正常會顯示200代碼,如下圖
網站200返回碼
網站做了301重定向之后,輸入被重定向的網址,就會顯示301代碼
網站301返回碼
在網站的地址后面隨便加上一些亂字符,顯然這樣的網址是不存在的,那么顯示的代碼就是404.網站的錯誤頁面或者被刪除頁面返回碼都應該是404,有的網站錯誤頁面會出現軟404,就是說本來是錯誤頁面但是返回碼卻是200,那么這樣的頁面就要重點處理一下,對于軟404,{zh0}的處理方法是返回404代碼,這樣用戶可以根據404錯誤頁面來尋找相關頁面,爬蟲程序也會很好的處理404錯誤,另外可以根據導致軟404的幾種可能性來檢查網頁,從而修復錯誤。
但有時候現實并不是預料的那么理想,這時候我們可以利用robots.txt文件或者nofollow來阻止爬蟲程序,在普通用戶方面,軟404必然會導致頁面的跳出率過高,那么,為了達到更好的用戶體驗,我們可以適當修改軟404的錯誤提示頁面而不是返回系統默認頁面甚至是網站首頁。