網(wǎng)站抓取量是影響網(wǎng)站收錄的重要因素,因此把控好網(wǎng)站的抓取量很重要,那么怎么來提升網(wǎng)站的抓取量呢?
網(wǎng)站抓取量=網(wǎng)站的總抓取時(shí)間/網(wǎng)站單個(gè)頁面的抓取時(shí)間
那么自然我們可以從二個(gè)維度來提升網(wǎng)站的抓取量:
一、降低網(wǎng)站單個(gè)頁面的抓取時(shí)間
對于網(wǎng)站單個(gè)頁面的抓取時(shí)間,主要是提高網(wǎng)站的性能,主要包括服務(wù)器空間以及網(wǎng)站代碼,JS、圖片壓縮、視頻等優(yōu)化,促使網(wǎng)站會有很快的打開速度,使得搜索引擎程序抓取下載單頁面時(shí)間變短,從而訪問更多的頁面,增加抓取量。
二、增加網(wǎng)站的總抓取時(shí)間
網(wǎng)站的總抓取時(shí)間又可以細(xì)分,可以分為搜索程序的主動抓取以及被動抓取
對于主動抓取,就是蜘蛛沿著站內(nèi)的某個(gè)鏈接不斷爬去,那么怎么來控制主動抓取時(shí)間呢?
首先許多鏈接要可抓取,不要讓蜘蛛程序無法識別或者無權(quán)限,比如JS跳轉(zhuǎn)什么的,注冊才能訪問之類,然后就是網(wǎng)站的物理層級以及邏輯層級要簡短,物理層級我們可以把一些重要的頁面放在首頁,縮短物理距離;邏輯層級方面網(wǎng)站的層級關(guān)系要簡潔,比如常見的樹狀結(jié)構(gòu),首頁-欄目頁-內(nèi)容頁;{zh1}就是內(nèi)鏈的設(shè)置,把網(wǎng)站相關(guān)的內(nèi)容盡量的串聯(lián)成網(wǎng)狀,使得蜘蛛程序可以方便爬取。
至于被動抓取嘛,更多是從站外鏈接的角度去理解的。
我們可以在站外建立外部鏈接來吸引蜘蛛來到我們網(wǎng)站,增加網(wǎng)站的抓取頻次以及抓取時(shí)間,不過對于外鏈不要隨便的去做,盡量去分享價(jià)值,就像百度的工程師LEE說的,有推薦價(jià)值的外鏈才是有用的,要不然只是起到吸引蜘蛛作用,我們外鏈的效用就大打折扣了,說的有點(diǎn)跑題了,當(dāng)然對于有些人來說聊勝于無嘛。
還有一點(diǎn)要引起大家的注意,就是要允許蜘蛛程序的爬取,這里就涉及到了robots文件的設(shè)置,其次不少網(wǎng)站會有反采集系統(tǒng),有的服務(wù)器的防火墻,還有日志的HTTP狀態(tài)碼,這些都會影響到蜘蛛對于網(wǎng)頁的抓取,從而影響收錄以及流量。
從上面的算式大家其實(shí)也基本可以看出大概的方式了,網(wǎng)站抓取量怎么提升?無非是減小分母增大分子,無痕在這里只是簡單的陳述下自己的一些見解吧,更多的知識大家可以去看看廣州SEO相關(guān)的分享,謝謝。