說明:如果您有任何疑問或想咨詢其他業務請撥打電話 400 685 0732
全網監測海量數據按需發布監測預警
實時把握輿情動態精準追溯信息源頭
9月2日,百度站長平臺連續出了三個聲明,細心的觀眾或許已經發現,他們分別是在【產品動態】、【站長學院】、【活動沙龍】中,雖然從表現上似乎他們之間并沒有什么特別的關聯,但是從本質來說,這或許也是一種有目的的教化。幫助站長走向正軌,給站長們灌輸官方說明以及束下條條框框的教化。
當然,這無關是與非。
拐入正題,先是抓取頻次工具的升級。
1、新增抓取時間數據:
展示百度spider每次抓取網站的耗時,根據該數據站長可以了解spider抓取網站的時長,抓取耗時越短代表網站在訪問速度方面的用戶體驗越好。
注意:抓取耗時數據的更新頻次與抓取頻次有關,抓取頻次較高的站點數據更新相對較快。
Rude:好了,網站的相應速度,由此也有了一個更為官方的說法,當然,是針對百度的,如果你的網站相應時間過慢,那么你的網站收錄比較慢也不在話下了。
2、新增抓取狀態統計數據:
新增四類抓取狀態碼統計:類:重定向(301, 302等);第二類、未找到(404);第三類、服務器無響應(501,502等);第四類:服務器連接超時。有助于站長更好的了解網站在spider中的抓取狀態,更好的管理網站。
注意:這里統計的是Baiduspider每次抓取行為的狀態,與網站中該狀態頁面實際數量不能等同看待。
Rude:恩?這些個http狀態碼的東西,不需要太多的說明了吧。
3、提升了抓取頻次工具的響應速度:
加快了使用抓取頻次工具調整抓取次數之后的生效時間。
Rude:哎呀,如果你嫌棄你的網站抓取量不夠,趕緊來這里玩一玩。
想要了解更多的親們,趕緊去實踐吧,而且這里面,也是有圖有真相的說。
第二個,百度關于索引量的再次說明。
百度算是很不錯了,給了一個分析索引量的思維導圖。具體圖例如下:
他的分析思路,很贊。
當然,如果你的index出現了問題,進行細分,以求出到底是哪里出了毛病。
這個毛病,不只是指索引量變小了,同時也有可能是索引量劇增了。如果你不理解劇增的潛在隱患,不妨看下面幾種情況:
1、會不會是網站被黑客攻擊后增加了大量垃圾網頁
2、會不會是Robost協議出了問題,導致大批保密頁面被百度抓取
3、大幅增加的url會不會占用有限的抓取配額,導致重要內容未被抓取
尤其是第三點,特別值得引起關注,當然,這里也是存在疑惑的,比如抓取配額具體是個什么概念,如果是個值,那么每個網站的配額應當是多少?會不會隨著網站的權重增加而增大?都是一些個值得探討的問題。
推薦閱讀
關于百度的抓取診斷工具升級?@rude | 文軍營銷展示百度spider每次抓取網站的耗時,根據該數據站長可以了解spider抓取網站的時長,抓取耗時越短代表網站在訪問速度方面的用戶體驗越好。 注意:抓取耗時數據的更新頻次與抓取頻次有關,抓取頻次較高的站點數據更新相對較快。 Rude:好了,網站的相應速度,由此也有了一個更為官方的說法,當然,是針對百度的,如果你的網站相應時...
說明:如果您有任何疑問或想咨詢其他業務請撥打電話 400 685 0732