說(shuō)明:如果您有任何疑問(wèn)或想咨詢其他業(yè)務(wù)請(qǐng)撥打電話 400 685 0732
全網(wǎng)監(jiān)測(cè)海量數(shù)據(jù)按需發(fā)布監(jiān)測(cè)預(yù)警
實(shí)時(shí)把握輿情動(dòng)態(tài)精準(zhǔn)追溯信息源頭
什么是百度蜘蛛的referer
百度蜘蛛的referer,是指當(dāng)百度蜘蛛抓取某一個(gè)URL的時(shí)候,在HTTP頭中帶的Referer字段。請(qǐng)注意,這個(gè)定義和百度近聲明去除Referer中關(guān)鍵詞數(shù)據(jù)沒有任何關(guān)系。這次講的是spider發(fā)起的HTTP請(qǐng)求,百度而去除的是用戶發(fā)起的。如果百度蜘蛛抓取百度首頁(yè)的logo,會(huì)發(fā)起這樣的請(qǐng)求:
上面Referer字段很明確的表示了他是從www.baidu.com這個(gè)頁(yè)面上發(fā)現(xiàn)并抓取了www.baidu.com/img/bd_logo1.png。而大家在服務(wù)器訪問(wèn)日志中也應(yīng)該能看到相應(yīng)的記錄。目前發(fā)現(xiàn)只有當(dāng)百度抓取一個(gè)網(wǎng)頁(yè)的同時(shí),又抓取了網(wǎng)頁(yè)中的:img、js和css才會(huì)帶上referer字段。這部分額外的抓取量,應(yīng)該不會(huì)占用百度分配的抓取配額,屬于“買1送1”。
對(duì)于站長(zhǎng)的意義
如果你發(fā)現(xiàn)有一批URL(于img,js,css)報(bào)錯(cuò)(4xx或者5xx),但是一直找不到入口在哪,也是說(shuō)你不明白百度蜘蛛是從哪里發(fā)現(xiàn)這些錯(cuò)誤URL的。這個(gè)字段可以幫助你迅速定位。
舉個(gè)例子
比如我們的seo日志分析系統(tǒng)中可以看到,符合下面這種URL Pattern的路徑每天有6萬(wàn)到10萬(wàn)的抓取而且全部報(bào)404。
從發(fā)現(xiàn)問(wèn)題至今過(guò)了1個(gè)月,查遍整個(gè)網(wǎng)站我也沒找到入口。偶然仔細(xì)查了一下日志,想起了百度蜘蛛的referer,馬上能定位問(wèn)題了。這些404的URL來(lái)自于一套沒人維護(hù)也沒人關(guān)注的頁(yè)面(往往是這樣)。收錄流量都不錯(cuò)。由于近公司圖片系統(tǒng)更新,圖片的URL全部更改了,但這套頁(yè)面并沒有跟著更新。
如果站點(diǎn)沒有記錄referer怎么辦
iis請(qǐng)?jiān)谶@里勾選“cs(Referer)”:
轉(zhuǎn)自:百度站長(zhǎng)平臺(tái)劉明
推薦閱讀
說(shuō)明:如果您有任何疑問(wèn)或想咨詢其他業(yè)務(wù)請(qǐng)撥打電話 400 685 0732