現(xiàn)今,眾多SEO公司都提供SERP跟蹤服務,何為SERP,百度百科的定義如下:
“SERP是Search Engine Results Page的首字母縮寫,即搜索引擎結(jié)果頁面。是搜索引擎對搜索請求反饋的結(jié)果,通常SERP包含搜索結(jié)果的左右兩側(cè),而不是單指哪一側(cè)。
SERP指搜索引擎(如Google或百度)對關鍵詞查詢的結(jié)果頁面。除了不同的搜索引擎,每個搜索引擎對于相同的關鍵詞查詢,可按結(jié)果的性質(zhì),返回不同的結(jié)果頁面,如圖片SERP、視頻SERP、新聞資訊SERP、博客SERP等。SERP上的站點排列順序,根據(jù)各個搜索引擎的不同算法計算并賦值。
搜索引擎優(yōu)(SEO)的主要目的之一是把企業(yè)(或組織)站點在SERP上的排名加以提升。”
而對于SERP的跟蹤,無非是通過搜索引擎提供的API或者程序的抓取來實現(xiàn),一般來說,如果通過API來實現(xiàn)的話,查詢量過多的話,是需要一定費用的,而且有一些前提,一般是購買了搜索引擎提供商的競價服務,并且有一定的門檻。
這樣來說的話,如何免費的獲取SERP跟蹤信息成了大多數(shù)
seo外包服務商的研究課題,于是,普遍的方法出來了:使用蜘蛛程序去解析網(wǎng)頁獲取頁面排名結(jié)果。
對于頻繁抓取搜索引擎的排名數(shù)據(jù),這個毋庸置疑會受到其間歇性的屏蔽,導致抓取的排名數(shù)據(jù)不準?如何解決?
個人提出以下幾個思路:
1,緩存處理。對于用戶已經(jīng)查詢過的關鍵詞及網(wǎng)址,存儲到臨時表中,不進行實時查詢。
2,多臺服務器抓取。如果某臺服務器臨時抓取出錯,則換一臺服務器去嘗試抓取結(jié)果。
3,跨域的js進行客戶端抓取。即cross-domain-scripting,這個應該有一定的難度,至少還沒有發(fā)現(xiàn)有好的現(xiàn)成的解決方案。
4,做成c/s的的客戶端工具,從用戶網(wǎng)絡環(huán)境中獲取排名數(shù)據(jù),然后由用戶觸發(fā)保存到數(shù)據(jù)庫中。
至于技術(shù)上的實現(xiàn)問題,需要不斷的去嘗試及優(yōu)化獲取結(jié)果的性,終的目的是讓客戶平滑的看到SERP的排名信息。關于技術(shù)上的深入探討,歡迎繼續(xù)關注本人的后續(xù)文章。
”