說明:如果您有任何疑問或想咨詢其他業務請撥打電話 400 685 0732
全網監測海量數據按需發布監測預警
實時把握輿情動態精準追溯信息源頭
搜索引擎是怎樣判斷原創文章的呢?
作為文章內頁,文章的內容占頁面的大部分面積,首先我們來看搜索引擎是如何判斷的。
網頁的大致構成:
<html>
<head>
<title>網頁標題</title>
網頁基本信息描述(CSS、JS、RSS、keywords等基本描述)
</head>
<body>
網頁的主題內容
</body>
</html>
上面是一個網頁的基本元素,<head></head>是網頁的基礎描述,無論是搜索引擎還是用戶(搜索結果),這是了解該網頁基礎的信息。
一個網頁的重點應該是<body></body>之間的內容,這里是記錄該網頁詳細的信息,用戶通過瀏覽器也只能看見<body>元素里面的內容,所以,搜索引擎重點處理的內容包含在<body>元素里面。
了解了網頁的大致構成后,我們來看看搜索引擎是如何對網頁建立索引的。
搜索引擎建立索引和返回結果
首先我們要明白一點,搜索引擎不是智能,當然也不具備分析文章內容的能力,這也是為什么一些我們認為是牛頭不對馬嘴的文章,搜索引擎確收錄的很好。
再來看文章,一篇文章是由很多句子構成的,句子又是由很多詞語來組合而成的。
搜索引擎在對網頁建立索引的時候,應該選擇基礎的方式,那是將文章拆分為若干詞語,再將這次詞語進行轉換“二進制(不敢確定具體單位)”,在搜索引擎的算法里面,這些“二進制”將用于各種計算。根據用戶的關注度,這些“二進制”和對應的算法結果將被預先儲存,以便及時向用戶展示算法結果(搜索結果),一些關注度不高的,及時返回數據。由于涉及的數據不多,處理速度完全可以滿足。
通過上面的分析和目前搜索引擎的變化,熱門關鍵詞排名相對穩定(一段時間更新一次),長尾關鍵詞的排名不穩定的大致情況了。
說明:如果您有任何疑問或想咨詢其他業務請撥打電話 400 685 0732