說明:如果您有任何疑問或想咨詢其他業(yè)務請撥打電話 400 685 0732
全網(wǎng)監(jiān)測海量數(shù)據(jù)按需發(fā)布監(jiān)測預警
實時把握輿情動態(tài)精準追溯信息源頭
一個大型的資訊網(wǎng)站在發(fā)表文章時,如果是一條條的文章網(wǎng)上發(fā),這不僅浪費時間,效率還不高,這時為了提高更新網(wǎng)站的效率,就出現(xiàn)了火車頭采集器,可是火車頭采集規(guī)則怎么寫呢?接下來就由小編來詳細的介紹吧。
火車頭采集規(guī)則寫法介紹
步驟一:新建一個文章采集節(jié)點
登錄后臺,依次點擊 采集>>采集節(jié)點管理>>增加新節(jié)點>>選擇普通文章>>確定
步驟二 :填寫采集列表規(guī)則
1.節(jié)點名稱:隨便(注意你要能分清哦,因為節(jié)點多了的話,有可能會搞得自己混亂)
2.目標頁面編碼:看目標頁面的編碼
3.匹配網(wǎng)址:去到采集目標列表頁面,查看它的列表規(guī)則!比如說很多網(wǎng)站的列表的第一面跟其它內頁是有很大的差別的,所以我一般不采集目標列表的第一頁!
最好是從第二頁開始(雖然可以找出第一頁,但很多的網(wǎng)站是根本沒第一頁的,所以,這里就不說怎么找第一頁了)
4.區(qū)域結束的HTML:在采集目標列表頁打開源代碼!在要采集的文章標題后面的附近找一段在本頁是唯一并且其它要采集的的頁面也是唯一的html標簽!
寫好了,點擊保存信息并進入下一步!如果寫正確了規(guī)則的話,那這些就會出現(xiàn)一個有內容的網(wǎng)址獲取規(guī)則測試
再按下一步!進入填寫采集內容規(guī)則
步驟三:采集內容規(guī)則
1.文章標題:在文章標題前后找兩個標簽,能識別出標題的!
2.文章內容:在文章內容前后找兩個標簽,能識別出內容的!我采集的網(wǎng)站的文章內容前后唯一標簽是<div class=”content”>…<ul class=”page clearfix”>,所以就寫成<div class=”content”>[內容]<ul class=”page clearfix”>!
其它的功能,也不用管!這里只分享怎么能采到文章!然后,點擊保存配置并預覽,如果前面的列表規(guī)則跟內容規(guī)則都寫對了的話,那現(xiàn)在就會預覽到內容了!
點擊僅保存,如果你要馬上采集的話,也可以點擊隔壁的保存并馬上采集!
火車頭采集規(guī)則導入方法
1.導入規(guī)則方法一
右鍵點擊剛才新建的分組,選擇“導入任務至該分組”(記住:不是“導入分組規(guī)則”),在彈出的對話框中選擇已經(jīng)采集規(guī)則文件(后綴為.ljobx)。
2.導入規(guī)則方法二
也可以選擇剛才新建的分組,然后依次點擊菜單“分組”->“導入任務至該分組” 在彈出的對話框中選擇已經(jīng)采集規(guī)則文件(后綴為.ljobx)。
3.導入分組規(guī)則
如果你手上的規(guī)則文件后綴名為“.lgrp”,那么你需要通過菜單或右鍵快捷菜單選擇“導入分組規(guī)則”,而不是“導入任務至該分組”。
好了,有關火車頭采集規(guī)則寫法就介紹到這里了,當然想要掌握這個寫法的可不是馬上就能完成的事情,是需要在不斷的實踐中去掌握和運用的,所以想要掌握格則寫法的,現(xiàn)在就開始練習吧。如果想了解更多的內容,歡迎關注我們文軍營銷的官網(wǎng)。
推薦閱讀
火車頭采集器教程步驟 火車頭采集器使用教程介紹 | 文軍營銷1點擊右下角的“網(wǎng)址采集測試”, 2測試后,如果網(wǎng)址是這么顯示出來的,那就是采集成功了。點擊其中一個網(wǎng)址左邊的“+”符號,可以看到該欄目頁面采集到的內容。 火車頭采集器教程之數(shù)據(jù)采集步驟 火車采集器采集數(shù)據(jù)是分成兩個步驟的,一是采集數(shù)據(jù),二是發(fā)布數(shù)據(jù)。這兩個過程是可以分開的。 1、采集數(shù)據(jù),這個包括采集...火車頭采集圖片方法 火車頭采集圖片步驟是什么 | 文軍營銷言歸正傳,火車頭使用的步驟是:新建站點—新建任務—填寫你要采集的網(wǎng)站文章列表—點下面的開始測試網(wǎng)址—如果有采集到很多文章,看各個地址相同部分(如system/2012/03/07),點返回修改,把system/2012/03/07這部分加到“文章內容必須包含”那里,再測試一下,就可以采集到3月7日的文章地址了—前面準備好網(wǎng)址后接下來...火車頭采集器 火車頭采集器是什么 | 文軍營銷采集器將數(shù)據(jù)發(fā)送給網(wǎng)站后臺程序,由網(wǎng)站后臺程序去處理數(shù)據(jù)通常后臺程序講數(shù)據(jù)存入網(wǎng)站數(shù)據(jù)庫中。 方式二:保存為本地文件 這種方式可以將采集的數(shù)據(jù)發(fā)布到本地的文件中,采集器支持保存成Txt格式、Csv格式和Html格式。 方式三:導入到自定義數(shù)據(jù)庫 這種方式可以通過采集器連接到其他數(shù)據(jù)庫從而將采集的數(shù)據(jù)從軟件內置數(shù)據(jù)...火車頭采集器視頻教程大全 火車頭采集器v9使用視頻教程 | 文軍營銷好好填寫任務列表的規(guī)則。下面教大家如何填寫 END 火車頭采集器教程步驟(4)填寫采集列表頁的規(guī)則 1 找到頂頭的“起始網(wǎng)址”,可先不填。可以在右邊點擊”向導添加”里面填寫,如圖: 2 點擊“批量網(wǎng)址”,如下圖: 3 (1)在“地址格式”空白欄里,復制想要采集的列表欄目網(wǎng)址 ,(先去對方網(wǎng)站某個欄目看 ...火車頭采集規(guī)則寫法介紹 火車頭采集規(guī)則如何導入? | 文軍營銷火車頭采集規(guī)則導入方法 1.導入規(guī)則方法一 右鍵點擊剛才新建的分組,選擇“導入任務至該分組”(記住:不是“導入分組規(guī)則”),在彈出的對話框中選擇已經(jīng)采集規(guī)則文件(后綴為.ljobx)。 2.導入規(guī)則方法二 也可以選擇剛才新建的分組,然后依次點擊菜單“分組”->“導入任務至該分組” 在彈出的對話框中選擇已經(jīng)采集規(guī)則文件...
說明:如果您有任何疑問或想咨詢其他業(yè)務請撥打電話 400 685 0732