在做測試站或外推時會用到採集器採集文章,使用火車頭採集某個網站的文章非常方便,下面就跟隨小編一起來為自己的測試站和外推採集一些文章吧。
工具/原料
火車頭採集軟件LocoySpider_V7.7
方法/步驟
雙擊打開火車頭,此處採用LocoySpider_V7.7做示範
為自己要採集的文章建立組別和任務:在菜單欄中點擊分組-新建分組—命名組
創建分組後新建任務:在菜單欄中點擊分組-新建任務—填寫任務名
設置採集規則第一步:點擊添加-批量多頁(如果是採集單頁,則選擇單條網址)—輸入網址、等差數列—添加完成
等差數列的值根據你要採集的列表頁數改變,如要採集5頁,則填寫5;
添加完成後可點擊測試網址採集
設置採集規則第二步:隨意打開採集頁上的一篇文章做測試,更改標題、內容規則。
更改標題規則:查看文章源代碼-ctrl+f 找到文章標題,將標題前後代碼填入標題規則中;如圖
更改內容規則:查看文章源代碼-ctrl+f 找到文章內容的第一句和最後一句,將第一句前面的唯一代碼和最後一句後面的唯一代碼填入內容規則中。如圖
設置規則完畢後,可測試採集效果
設置採集規則第三步:導出採集內容-保存即可
注意事項
不同的火車頭採集版本採集過程可能會略有差異。但原理相同