之前為大家分享了一篇《火車頭採集器安裝流程[精編圖文版]》,下面解決一下火車頭採集器採集文章網址的方法。
工具/原料
火車頭採集器
採集目標網站
方法/步驟
尋找目標網站:
我們以遼寧高考網(高考作文欄目)為目標站:,大家學會方法後可以採集任何網站。
建立採集站點及任務:
1、開啟“火車頭採集器”,這裡我們以2012sp3版本演示(其它版本操作方法類似);
2、建立採集站點(如果只採集一個網站,可以隨便寫,如果需要採集很多網站,就需要進行編號,以免採集重複);
3、右鍵已經建立的採集站點,新建“採集任務”;
採集文章網址(很關鍵):
1、如圖操作:
填寫任務名->嚮導新增->單條網址->貼上目標採集網址->新增->完成;
2、右鍵目標採集頁->檢視原始檔;
3、找到文章網址列表開始和結束標籤(如圖);
4、在火車頭採集器[頁面內選擇定區域採集網址]填寫,開始和結束標籤;
開始測試採集網址:
文章網址已經採集成功,如果採集網址中不是文章網址,有可能是開始和結束標籤有問題,請大家在仔細查詢。
注意事項
文章開始和結束,需要是唯一的,否則將會採集到其它網址。