正確編寫採集規則才能為網站不斷充實內容,從而提高網站的豐滿程度,提高收錄,儘快讓網站產生經濟效益。dedecms是目前網站使用最多的開源程序,故以此為例介紹如下。因內容較多,本篇分三個章節介紹。
方法/步驟
首先進入網站後臺。採集-採集節點管理-增加新節點。
在“選擇內容模型”下拉菜單中選“圖片集”,確定。
下面開始正式編寫規則。節點名稱隨便填一個容易記住的名稱;編碼與要採集站點編碼一致。
隨便打開要採集站點頁面,右鍵-查看網頁源代碼,在源代碼的最上面有圖中標示的“目標頁面編碼”。
打開要採集的欄目,查看列表頁,並點擊列表頁下面的分頁,查看鏈接地址的變化情況,特別是第一頁與其它頁的不同,可以發現其變化只有最後面的一個數字不同。
拷貝鏈接地址到編寫規則,並將變化的數字改為(*),括號為英文輸入下的括號,並將下面的(*)中的數字改為從1到5,如圖。
測試一下看是否正確。
下面編寫“文章網址匹配規則”。打開要採集的列表中的某個圖片頁面。
右鍵-查看網頁源代碼,找到“區域開始的HTML”和"區域結束的HTML"。如果感覺不好查找,可將代碼拷貝到DW中,用“拆分”的方式,很容易就可找到了。
得到的區域代碼寫入規則中。
注意事項
因內容較多,本篇暫時介紹到這,下面繼續介紹。