采集“帝國官方技術(shù)文檔”實(shí)例教程 帝國網(wǎng)站管理系統(tǒng)
電腦知識 由小雪供稿實(shí)例教你使用采集:本節(jié)通過采集“帝國官方技術(shù)文檔”作為采集教程實(shí)例 |
不同系統(tǒng)模型都有自己的采集表單,無論是內(nèi)置的還是用戶自定義的系統(tǒng)模型,新聞系統(tǒng)有新聞系統(tǒng)采集,下載系統(tǒng)有下載系統(tǒng)采集等等。 |
下面只是新聞系統(tǒng)模型的采集,其它系統(tǒng)模型采集基本雷同,用戶可舉一反三。 |
采集頁面地址:http://www.phome.net/document/java/ |
一、登陸后臺-》“管理欄目”-》“增加采集節(jié)點(diǎn)”。 |
二、“選擇要增加采集的欄目”(選擇終極欄目)后進(jìn)入增加節(jié)點(diǎn)表單: |
![]() |
三、由于前面許多選項(xiàng)是依實(shí)際需求而設(shè)定。我們下面主要講解正則的主要內(nèi)容: |
1、輸入“采集頁面地址”列表,如下圖:(每個(gè)列表用回車格開) |
![]() |
2、由于采集列表頁的信息鏈接正則不包含域名,所以要設(shè)置地址前綴: |
![]() |
3、設(shè)置“信息頁鏈接正則”: |
說明:由于此采集頁面不需要設(shè)置“信息鏈接區(qū)域正則”,所以直接設(shè)置“信息頁鏈接正則”即可。 |
![]() |
上面正則由下面得出的:(查看列表頁的源文件:http://www.phome.net/document/java/) |
說明:因?yàn)橄旅骀溄拥刂窙]有加上域名,所以我們上面要設(shè)置“內(nèi)容頁地址前綴”。 |
![]() |
4、設(shè)置“標(biāo)題正則”: |
![]() |
上面正則由下面得出的:(查看內(nèi)容頁的源代碼:http://www.phome.net/document/java/200505/java111590843215168.html) |
![]() |
5、設(shè)置“作者正則”: |
![]() |
上面正則由下面得出的:(查看內(nèi)容頁的源代碼) |
![]() |
6、設(shè)置“信息來源正則”: |
![]() |
上面正則由下面得出的:(查看內(nèi)容頁的源代碼) |
![]() |
7、設(shè)置“新聞?wù)恼齽t”: |
![]() |
上面正則由下面得出的:(查看內(nèi)容頁的源代碼) |
![]() |
![]() |
8、點(diǎn)擊“提交”按鈕即可增加完畢,整個(gè)表單最終效果如下: |
[點(diǎn)擊查看整個(gè)采集表單] |
其他說明:關(guān)于采集測試、入庫等相關(guān)操作可以看“管理采集節(jié)點(diǎn)”教程 |
如果查看網(wǎng)頁源代碼?看下圖: |
![]() |
上一篇:藥蓮教你如何采集[小林教程解析版]
下一篇:插件管理 (一)、廣告系統(tǒng)