最新国产在线不卡AV,国产又爽又黄的视频免费看,精品综合久久久久久97,日韩欧美高清中文字幕免费一区二区

            科普

            采集管理 (五)、實例教你使用采集 帝國網(wǎng)站管理系統(tǒng)

            電腦知識小雪供稿
            實例教你使用采集
            本節(jié)通過采集簡單的頁面作為采集教程實例。
            每個系統(tǒng)模型都有自己的采集,無論是內(nèi)置的還是用戶自定義的系統(tǒng)模型,新聞系統(tǒng)有新聞系統(tǒng)采集,下載系統(tǒng)有下載系統(tǒng)采集等等。 
            下面講解新聞系統(tǒng)模型的采集,其它系統(tǒng)模型采集基本雷同,用戶可舉一反三。
             
            采集頁面地址

            本例要采集的頁面地址:http://www.phome.net/tmp/cjpage/list.html


            開始采集
            采集一般步驟:
            1、增加采集節(jié)點;
            2、預(yù)覽采集正則是否正確;
            3、開始采集;
            4、對采集的數(shù)據(jù)進行審核并入庫;
            5、生成欄目及內(nèi)容HTML頁面。
             
            一、增加采集節(jié)點:
            1、登錄后臺->“欄目”>“采集管理”>“增加采集節(jié)點”;
            2、“選擇要增加采集的欄目”(選擇終極欄目);
            3、“選擇要增加采集的欄目”后進入增加采集節(jié)點頁面;
            4、打開要采集的列表頁面:http://www.phome.net/tmp/cjpage/list.html

            點擊查看“源文件”
             
            點擊查看,列表頁源代碼為如下:
            5、開始設(shè)置采集節(jié)點及列表頁正則:
            (1)、輸入節(jié)點名稱:采集實例
            (2)、采集頁面地址:http://www.phome.net/tmp/cjpage/list.html
            (3)、由列表頁的源代碼:“<a href="page1.html" target="_blank">”,我們得出“內(nèi)容頁地址前綴”為:http://www.phome.net/tmp/cjpage/
            (4)、設(shè)置“信息頁鏈接正則”:由列表頁的源代碼得出。
            圖1:頁面源代碼
             
            圖2:得出的信息頁鏈接正則 
            6、點擊采集的內(nèi)容頁頁面并查看源文件:http://www.phome.net/tmp/cjpage/page4.html
            圖1:內(nèi)容頁頁面

            圖2:內(nèi)容頁源代碼
            7、設(shè)置內(nèi)容頁內(nèi)容正則:(標題及內(nèi)容正則)
            (1)、標題正則:由源代碼內(nèi)容我們得出“新聞標題”正則為:
            圖1:頁面源代碼
             
            圖2:得出的標題正則 
            (2)、內(nèi)容正則:由源代碼內(nèi)容我們得出“新聞內(nèi)容”正則為:
            圖1:頁面源代碼
             
            圖2:得出的新聞內(nèi)容正則 
            8、點擊“提交”按鈕即可增加節(jié)點完畢,整個表單最終效果如下:
            [點擊查看]
             
            二、預(yù)覽采集正則是否正確:
            1、上面增加采集節(jié)點后,我們返回“管理節(jié)點”頁面,如下:
            2、點擊“預(yù)覽”采集,進入節(jié)點正則預(yù)覽與驗證:
            圖1:采集頁面地址列表

            圖2:信息鏈接列表
             
            圖3:采集的內(nèi)容頁內(nèi)容
            3、上面鏈接列表頁及內(nèi)容頁內(nèi)容預(yù)覽無誤后方可進行采集操作。
             
            三、開始采集:
            1、上面的采集節(jié)點正則預(yù)覽無誤后,我們返回“管理節(jié)點”頁面:
            2、點擊上面的“開始采集”鏈接,開始進行采集;
            3、采集信息完成后,系統(tǒng)會轉(zhuǎn)向采集入庫頁面,如下:
             
            四、對采集的數(shù)據(jù)進行審核并入庫:

            即可完成入庫操作:
             
            管理欄目信息也可以看到我們剛才入庫的信息: 
             
            五、生成欄目及內(nèi)容HTML頁面:
            點擊“系統(tǒng)”>“數(shù)據(jù)更新”>“數(shù)據(jù)更新中心”,進入數(shù)據(jù)更新中心頁面:
            1、生成首頁:點擊“刷新首頁”。
            2、生成欄目頁:“刷新多欄目頁面”選擇“國內(nèi)新聞”這個欄目,然后點擊“開始刷新”。
            3、生成內(nèi)容頁:“按條件生成信息內(nèi)容頁面”:
             
            六、預(yù)覽前臺頁面
            首頁:
            列表頁:
            信息內(nèi)容頁:
             
            至此本實例講解完畢。


             
            常見問題
            1、提示信息:Warning: preg_replace() [function.preg-replace]: Compilation failed: range out of order in character class at offset 83 in 
            答:你的采集正則變量名寫錯導(dǎo)致,請檢查你的正則變量。

             
              為你推薦