采集管理 (四)、采集正則寫法 帝國網(wǎng)站管理系統(tǒng)
電腦知識(shí) 由小雪供稿采集正則寫法 | |
|
帝國CMS的采集正則 | |||||||||
1、作用:通過設(shè)置采集正則以便使系統(tǒng)識(shí)別你要采集的內(nèi)容。 | |||||||||
2、帝國CMS的采集正則是什么樣的,下面我們用實(shí)例講解: | |||||||||
|
|||||||||
3、帝國CMS正則還有表示任意內(nèi)容的字符:“*” | |||||||||
如果“識(shí)別代碼頭部”中有內(nèi)容是變化的,那么我們可以用*代替它。如頁面源代碼為如下,我們要采集下面的鏈接地址:
|
|||||||||
4、其他說明: | |||||||||
(1)、正則要找出唯一性的開頭字符。有時(shí)候空格都會(huì)成為識(shí)別的依據(jù)。 |
|||||||||
(2)、對(duì)于特殊字符請(qǐng)?jiān)谇懊婕由?ldquo;\\”,當(dāng)然直接將特殊字符改為“*”最合適了。特殊字符如下: “ )”、“(”、“{”、“}”、“[”、“]”、“\”、“?”等等。 |