帝国采集正则怎么写? 帝国cms详细调查了正则的写法
帝国CMS的采集正则:
1、帝国CMS的采集正则是什么样的,用实例来说明吧:
(1)、如果采集页面的内容页面,则为以下页面。
图1:HTML页面
图2 :查看页面的源代码,您将看到以下内容。
) 2、从上图源代码的内容中可以得到帝国CMS的采集正则:
新闻内容正则:内容: [! 新文本
“! 标题]和[! newstext]分别是“标题”和“内容”字段的正则变量。 用于指定要收集的内容的位置。
(3)、由以上可知,帝国CMS采取正则是将采取的内容置换为正则变量的代码内容。 格式:
识别代码头[! 变量名称]标识代码末尾
注意:上面的“识别码头”必须是唯一的标记。
2、帝国CMS正则中也有表示任意内容的文字:“*”
如果“识别码标题”的内容有变化,可以用*代替。 如果页面的源代码如下所示,请收集以下链接目标:
标题
通过用“*”的任意内容表示字符,可以通过以下正则忽略可变内容而得到链接目标。
a title=“*”href=“比”小[! 大于newsurl]的
附加说明: [! newsurl]是页面链接到的正则变量。
3、其他说明:
正则找出唯一的开头字符, 空间有时也可以作为识别的依据。