帝国cms采集教程

网上很多关于帝国cms采集的教程,大家可以百度一下,也可以下面看我演示。

对象站:www.qqjay.com 只要会一个站的规则,在其它网站没做防采集的情况下,其它网站都会采集了。

首先登录后台->点击栏目->采集管理->增加采集管理

assada.PNG


选择你要采集的栏目->输入你的节点名称->采集地址,可用分页变量->内容页地址填写目标网址

asdfsdfsd.PNG

页面编码选择正常编码

信息链接区域正则:
    例如qqjay的QQ个性签名页:http://www.qqjay.com/html/rizhi/,我们需要获取这个区域的所有链接,也就是'QQ个性签名列表'一直到下面'分页'的链接

1sadasdasd.PNG

    ssdfsdfs.PNG

然后我们打开源代码查看,可得这个区域代码如下:
        

<ul class="content">
				<li>
					<h4><a href="/html/rizhi/gaoxiao/" class="column">[ QQ搞笑签名 ]</a> <a href="/html/rizhi/gaoxiao/220458.html" title="我单身我快乐,我泡十个小哥哥。" target="_blank">我单身我快乐,我泡十个小哥哥。</a><em>时间:08-21</em></h4>
					<p> 我蛮喜欢睡觉的,因为每次都会梦到你。 可爱之人必遇可爱之事。 除了先生的美貌不接受任何贿赂。 想摸胸吗,改日吧。 孜孜不倦熬夜,勤勤恳恳护肤。...
						<a class="more2" href="/html/rizhi/gaoxiao/220458.html" target="_blank">(查看全文)</a>
					</p>
					<div class="cl"></div>
				</li>
<li>这里每行都是一样的样式代码,链接不一样</li>
</ul>
那么我们在信息链接区域正则的代码就是:<ul class="content">
[!--smallurl--]
</ul>
信息页链接正则:就是这个区域的一个链接,采集是一个个链接抓取的
        查看源码可知
<li>
					<h4><a href="/html/rizhi/qinglv/" class="column">[ QQ情侣签名 ]</a> <a href="/html/rizhi/qinglv/231337.html" title="男生一献殷勤,女生应该要有心理准备。" target="_blank">男生一献殷勤,女生应该要有心理准备。</a><em>时间:08-21</em></h4>
					<p> 我们的爱像风筝,自由却不散漫。 我们的爱像花火,热情却不张扬。 能被我放在心上的人不多,毕竟心的面积有限。 能被我踢出世界的人不少,毕竟贱人...
						<a class="more2" href="/html/rizhi/qinglv/231337.html" target="_blank">(查看全文)</a>
					</p>
					<div class="cl"></div>
				</li>
那么我们的信息页链接正则就是

<a class="more2" href="[!--newsurl--]" target="_blank">*</a> 

标题正则内容就是内容页的标题:

 一般为:<h1>[!--title--]</h1>

   可先查看源代码样式

    
新闻正文正则:

qqjay的正文区域为:

<div class="aa630">
</div>
<p><font color="#ff0066">⊙&nbsp;</font>确认过眼神你们都是我的人</p>
<p>这里都是内容,内容太多,不显示</p>
</div>
<div class="next2">
<a href='/html/rizhi/aiqingqianming/215943.html' title='我无恶不作,希望你为民除害收了我。' class='article-pre'>&lt; 上一篇</a>
<a href="/html/rizhi/zheliqianming/120630.html">随机一篇</a>
</div>
<div class="ad630">
</div>
那么我们这里的正文规则就是:
<div class="aa630">
</div>
[!--newstext--]
</div>
保存就可以进行采集测试,讲的可能不好,可联系我QQ13245505指导,可代写收取一定费用。

发表评论

路人甲

网友评论(0)