添加采集项目
采集管理首页
所属分类:
新闻资讯 {$classid1}
招聘资讯 {$classid2}
房产资讯 {$classid3}
采集名称:
目标编码:
GB2312
UTF-8
BIG5
gbk
分页设置:
不分页
批量分页
采集对象页:
分页代码
{$ID}
格式:http://faq.tfwed.com/List_01/index_{$ID}.shtml
生成范围:
To
例如:1 - 9
内容分页方式:
不分页
采用原文分页
只有在内容设置分页的时候有用
采集参数:
立即入库
保存图片
开启破解图片防盗链
如果图片可以打开,请不要选此选项,因为浪费资源
过滤选项:
Iframe
Object
Script
Div
Class
Table
Tr
Span
Img
Font
A
Html
Td
过滤文章页面标签:
多个请换行 主要是用来替换掉文章页面的一些标签,以免采集不到我们想要的信息
过滤文章内容标签:
格式:替换前的字符串|替换后的字符串 每条替换规则之间用回车隔开