独品网页采集是一款网页采集软件,能够批量采集各大论坛、网站内的图片、文章、链接、小说、软件、视频音乐等资源,独品网页采集还可自定义筛选条件,采集速度快,准确度高。
1、链接地址:可以是单个地址也可以循环地址,还可以是其他任务采集到的所有链接地址。 如http://bbs.dupinsoft.com/thread-[1-360]-1-1.html包括360个页面
2、采集命令:命令分为两部分,前一部分为指定区域,后一部分指定内容,如:“div class=t_f”“<img src=”(论坛贴内图片)、"div class=top""text"(区域内文本)
3、链接过滤、采集过滤:均使用函数过滤,自带常用过滤函数find、notfind、findin、notfindin,使用:find(<title><text>,贴图鉴赏)、notfind(value,image/face)
4、执行参数:涉及到采集完成后自动下载、按网页标题保存、文件重复时跳过、是否保留到IE缓存等
1、采集discuz、phpwind等论坛博客贴内大图、贴内文章、贴内链接,可限定版块或排除版块,还可以指定发帖作者、帖子内容等。
2、采集小说文章、软件链接、视频音乐,可全站查找、按搜索关键字查找等。
1、简单型:添加任务>填写网址>分析页面>填写命令>采集下载
2、详细型:新建数据>添加任务>填写网址>分析页面>得到采集命令>填写过滤函数>设置参数>选择保存路径>采集>下载