智动网页内容采集器是一款绿色免费的网页内容自动采集软件。软件功能强大,可用多任务多线程方式采集任何网页上的任何指定文本内容,并进行你需要的相应过滤和处理,可以用搜索关键词方式采集需要的指定搜索结果..
【智动网页内容采集器功能特点】
1、采用底层HTTP方式采集数据,快速稳定,可建多个任务多线程采同时采集多个网站数据
2、用户可以随意导入导出任务
3、任务可以设置密码,保障您采集任务的细节安全不泄漏
4、并具有N页采集暂停/拨号换IP,采集遇特殊标记暂停/拨号换IP等多种破解防采集功能
5、可以直接输入网址采,或JavaScript脚本生成网址,或以关键词搜索方式采集
6、可以用登录采集方式采集需要登录帐号才能查看的网页内容
7、可以无限深入N个栏目采集内容、采链接,支持多级内容分页采集
8、支持多种内容提取模式,可以对采到的内容进行你需要的处理,如清除HTML,图片等等
9、可自编JAVASCRIPT脚本来提取网页内容,轻松实现任意部分内容的采集
10、可按设定的模版保存采到的文本内容
11、可将采到的多个文件按模版保存到同一个文件中
12、可对网页上的多个部分内容分别进行分页内容采集
13、可自设客户信息模拟百度等搜索引擎对目标网站采集
14、支持智能采集,光输网址就可以采到网页内容
15、本软件永久终身免费使用
【智动网页内容采集器使用方法】
强烈建议不会写规则的朋友使用智能采集方式,输入网址即可采集(方法:新建->智能采集任务)
【智动网页内容采集器更新日记】
2012/7/31:v1.9发布:
软件内置网址更新为www.zdexe.com
采用全新的智动软件控件UI
增加用户反馈到EMAIL功能
增加将初始化链接直接设置作为最终内容页处理功能
加强内核功能,支持关键词搜索替换POST内的关键词标记
优化采集内核
优化断线拨号算法
优化去重复工具算法
修正拨号显示IP不正确BUG
修正遇出错关键词暂停或拨号时没有重新采集出错页面的BUG
修正限定内容最大值为0时,最小值无法正确保存BUG
2014/6/19:v1.91发布:
修复对非正规格式网页自动识别网页编码BUG
清除标记增加,清除首尾空行标记
启动最新反馈系统
启用最新资讯界面
启用最新系统内核