网站万能信息采集器是由杭州网乐科技有限公司开发的一款万能信息采集、网站抓取工具软件。网站万能信息采集器结合了所有网络信息采集抓取软件的优点,力争做到功能最强大、使用最简单。网站万能信息采集器可以把某个网页中所有的信息都抓取下来将其另存,还可以自动将其发布到用户自己的网站中;网站万能信息采集器能够对任意网站中任意类型的信息进行抓取操作,如抓取新闻、抓视频、抓取供求信息、抓取人才招聘、抓取论坛帖子、抓取音乐等链接,能看到就能采集到;网站万能信息采集器还可以无人工全自动干活,您睡觉时也可以保持您的网站拥有最新的信息。有这方面需求的朋友赶紧下载使用吧!
软件特色
1、数据采集导出全自动
网站抓取的目的主要是添加到您的网站中,网站万能信息采集器软件可以实现信息采集添加全自动完成。其它网站刚刚更新的信息五分钟之内就会自动跑到您的网站中,您说轻松不轻松?
2、需要登录的网站也照抓
对于需要登录才能看到信息内容的网站,网站万能信息采集器可以实现轻松登录并采集,即使有验证码也可以穿过登录采集到您需要的信息。
3、任意类型的文件都能下载
如果需要采集图片、Flash、视频等二进制文件,网站万能信息采集器经过简单设置就可以把任意类型的文件保存到本地。
4、多级页面一次采集 一次抓整站
可以同时采集到多级页面的内容。如果一条信息分布在很多不同的页面上,网站万能信息采集器也能自动识别N级页面实现信息采集抓取。
5、自动识别JavaScript特殊网址
不少网站的网页连接是类似javascript:openwin('1234')这样的特殊网址,不是通常的http://开头的,网站万能信息采集器也能自动识别抓到内容。
6、采集过滤重复 导出过滤重复
有些时候网址不同,但是内容一样,万能采集器仍然可以根据内容过滤重复。(新版本新加功能)
7、多页新闻自动合并、广告过滤
有些一条新闻里面还有下一页,网站万能信息采集器也可以把各个页面都抓取到的。并且抓取到的新闻中的图片和文字同时可以保存下来,并能把广告过滤掉。
8、自动破解Cookie和防盗链
很多下载类的网站都做了Cookie验证或者防盗链了,直接输入网址是抓不到内容的,但是网站万能信息采集器能自动破解Cookie验证和防盗链,呵呵,确保您能抓到想要的东西。
软件功能
1、采集发布全自动
2、自动破解JavaScript特殊网址
3、会员登陆的网站也照抓
4、一次抓取整站 不管有多少分类
5、任意类型的文件都能下载
6、多页新闻自动合并、广告过滤
7、多级页面联合采集
8、模拟人工点击、破解防盗链
9、验证码识别
10、图片自动加水印
网站万能信息采集器新版特性
1、全新的分层设置,每一层都可以设置特殊的选项,摆脱了以前的默认3层限制
2、任意多层分类一次抓取,以前是需要先把各分类网址抓到,然后再抓每个分类
3、图片下载,自定义文件名,以前不能改名
4、新闻内容分页合并设置更简单,更通用,功能更强大
5、模拟点击更通用更简单,以前的模拟点击是需要特殊设置的,使用复杂
6、可以根据内容判断重复,以前只是根据网址判断重复
7、采集完之后允许执行自定义vbs脚本endget.vbs,发布完之后允许执行endpub.vbs,在vbs里你可以自己编写对数据的处理功能
8、导出数据可以实现包含文字 排除文字 文字截取 日期加几个月 数字比较大小过滤 前后追加字符