火车采集器(LocoySpider)是一款专业的互联网数据抓取、处理、分析,挖掘(功能强大的网络数据/信息挖掘)软件,通过灵活迅速地抓取网页上散乱分布的数据信息,进行一系列的分析处理,准确挖掘出所需数据。是目前国内最受欢迎的网页数据采集软件。
注:本软件要求电脑安装.NET4.0框架支持
火车采集器界面
火车采集器特色
十二年口碑
火车采集器目前用户突破十万,十二年间在用户中形成了良好口碑,为我们的品牌传播奠定了基础。
真正通用
采集不限网页,不限内容,支持多种扩展,打破操作局限。采什么,如何采,都由您决定!
高效稳定
分布式高速采集系统,多个大型服务端同时稳定运作,快速分解任务量,最大化提升效率。
性价比高
高性能的产品,搭配亲民的价格,“为客户节约成本,提升价值”是火车采集器的服务理念。
数据精准
内置采集监控系统,实时报错及时修复;采集发布时确保数据零遗漏,为用户呈现最精准的数据。
火车采集器功能特性
多线程高速并行采集系统
任务分配至多个客户端,同时运行采集,效率倍增。
多识别系统
配备正文识别、中文分词识别、任意编码识别等多种识别系统,智能识别操作更轻松。
可选验证方式
可选择是否使用加密狗,随时保障数据安全。
全自动运行
无需人工值守操作,任务完成后自动关机。
替换功能
同义,近义词替换、参数替换,伪原创必备技能。
任意文件格式下载
图片、压缩文件、视频等任意格式的文件都能轻松下载。
系统运行监控
监控数据质量,确保数据准确性。
支持多数据库
支持Access/MySQL/MsSQL/Sqlite/Oracle多种类型的数据库保存及发布。
无限级多页采集
支持包含ajax请求数据在内的多个页面信息的无限级采集。
支持扩展
支持接口和插件扩展,满足各种采发需求。
火车采集器免费版、旗舰版(机器码版)、旗舰版(自动授权版)、企业版(尊享版)和企业版(豪华版),大家可以根据自己的需求进行购买。
火车采集器更新日志
1: 自动获取cookie功能优化
2: 数据库发布增加事务,优化数据库发布速度
3: 数据转换速度优化(针对Mysql和SqlServer数据库的导入), 同时去除网址库的清空逻辑
4: html标签处理错误问题处理
5: json提取关于数字转换为科学计数法问题处理
6: 发布测试时,图片上传无效的问题处理
7: 采集内容页处理错误时,增加对于当前出错标签的提示,以便快速定位出错标签
8: 任务批量编辑,增加可操作范围
9: 循环匹配匹配空格问题处理
10: 刷新分组中增加统计数据的刷新
11: post分页处理
12: 部分功能逻辑优化