
蜜蜂采集器 v1.6.2401.26854 更新版
软件简介
蜜蜂采集器2024最新版是一款功能强大的数据采集软件,用户可以轻松地从网页上提取各种数据。软件界面简洁易用,支持自动化数据采集和整理,能够高效地完成各种文件的下载与传输,并支持多种数据格式的采集和管理,用户还可以将文章内容保存到本地。
如何使用蜜蜂采集器2024最新版
操作蜜蜂采集器非常简单,按照以下步骤即可开始使用:
1. 打开软件并进入主界面;
2. 在主界面顶部的工具栏中点击“新建任务”按钮,创建一个新的采集任务;
3. 在任务设置界面中输入网页地址,配置数据提取规则以及其他相关参数;
4. 设置完成后,点击“开始采集”按钮,蜜蜂采集器将根据设定的规则自动抓取网页数据;
5. 数据采集完成后,用户可以选择将数据保存至本地或上传至云空间,便于后续处理和分析。
蜜蜂采集器2024最新版的主要功能
资源占用低,性能优秀,稳定性强
蜜蜂采集器采用QT构建,使用原生C++编写,程序占用资源极少,运行速度非常快,能够支持更多并发任务。
多样的管理器,安全的账号管理
软件提供四种类型的管理器:基本管理器、采集管理器、发布管理器和其他管理器。
基本管理器负责账号相关的管理任务,所有数据都经过加密存储,支持管理Cookie、User-Agent、数据库连接、FTP、SSH、SMTP邮箱、代理服务器等信息。
采集管理器专注于采集任务的管理,支持配置列表页网址插件、数据处理插件、图片水印管理、中文分词、同义词库等功能。
发布管理器则用于数据发布,支持将数据发布到站点、数据库、文件或插件,支持通过邮箱和消息通知功能进行数据发布。
其他管理器则处理任务执行的统计与日志,包括任务运行管理、计划任务和运行日志。
强大的灵活性
支持数据库连接和SSH隧道模式。
支持代理功能,便于数据采集。
支持多账户同时进行采集和发布。
提供多种插件支持,包括PHP、Python、Nodejs和Go四种编程语言的插件。
强大的图片水印功能。
文件下载支持断点续传。
丰富的文件上传方式,包括FTP、SFTP、插件上传以及站点发布模块的上传,支持将文件上传到阿里云OSS、腾讯云和七牛云,FTP上传还支持断点续传。
内置多种小工具,如JSON分析工具和表单抓取工具等。
所有管理器都支持导入和导出功能。
蜜蜂采集器2024最新版的推荐功能
支持数据库连接并能够通过SSH隧道模式进行访问。
支持代理配置,使得采集过程更加便捷。
支持多个账号进行同时采集和发布。
插件类型丰富,支持PHP、Python、Nodejs、Go四种编程语言。
强大的图片水印处理功能。
文件下载支持断点续传,确保下载不中断。
多种文件上传方式,包括FTP、SFTP和插件方式,并且支持云存储服务如阿里云、腾讯云和七牛云,FTP上传还支持断点续传。
内置实用小工具,如JSON分析工具、表单抓取工具等。
所有管理器均提供导入导出的功能。
蜜蜂采集器2024最新版的详细功能
1. 内置运行环境:软件提供了内置的运行环境,用户可以直接在软件中运行和调试采集脚本,这样可以快速验证采集规则,并调整采集策略,提升效率。
2. 支持多种文件上传方式:软件支持FTP、SFTP以及自定义插件的方式进行文件上传,方便用户将采集的数据上传到不同的云存储或其他设备进行备份与共享。
3. 图片水印功能:蜜蜂采集器内置了图片水印功能,用户可以自定义水印样式、位置、透明度等参数,为采集的图片添加水印,保护数据版权并增强数据可信度。
蜜蜂采集器2024最新版更新日志
更新内容:
1. 优化:默认字体大小由14改为13。
2. 新增:批量访问网址功能。
3. 新增:采集规则支持Excel文件源(xlsx)格式。
4. 新增:采集规则支持发布数据到Excel文件(xlsx)格式。
5. 新增:站点发布配置增加标签映射功能。
6. 新增:采集规则支持域名替换功能,支持历史数据和当前规则的域名替换。
7. 新增:标签数据二次处理增加字符串截取的循环截取功能。
8. 新增:标签数据二次处理增加HTTP请求的多次请求与拼接输出功能。
9. 新增:支持在网址采集时使用标签数据二次处理插件,之前仅内容采集支持插件。
10. 新增:文件下载时支持将标签内容作为多个文件下载地址。
11. 新增:支持音视频文件下载功能。
12. 新增:标签数据二次处理增加JSON转义和分隔符转义功能。
13. 新增:标签数据二次处理增加HTML标签过滤功能,支持noscript、audio、video、source等标签。
14. 修复:独立上传时文件上传功能失效的BUG。
15. 修复:修复POST采集时Content-Type识别错误的BUG。
16. 修复:解决Python插件中文乱码问题。
17. 修复:修复内置JavaScript脚本调用崩溃的BUG。
18. 优化:其他若干功能优化及BUG修复。