详情介绍
简数采集器助手是一款数据采集工具,是新一代的网站文章采集和发布平台,它完全在线配置和使用云采集,功能强大,操作简单,配置快捷高效。
软件特色
简数不仅提供网页文章采集、数据批量修改、定时采集、定时定量自动发布等基本功能,还集成强大的seo工具,并创新实现了规则智能提取引擎、书签一键采集发布等特色功能,大幅提升了采集配置和发布效率。
采集简单,发布更轻松:支持一键发布到WorpPress、帝国、织梦、Z-Blog、Discuz、Destoon等CMS网站系统,还可以发布到自定义Http接口。
另外还支持特定文章的“一键快速采集”,包括:微信公众号文章、今日头条、新闻泛采集、淘宝联盟商品。
如果杀毒软件误报毒,请参阅安装文件夹中的报毒说明,添加白名单放心放行即可。
使用方法
采集步骤第一步:创建采集任务
点击左侧菜单按钮“创建采集任务”,输入采集任务名和要采集的”列表页“网址,如:https://www.cnblogs.com/ (这里首页即作为列表页:内容含有多个详情页即可),详情页链接可不填,系统会自动识别。
如下图:
输入后点击 ”下一步“
第二步:完善列表页的智能抽取结果(可选)
系统会先采用智能算法获取需要采集的详情页链接(多个),用户可以双击打开检查,如果不是想要数据,可以点击“列表提取器”进行手动指定,只需要在可视化界面上用鼠标点击。
智能获取结果如下图:
另外:上面结果中,系统也智能发现了翻页规则,用户可以设置要采集多少页。也可以稍后在任务中的“基本信息&入口网址”--》“按规则生成网址”项中进行配置。
列表提取器 打开后如下图:
第三步:完善详情页的智能抽取结果(可选)
上一步获取了多个详情页链接后,继续下一步,系统会使用其中一个详情页链接来智能抽取详情页数据(如:标题,作者,发布日期,内容,标签等)
详情页智能抽取结果如下:
如果智能抽取的内容非想要的,那么可以打开"详情提取器"进行修改。
如下图:
可以在左侧对各字段进行修改或增加删除等。
还可以对每个字段进行详细设置或数据处理(双击字段即可):替换,提取,过滤,设置默认值等等,
如下图:
第四步:启动运行
完成后,即可启动运行,进行数据采集了:
下载地址
人气软件
相关文章
- WPS如何设置从图片获取文字 WPS设置从图片获取文字的方法
WPS如何设置从图片获取文字?那么我们可以将工具栏中的获取数据功能打开,将其中的自图片导入文字选项点击打开,就可以从本地中找到需要进行提取文字的图片,将其导入进行...
- Word如何更改每页固定行数 Word更改每页固定行数的方法
Word如何更改每页固定行数?其实我们只需要在Word程序的文字文档页面中点击打开布局工具,然后找到并打开页面设置弹框,接着在我们文档网格页面中找到行数设置,在该设置下...
- Word如何设置行号与正文距离 Word设置行号与正文距离的方法
Word如何设置行号与正文距离?其实我们只需要点击打开Word中的行号工具,然后在下拉列表中打开行编号选项,接着在弹框中打开行号选项,再在行号弹框中点击勾选“添加行号”...
- Excel如何一键清除所有下拉选项 Excel一键清除所有下拉选项的方法
Excel如何一键清除所有下拉选项?其实我们只需要选中表格文档中的所有表格,然后在工具栏中找到“数据”工具,点击打开该工具,接着在其子工具栏中找到并打开“数据验证”...
- Excel如何自定义打印缩放比例 Excel自定义打印缩放比例的方法
Excel如何自定义打印缩放比例?其实我们只需要进入Excel的表格文档打印设置页面,然后在该页面中找到“无缩放”选项,打开该选项,再在菜单列表中点击打开“自定义缩放选项...
- VMware Workstation Pro 17.5.2 解决NAT服务CPU高温和占用过高的问题(含下载)
VMware Workstation 17是一款功能非常强大的虚拟机,但有网友发现更新VMware Workstation Pro 17,NAT服务一直处于开启状态,导致占用cpu大量资源和高温,怎么解决呢?下面...
下载声明
☉ 解压密码:www.jb51.net 就是本站主域名,希望大家看清楚,[ 分享码的获取方法 ]可以参考这篇文章
☉ 推荐使用 [ 迅雷 ] 下载,使用 [ WinRAR v5 ] 以上版本解压本站软件。
☉ 如果这个软件总是不能下载的请在评论中留言,我们会尽快修复,谢谢!
☉ 下载本站资源,如果服务器暂不能下载请过一段时间重试!或者多试试几个下载地址
☉ 如果遇到什么问题,请评论留言,我们定会解决问题,谢谢大家支持!
☉ 本站提供的一些商业软件是供学习研究之用,如用于商业用途,请购买正版。
☉ 本站提供的简数采集器助手 vT20.V2 安装版资源来源互联网,版权归该下载资源的合法拥有者所有。