详情介绍
善肯网页TXT采集器是一款来自我爱破解论坛大神出品的网页采集工具,该软件功能非常强大实用,它采用全新的正则表达式抓取下载内容,及时小说站点加密或者无法复制粘贴都可以成功采集,可下载、可实时预览、可文本替换,并可以将每个章节存为TXT文件,非常实用,有需要的朋友欢迎使用。
软件简介:
开发之初是为了看小说方便,个人喜欢下载到本地慢慢看,但是很多小说网站不支持下载,或者下载有限制【非VIP小说】,也在论坛里面找过一些采集器,但是个人觉得不太好用,输入正则表达式后,会出来章节,但是点击下载却并不能把文本下载下来,我做好这个软件后也继续测试过,同样的正则表达式,那些软件确实匹配不出内容,所以下载失败。也有可能是那些软件有些我不知道的规则,但是结果就是并不能完成我想要的下载。甚至不知道是规则的问题还是软件的问题又或者是网站设置原因……
所以我开发的这个软件就特地加了个预览功能,可以知道我到底能不能获取网页数据,我获取后能不能正确匹配出内容。
功能介绍:
1、规则设置:
①在规则设置窗口,在网站中随便找一篇文,不写任何规则,先点击实时预览,看看能不能获取网页源代码,能获取则再写规则,不能获取就没必要继续了。
②规则设置使用的是正则表达式匹配内容,有一定基础最好,没基础也可以参考给的范例,简单学习下,不需要深入学习正则。
③规则设置的时候,目录页和内容页需要分开预览,也就需要两个链接,一个目录页链接、一个内容页链接。
④关于替换,有通用替换和定制替换,这里目前不需要正则,普通替换就好,需要注意的是必须要输入值,空格也行。删除:选中整行,再按住delete键就行。内置\n再作为替换数据的时候代表换行。
⑤编码,目前只设置有GBK和UFT-8,差不多大多数网站就是这两种编码其中之一。
2、解析与下载
①解析请按解析地址2按钮,1按钮目前任性不想删,后面要开发其他功能,
②支持单章节下载和全文下载。
③支持添加章节数【有的小说没有章节数的时候就可以勾上】
④支持在线看,但是需要联网,此功能只是辅助,并非专业的看小说软件。
⑤下载进度和总需时间显示,内置多线程。
3、关于软件
①其实只要.exe就行,规则全是自己添加,commonrule.xml里面是通用替换规则。网站规则在rule文件夹下。我这边在里面放了两个网站的规则,主要是测试的时候是用的。其他网站规则,大家可以自己添加,或者支持开发者也行。
②软件没加壳,c#开发的,没放病毒。不放心请不要用,我不背锅。
③关于软件里面有个www.52pojie.cn跳转到论坛,我个人测试跳转的时候被360提示了,也有可能是因为跳转的是360浏览器,不知道你们会不会有这个问题。
④xml里面的内容,如果不清楚的话还是不要动它,免得软件识别失败报错。
⑤需要.net framework 4.5或者及以上版本框架支持,如果你电脑没有的话,需要下载安装,框架不大的。
4、其他
暂时没想到,后面想到再说。
最后,不管怎样,还是打滚求支持,不喜请勿喷。
这个是第一个版本,所以肯定存在我之前测试没有遇到的bug或者需要优化的问题,欢迎大家温柔的反馈哈。
理论上只要是目录页到内容页的形式的都可以使用,不限于小说。
下载地址
人气软件
相关文章
- excel中如何给表格添加背景? 给Excel表格加背景图的教程
excel表格想要插入背景图片,哦们直接的点击打开方式下的页面布局,然后找到背景选项来进行操作就可以了,详细请看下文介绍...
- word页码10以上显示1怎么办? word页码十几显示1的解决办法
在使用word文档时发现,设定好的页码9后面本应是10,却变成了1,下面我们就来解决word页码到10页为啥回到1了的解决办法...
- 谷歌浏览器点击书签怎么打开新标签页? chrome新标签页打开设置技巧
谷歌浏览器每次点击标签打开的都是上次浏览器的页面,想要打开新的标签页,该怎么设置呢?下面我们就来看看详细的教程...
- 火狐浏览器下载文件没反应怎么办? Firefox下载文件失败的解决办法
火狐浏览器下载文件的时候有时候会提示我们下载失败,那么这要怎么办?用户们可以点击设置选项下的隐私与安全选项通过设置解决这个问题...
- WPS如何将大标题都改成章节标题 WPS将所有大标题都改成章节标题的方法
WPS如何将大标题都改成章节标题?我们需要将已经设置的大标题内容进行选中,之后就可以进入到自定义章节标题的窗口中进行选择自己需要的一个章节标题类型进行添加了...
- WPS表格内容如何进行笔画排序 WPS表格内容进行笔画排序的方法
WPS表格内容如何进行笔画排序?我们可以进入到排序的窗口中,可以设置主要关键词或者是次要关键词进行拼音、数字、日期以及笔画等排序,并且可以选择升序或降序排序...
下载声明
☉ 解压密码:www.jb51.net 就是本站主域名,希望大家看清楚,[ 分享码的获取方法 ]可以参考这篇文章
☉ 推荐使用 [ 迅雷 ] 下载,使用 [ WinRAR v5 ] 以上版本解压本站软件。
☉ 如果这个软件总是不能下载的请在评论中留言,我们会尽快修复,谢谢!
☉ 下载本站资源,如果服务器暂不能下载请过一段时间重试!或者多试试几个下载地址
☉ 如果遇到什么问题,请评论留言,我们定会解决问题,谢谢大家支持!
☉ 本站提供的一些商业软件是供学习研究之用,如用于商业用途,请购买正版。
☉ 本站提供的善肯网页TXT采集器 V1.0 最新免费绿色版资源来源互联网,版权归该下载资源的合法拥有者所有。