详情介绍
htmlparser.jar是一款好用的用于java开发项目研发的htmlparser.jar包,下载htmlparser可以让您的Java项目开发变得更加顺畅,合理的使用htmlparser框架可以让您的工作更加顺畅,感兴趣的朋友不要错过了。
基本简介
htmlparser是一个纯的java写的html(标准通用标记语言下的一个应用)解析的库,它不依赖于其它的java库文件,主要用于改造或提取html。htmlparser是一个纯的java写的html(标准通用标记语言下的一个应用)解析的库,它不依赖于其它的java库文件,主要用于改造或提取html。它能超高速解析html,而且不会出错。毫不夸张地说,htmlparser就是目前最好的html解析和分析的工具。无论你是想抓取网页数据还是改造html的内容,用了htmlparser绝对会忍不住称赞。
功能介绍
1、信息提取
文本信息抽取,例如对HTML进行有效信息搜索;
链接提取,用于自动给页面的链接文本加上链接的标签;
资源提取,例如对一些图片、声音的资源的处理;
链接检查,用于检查HTML中的链接是否有效;
页面内容的监控。
2、信息转换
链接重写,用于修改页面中的所有超链接;
网页内容拷贝,用于将网页内容保存到本地;
内容检验,可以用来过滤网页上一些令人不愉快的字词;
HTML信息清洗,把本来乱七八糟的HTML信息格式化;
转成XML格式数据。
常用代码
stringhtmlcode="<HTML><HEAD><TITLE>AAA</TITLE></HEAD><BODY>"+......+"</BODY></HTML>";
Parserparser=Parser.CreateParser(htmlcode,"GBK");
HtmlPagepage=newHtmlPage(parser);
try
{parser.VisitAllNodesWith(page);}
catch(ParserExceptione1)
{e1=null;}
NodeListnodelist=page.Body;
NodeFilterfilter=newTagNameFilter("A");
nodelist=nodelist.ExtractAllNodesThatMatch(filter,true);
for(inti=0;i<nodelist.Size();i++)
{
LinkTaglink=(LinkTag)nodelist.ElementAt(i);
System.Console.Write(link.GetAttribute("href")+"\n");
}
下载地址
人气软件
相关文章
- excel中如何给表格添加背景? 给Excel表格加背景图的教程
excel表格想要插入背景图片,哦们直接的点击打开方式下的页面布局,然后找到背景选项来进行操作就可以了,详细请看下文介绍...
- word页码10以上显示1怎么办? word页码十几显示1的解决办法
在使用word文档时发现,设定好的页码9后面本应是10,却变成了1,下面我们就来解决word页码到10页为啥回到1了的解决办法...
- 谷歌浏览器点击书签怎么打开新标签页? chrome新标签页打开设置技巧
谷歌浏览器每次点击标签打开的都是上次浏览器的页面,想要打开新的标签页,该怎么设置呢?下面我们就来看看详细的教程...
- 火狐浏览器下载文件没反应怎么办? Firefox下载文件失败的解决办法
火狐浏览器下载文件的时候有时候会提示我们下载失败,那么这要怎么办?用户们可以点击设置选项下的隐私与安全选项通过设置解决这个问题...
- WPS如何将大标题都改成章节标题 WPS将所有大标题都改成章节标题的方法
WPS如何将大标题都改成章节标题?我们需要将已经设置的大标题内容进行选中,之后就可以进入到自定义章节标题的窗口中进行选择自己需要的一个章节标题类型进行添加了...
- WPS表格内容如何进行笔画排序 WPS表格内容进行笔画排序的方法
WPS表格内容如何进行笔画排序?我们可以进入到排序的窗口中,可以设置主要关键词或者是次要关键词进行拼音、数字、日期以及笔画等排序,并且可以选择升序或降序排序...
下载声明
☉ 解压密码:www.jb51.net 就是本站主域名,希望大家看清楚,[ 分享码的获取方法 ]可以参考这篇文章
☉ 推荐使用 [ 迅雷 ] 下载,使用 [ WinRAR v5 ] 以上版本解压本站软件。
☉ 如果这个软件总是不能下载的请在评论中留言,我们会尽快修复,谢谢!
☉ 下载本站资源,如果服务器暂不能下载请过一段时间重试!或者多试试几个下载地址
☉ 如果遇到什么问题,请评论留言,我们定会解决问题,谢谢大家支持!
☉ 本站提供的一些商业软件是供学习研究之用,如用于商业用途,请购买正版。
☉ 本站提供的htmlparser.jar v1.6 官方免费版资源来源互联网,版权归该下载资源的合法拥有者所有。