最新推荐
-
齐鲁银行网银助手3.0.0.5官方版 安全软件 / 3.0M
-
360安全卫士U盘病毒专杀(Autorun.inf专杀)13.0.0.213简体中文绿色免费版 安全软件 / 86.1M
-
360安全卫士U盘病毒专杀工具v13.0.0.213绿色免费版 安全软件 / 86.1M
-
360安全卫士修复工具v13.0.0.213免费版 安全软件 / 86.1M
-
360安全卫士超强查杀V13.0.0.213安装版 安全软件 / 86.1M
精品推荐
-
WeeeCode(图形化编程软件)v3.6.2官方版 编程开发 / 429.1M
查看 -
核桃编程v2.1.123.0官方版 编程开发 / 272.5M
查看 -
DevToys(开发工具)v1.0.11.0官方版 编程开发 / 156M
查看 -
吾爱OD(附118款脱壳脚本)v1.10中文版(32/64位) 编程开发 / 15.5M
查看 -
360加固助手v3.6.1.0官网版 编程开发 / 271.5M
查看
本类排行
详情介绍
htmlparser.jar是Java开发项目中非常常用的htmlparser.jar包。下载htmlparser可以让你的Java项目开发更加顺利。合理使用htmlparser框架可以让你的工作更加顺利。
htmlparser.jar是Java开发项目中非常常用的htmlparser.jar包。下载htmlparser可以让你的Java项目开发更加顺利。正确使用htmlparser框架可以让你的工作更加顺利。
基本介绍
htmlparser是一个用纯Java编写的用于解析HTML(标准通用标记语言下的应用程序)的库。它不依赖于其他Java库文件,主要用于转换或提取HTML。 htmlparser是一个用纯Java编写的用于解析HTML(标准通用标记语言下的应用程序)的库。它不依赖于其他Java库文件,主要用于转换或提取HTML。它可以超高速解析html,不会出现错误。毫不夸张地说,htmlparser是目前最好的html解析分析工具。无论你是想爬取网页数据还是转换html内容,使用htmlparser一定会受到好评。
特征
1.信息提取
文本信息提取,例如HTML中的有效信息搜索;
链接提取用于自动为页面的链接文本添加链接标签;
资源提取,比如对一些图片、声音资源的处理;
链接检查,用于检查HTML中的链接是否有效;
监控页面内容。
2、信息转换
链接重写,用于修改页面中的所有超链接;
网页内容复制,用于将网页内容保存到本地;
内容检查可以用来过滤掉网页上一些不愉快的文字;
HTML信息清理,将原本杂乱的HTML信息格式化;
转换为XML 格式数据。
常用代码
stringhtmlcode='HTMLHEADTITLEAAA/TITLE/HEADBODY'+.+'/BODY/HTML';
Parserparser=Parser.CreateParser(htmlcode,'GBK');
HtmlPagepage=newHtmlPage(解析器);
尝试
{parser.VisitAllNodesWith(页面);}
捕获(解析器异常1)
{e1=空;}
NodeListnodelist=page.Body;
NodeFilterfilter=newTagNameFilter('A');
nodelist=nodelist.ExtractAllNodesThatMatch(filter,true);
for(inti=0;inodelist.Size();i++)
{
LinkTaglink=(LinkTag)nodelist.ElementAt(i);
System.Console.Write(link.GetAttribute('href')+'\n');
}