当前位置:首页 > 软件下载 > 编程开发

htmlparser.jarv1.6官方版

点此纠错

  • 平台:WinAll
  • 大小:4.2M
  • 语言:简体
  • 类别:编程开发
  • 授权:免费软件
  • 更新:2017-07-07
5.0
0% 0%

情介绍


htmlparser.jar是Java开发项目中非常常用的htmlparser.jar包。下载htmlparser可以让你的Java项目开发更加顺利。合理使用htmlparser框架可以让你的工作更加顺利。









htmlparser.jar是Java开发项目中非常常用的htmlparser.jar包。下载htmlparser可以让你的Java项目开发更加顺利。正确使用htmlparser框架可以让你的工作更加顺利。



htmlparser.jar



基本介绍



htmlparser是一个用纯Java编写的用于解析HTML(标准通用标记语言下的应用程序)的库。它不依赖于其他Java库文件,主要用于转换或提取HTML。 htmlparser是一个用纯Java编写的用于解析HTML(标准通用标记语言下的应用程序)的库。它不依赖于其他Java库文件,主要用于转换或提取HTML。它可以超高速解析html,不会出现错误。毫不夸张地说,htmlparser是目前最好的html解析分析工具。无论你是想爬取网页数据还是转换html内容,使用htmlparser一定会受到好评。



特征



1.信息提取



文本信息提取,例如HTML中的有效信息搜索;



链接提取用于自动为页面的链接文本添加链接标签;



资源提取,比如对一些图片、声音资源的处理;



链接检查,用于检查HTML中的链接是否有效;



监控页面内容。



2、信息转换



链接重写,用于修改页面中的所有超链接;



网页内容复制,用于将网页内容保存到本地;



内容检查可以用来过滤掉网页上一些不愉快的文字;



HTML信息清理,将原本杂乱的HTML信息格式化;



转换为XML 格式数据。



常用代码



stringhtmlcode='HTMLHEADTITLEAAA/TITLE/HEADBODY'+.+'/BODY/HTML';



Parserparser=Parser.CreateParser(htmlcode,'GBK');



HtmlPagepage=newHtmlPage(解析器);



尝试



{parser.VisitAllNodesWith(页面);}



捕获(解析器异常1)



{e1=空;}



NodeListnodelist=page.Body;



NodeFilterfilter=newTagNameFilter('A');



nodelist=nodelist.ExtractAllNodesThatMatch(filter,true);



for(inti=0;inodelist.Size();i++)



{



LinkTaglink=(LinkTag)nodelist.ElementAt(i);



System.Console.Write(link.GetAttribute('href')+'\n');



}