html5/htmlreader

Html5 流标记符/读取器(不使用libxml)

v2.0.1 2017-11-14 11:36 UTC

This package is auto-updated.

Last update: 2024-09-06 09:14:12 UTC


README

Downloads this Month Latest Stable Version

HTMLReader

HtmlReader是一个非常简单的Html解析器,不是基于libxml构建的。它被认为是XMLReader的替代品,后者无法正确解析html5输入数据。它比DOM更快,并且不会改变任何空格。

它不会关心正确关闭的元素等,所以你可以/必须自己处理。

安装

使用Composer从Packagist.com安装包

composer require html5/htmlreader

使用方法

$reader = new HtmlReader();
$reader->loadHtml("input.html")
// $reader->loadHtmlString("<html></html>");

$reader->setHandler(new HtmlCallback()); // <-- Write your own HtmlCallback
$reader->parse();

调试

我们打包了一个DebugHtmlCallback处理程序。

版本1.1.0的新功能

  • 添加了对命名空间的支持

致谢

由Matthias Leuffen编写 http://leuffen.de