tomzx / html-parser
使用 PHP 编写的 HTML 解析器
v0.1.0
2016-01-24 13:58 UTC
Requires
- php: >=5.4.0
- tomzx/abstract-parser: ~0.1
Requires (Dev)
- phpunit/phpunit: ~4
This package is auto-updated.
Last update: 2024-09-10 07:45:19 UTC
README
使用 PHP 编写的 HTML 解析器。基于 nikic's PHP Parser。
入门指南
HTML parser
的目标是使用访问者模式简化 HTML 树的遍历/修改。
首先,您需要使用 Parser
解析您的 HTML,以便生成适合 NodeTraverser
的数据结构。完成后,指定一个或多个实现要在 HTML 元素上应用的操作的访问者。然后,遍历 HTML 树结构,这将调用访问者在每个元素进入/退出时。最后,您可以将最终输出打印为字符串。
<?php $code = file_get_contents('input.html'); $parser = new Parser(); $statements = $parser->parse($code); $traverser = new NodeTraverser(); $traverser->addVisitor(new ElementStripper(['head', 'a'])); // A visitor which removes any element of a specific type $statements = $traverser->traverse($statements); $printer = new Printer(); $printer->output($statements);