tomzx/html-parser

使用 PHP 编写的 HTML 解析器

v0.1.0 2016-01-24 13:58 UTC

This package is auto-updated.

Last update: 2024-09-10 07:45:19 UTC


README

License Latest Stable Version Latest Unstable Version Build Status Code Quality Code Coverage Total Downloads

使用 PHP 编写的 HTML 解析器。基于 nikic's PHP Parser

入门指南

HTML parser 的目标是使用访问者模式简化 HTML 树的遍历/修改。

首先,您需要使用 Parser 解析您的 HTML,以便生成适合 NodeTraverser 的数据结构。完成后,指定一个或多个实现要在 HTML 元素上应用的操作的访问者。然后,遍历 HTML 树结构,这将调用访问者在每个元素进入/退出时。最后,您可以将最终输出打印为字符串。

<?php

$code = file_get_contents('input.html');

$parser = new Parser();
$statements = $parser->parse($code);

$traverser = new NodeTraverser();
$traverser->addVisitor(new ElementStripper(['head', 'a'])); // A visitor which removes any element of a specific type

$statements = $traverser->traverse($statements);

$printer = new Printer();
$printer->output($statements);

许可证

代码采用 MIT 许可证。请参阅 LICENSE