fizzka / extractor
HTML 解析器
0.3.5
2019-03-13 22:38 UTC
Requires
- php: >=5.2
Requires (Dev)
README
基于 SimpleXML & nokogiri XpathSubquery.php 的 HTML 提取库
优点
- 简单
- 代码量少
- 快速
- 查询结果为
SimpleXMLElement
实例 - 支持嵌套 CSS/Xpath 查询
安装
#Using packagist: composer require 'fizzka/extractor'
基本用法
<?php require_once 'vendor/autoload.php'; $html = gzdecode(file_get_contents('http://habrahabr.ru/')); $ex = Extractor::fromHtml($html); var_dump($ex->get('a.habracut'));
高级用法
echo $ex->cssPathFirst('div.post')->xpathFirst('.//@href'); foreach ($ex->cssPath('div.post') as $post) { var_dump($post->cssPathFirst('a.post_title')); }
测试
只需从项目顶部运行 phpunit
贡献
欢迎使用并贡献 ;)
许可
MIT