fizzka/extractor

HTML 解析器

0.3.5 2019-03-13 22:38 UTC

This package is auto-updated.

Last update: 2024-09-14 10:28:30 UTC


README

基于 SimpleXML & nokogiri XpathSubquery.php 的 HTML 提取库

Latest Stable Version Build Status Coveralls

优点

  • 简单
  • 代码量少
  • 快速
  • 查询结果为 SimpleXMLElement 实例
  • 支持嵌套 CSS/Xpath 查询

安装

#Using packagist:
composer require 'fizzka/extractor'

基本用法

<?php
require_once 'vendor/autoload.php';

$html = gzdecode(file_get_contents('http://habrahabr.ru/'));

$ex = Extractor::fromHtml($html);
var_dump($ex->get('a.habracut'));

高级用法

echo $ex->cssPathFirst('div.post')->xpathFirst('.//@href');

foreach ($ex->cssPath('div.post') as $post) {
	var_dump($post->cssPathFirst('a.post_title'));
}

测试

只需从项目顶部运行 phpunit

贡献

欢迎使用并贡献 ;)

许可

MIT