cristopherm/simple-scraper

PHP中用于HTML页面的简单爬虫

dev-main 2021-02-21 11:32 UTC

This package is not auto-updated.

Last update: 2024-09-30 11:35:56 UTC


README

PHP中的简单HTML爬虫。

安装

通过Composer

$ composer require cristopherm/simple-scraper

使用方法

parse方法将返回一个具有以下属性的object

  • 标题
  • 标签
  • 描述
  • 内容

您可以使用raw HTML字符串或URL,分别使用方法 loadString()loadUrl()

示例

use Cristopherm\SimpleScraper\HtmlParser;

$file = new HtmlParser();

$result = $file
    ->loadString($rawFile)
    ->idsForCleaning(['some-id', 'another-id'])
    ->parse();

测试

$ composer test

贡献

请参阅 CONTRIBUTINGCODE_OF_CONDUCT 以获取详细信息。

安全

如果您发现任何安全相关的问题,请通过电子邮件 cristopher.martins@gmail.com 而不是使用问题跟踪器。

鸣谢

许可

MIT许可(MIT)。有关更多信息,请参阅 许可文件