cristopherm / simple-scraper
PHP中用于HTML页面的简单爬虫
dev-main
2021-02-21 11:32 UTC
Requires
- php: ~7.2
- guzzlehttp/guzzle: >=6.3
Requires (Dev)
- phpunit/phpunit: >=8.0
- squizlabs/php_codesniffer: ^3.0
This package is not auto-updated.
Last update: 2024-09-30 11:35:56 UTC
README
PHP中的简单HTML爬虫。
安装
通过Composer
$ composer require cristopherm/simple-scraper
使用方法
parse方法将返回一个具有以下属性的object
- 标题
- 标签
- 描述
- 内容
您可以使用raw HTML字符串或URL,分别使用方法 loadString() 和 loadUrl()。
示例
use Cristopherm\SimpleScraper\HtmlParser;
$file = new HtmlParser();
$result = $file
->loadString($rawFile)
->idsForCleaning(['some-id', 'another-id'])
->parse();
测试
$ composer test
贡献
请参阅 CONTRIBUTING 和 CODE_OF_CONDUCT 以获取详细信息。
安全
如果您发现任何安全相关的问题,请通过电子邮件 cristopher.martins@gmail.com 而不是使用问题跟踪器。
鸣谢
许可
MIT许可(MIT)。有关更多信息,请参阅 许可文件。