crwlr / robots-txt
网络爬取/抓取的Robots Exclusion Standard/Protocol解析器
v1.1.1
2022-11-08 12:25 UTC
Requires
- php: ^8.0
- crwlr/url: ^1.0|^2.0
Requires (Dev)
- friendsofphp/php-cs-fixer: ^3.0
- mockery/mockery: ^1.4
- phpstan/phpstan: ^1.1
- phpunit/phpunit: ^9.0
- sempro/phpunit-pretty-print: ^1.4
README
Robots Exclusion Standard/Protocol解析器
用于网络爬取/抓取
在爬虫/抓取程序中使用此库来解析robots.txt文件,并检查您的爬虫用户代理是否允许加载某些路径。
文档
您可以在crwlr.software找到文档。
贡献
如果您考虑为此包贡献一些内容,请阅读贡献指南(CONTRIBUTING.md)。