hugsbrugs/php-robots-txt

该软件包最新版本(dev-master)没有可用的许可信息。

PHP Robots.txt 工具库

dev-master 2019-04-19 13:22 UTC

This package is auto-updated.

Last update: 2024-09-20 01:59:24 UTC


README

这个库提供了用于简化robots.txt操作的实用工具函数。如果你想检查URL是否遵守robots.txt策略(可选缓存),那么你真幸运 ;)

Build Status Coverage Status

安装

使用composer安装包

composer require hugsbrugs/php-robots-txt

在PHP代码中加载库

require_once __DIR__ . '/../vendor/autoload.php';
use Hug\Robots\Robots as Robots;

用法

返回页面是否遵守robots.txt策略可访问。可选地传递一个用户代理以检查UA策略。

Robots::is_allowed($url, $user_agent = null);

使用此简单方法,每次请求都会触发远程robots.txt的调用。要启用缓存,请定义以下变量

define('HUG_ROBOTS_CACHE_PATH', '/path/to/robots-cache/');
define('HUG_ROBOTS_CACHE_DURATION', 7*86400);

缓存时间(秒)(86400:1天)不要忘记使路径可由web服务器用户写入,robots.txt文件是gzip压缩的以节省磁盘空间

除非你想玩代码并对其进行调整,否则通常不需要以下方法!

Robots::download_robots($url, $user_agent);
Robots::get_robots($url, $user_agent);
Robots::is_cache_obsolete($file);
Robots::empty_cache();

单元测试

phpunit --bootstrap vendor/autoload.php tests

作者

Hugo Maugey 访问我的网站 ;)