panda843/tld-extract

TLDExtract,域名部分提取库,例如域名解析器

2.0.3 2022-06-04 08:11 UTC

This package is auto-updated.

Last update: 2024-09-04 13:03:28 UTC


README

TLDExtract 准确地分离了 gTLD 或 ccTLD(通用或国家代码顶级域)与 URL 的注册域名及其子域,例如域名解析器。例如,假设您只想获取 'http://www.google.com' 中的 'google' 部分。

Latest Version on Packagist Software License Build Status Coverage Status Total Downloads

每个人都做错了。 在 '.' 上分割并取最后两个元素的方法只适用于简单的示例,例如 .com 域名。以 http://forums.bbc.co.uk 为例:上述简单分割方法将 'co' 作为域名,'uk' 作为顶级域,而不是分别的 'bbc' 和 'co.uk'。

TLDExtract 另一方面,通过查找根据 公共后缀列表 正在运行的所有 gTLD 和 ccTLD 的外观,知道所有 gTLD 和 ccTLD 的外观。因此,给定一个 URL,它知道其子域来自其域名,其域名来自其国家代码。

$result = tld_extract('http://forums.news.cnn.com/');
var_dump($result);

object(LayerShifter\TLDExtract\Result)#34 (3) {
  ["subdomain":"LayerShifter\TLDExtract\Result":private]=>
  string(11) "forums.news"
  ["hostname":"LayerShifter\TLDExtract\Result":private]=>
  string(3) "cnn"
  ["suffix":"LayerShifter\TLDExtract\Result":private]=>
  string(3) "com"
}

Result 实现了 ArrayAccess 接口,因此您可以简单地访问其结果。

var_dump($result['subdomain']);
string(11) "forums.news"
var_dump($result['hostname']);
string(3) "cnn"
var_dump($result['suffix']);
string(3) "com"

您还可以轻松地将结果转换为 JSON。

var_dump($result->toJson());
string(54) "{"subdomain":"forums.news","hostname":"cnn","suffix":"com"}"

此包符合 PSR-1PSR-2PSR-4。如果您注意到合规性问题,请通过 pull request 发送补丁。

TLDExtract 会向公共后缀列表网站发出请求吗?

不。 TLDExtract 使用来自 TLDDatabase 的数据库,该数据库是从公共后缀列表生成的,并定期更新。它不会对解析或验证域名进行任何 HTTP 请求。

要求

以下版本的 PHP 支持。

  • PHP 5.5
  • PHP 5.6
  • PHP 7.0
  • PHP 7.1
  • PHP 7.2
  • PHP 7.3
  • HHVM

安装

通过 Composer

$ composer require layershifter/tld-extract

其他结果方法

LayerShifter\TLDExtract\Result 有一些可用的方法

$extract = new LayerShifter\TLDExtract\Extract();

# For domain 'shop.github.com'

$result = $extract->parse('shop.github.com');
$result->getFullHost(); // will return (string) 'shop.github.com'
$result->getRegistrableDomain(); // will return (string) 'github.com'
$result->isValidDomain(); // will return (bool) true
$result->isIp(); // will return (bool) false

# For IP '192.168.0.1'

$result = $extract->parse('192.168.0.1');
$result->getFullHost(); // will return (string) '192.168.0.1'
$result->getRegistrableDomain(); // will return null
$result->isValidDomain(); // will return (bool) false
$result->isIp(); // will return (bool) true

自定义数据库

默认情况下,包使用来自 TLDDatabase 包的数据库,但您可以轻松地覆盖此行为

new LayerShifter\TLDExtract\Extract(__DIR__ . '/cache/mydatabase.php');

有关更多详细信息以及如何保持数据库更新的信息,请参阅 TLDDatabase

实现自己的结果

默认情况下,解析后您将收到 LayerShifter\TLDExtract\Result 类的对象,但有时您可能需要自己的方法或额外的功能。

您可以创建自己的类,该类实现了 LayerShifter\TLDExtract\ResultInterface,并将其用作解析结果。

class CustomResult implements LayerShifter\TLDExtract\ResultInterface {}

new LayerShifter\TLDExtract\Extract(null, CustomResult::class);

解析模式

包具有三种解析模式

  • 允许 ICANN 后缀(域名是由 ICANN 委派或属于 IANA 根区域数据库的一部分的域名);
  • 允许私有域名(域名是域名持有者提交给公共后缀列表的修正案,作为其操作域名安全策略的表达);
  • 允许自定义(不在列表中但可用的域名,例如:example、mycompany 等)。

为了与公共后缀列表的概念保持兼容,包默认以所有这些模式运行,但您可以轻松地更改此行为

use LayerShifter\TLDExtract\Extract;

new Extract(null, null, Extract::MODE_ALLOW_ICANN);
new Extract(null, null, Extract::MODE_ALLOW_PRIVATE);
new Extract(null, null, Extract::MODE_ALLOW_NOT_EXISTING_SUFFIXES);
new Extract(null, null, Extract::MODE_ALLOW_ICANN | Extract::MODE_ALLOW_PRIVATE);

变更日志

请参阅 CHANGELOG 了解最近更改的详细信息。

测试

$ composer test

贡献

请参阅CONTRIBUTINGCONDUCT以获取详细信息。

许可证

此库在Apache 2.0许可证下发布。请参阅许可证文件获取更多信息。