showapp/tld-extract

TLDExtract,用于提取域名部分,例如域名解析器

dev-master 2023-02-17 11:36 UTC

This package is auto-updated.

Last update: 2024-09-17 15:03:49 UTC


README

可以考虑使用https://github.com/jeremykendall/php-domain-parser作为维护的替代方案。

TLDExtract

TLDExtract能够精确地将gTLD或ccTLD(通用或国家顶级域名)从URL的注册域名和子域名中分离出来,例如域名解析器。例如,假设您只想获取“google”部分,即http://www.google.com

Latest Version on Packagist Software License Build Status Coverage Status Total Downloads

每个人都会犯这个错误。通过“.”分割并取最后两个元素的方法,对于简单的例如.com域名来说可能走得很远。以http://forums.bbc.co.uk为例:上述简单分割方法将给出“co”作为域名,“uk”作为TLD,而不是“bbc”和“co.uk”。

TLDExtract另一方面,通过查阅Public Suffix List中当前活跃的所有gTLD和ccTLD,知道所有gTLD和ccTLD的样子。因此,给定一个URL,它知道其子域名来自其域名,其域名来自其国家代码。

$result = tld_extract('http://forums.news.cnn.com/');
var_dump($result);

object(LayerShifter\TLDExtract\Result)#34 (3) {
  ["subdomain":"LayerShifter\TLDExtract\Result":private]=>
  string(11) "forums.news"
  ["hostname":"LayerShifter\TLDExtract\Result":private]=>
  string(3) "cnn"
  ["suffix":"LayerShifter\TLDExtract\Result":private]=>
  string(3) "com"
}

Result实现了ArrayAccess接口,因此您可以简单地访问其结果。

var_dump($result['subdomain']);
string(11) "forums.news"
var_dump($result['hostname']);
string(3) "cnn"
var_dump($result['suffix']);
string(3) "com"

您还可以简单地将其结果转换为JSON。

var_dump($result->toJson());
string(54) "{"subdomain":"forums.news","hostname":"cnn","suffix":"com"}"

此包符合PSR-1PSR-2PSR-4。如果您发现合规性疏忽,请通过pull request发送补丁。

TLDExtract会向Public Suffix List网站发起请求吗?

不会。 TLDExtract使用由TLDDatabase生成的数据库,该数据库来自Public Suffix List并定期更新。它不会对解析或验证域名进行任何HTTP请求。

需求

以下版本的PHP受到支持。

  • PHP 5.5
  • PHP 5.6
  • PHP 7.0
  • PHP 7.1
  • PHP 7.2
  • PHP 7.3
  • HHVM

安装

通过Composer

$ composer require layershifter/tld-extract

额外的结果方法

LayerShifter\TLDExtract\Result有一些可用的方法

$extract = new LayerShifter\TLDExtract\Extract();

# For domain 'shop.github.com'

$result = $extract->parse('shop.github.com');
$result->getFullHost(); // will return (string) 'shop.github.com'
$result->getRegistrableDomain(); // will return (string) 'github.com'
$result->isValidDomain(); // will return (bool) true
$result->isIp(); // will return (bool) false

# For IP '192.168.0.1'

$result = $extract->parse('192.168.0.1');
$result->getFullHost(); // will return (string) '192.168.0.1'
$result->getRegistrableDomain(); // will return null
$result->isValidDomain(); // will return (bool) false
$result->isIp(); // will return (bool) true

自定义数据库

默认情况下,包使用来自TLDDatabase包的数据库,但您可以简单地覆盖此行为

new LayerShifter\TLDExtract\Extract(__DIR__ . '/cache/mydatabase.php');

有关更多详细信息以及如何保持数据库更新的信息,请参阅TLDDatabase

实现自己的结果

默认情况下,解析后您将收到LayerShifter\TLDExtract\Result类的对象,但有时您需要自己的方法或额外的功能。

您可以创建自己的类,该类实现了LayerShifter\TLDExtract\ResultInterface,并将其用作解析结果。

class CustomResult implements LayerShifter\TLDExtract\ResultInterface {}

new LayerShifter\TLDExtract\Extract(null, CustomResult::class);

解析模式

包有三种解析模式

  • 允许ICANN后缀(域名是由ICANN委派的或IANA根区数据库的一部分);
  • 允许私有域名(域名是域名持有人提交给Public Suffix List的修正案,作为他们表达其域名安全策略的方式);
  • 允许自定义(不在列表中,但可以使用的域名,例如:example、mycompany等)。

为了保持与公共后缀列表想法的兼容性,默认情况下软件包在这些模式下运行,但您可以轻松地更改此行为

use LayerShifter\TLDExtract\Extract;

new Extract(null, null, Extract::MODE_ALLOW_ICANN);
new Extract(null, null, Extract::MODE_ALLOW_PRIVATE);
new Extract(null, null, Extract::MODE_ALLOW_NOT_EXISTING_SUFFIXES);
new Extract(null, null, Extract::MODE_ALLOW_ICANN | Extract::MODE_ALLOW_PRIVATE);

变更日志

有关最近更改的更多信息,请参阅变更日志

测试

$ composer test

贡献

有关详细信息,请参阅贡献指南行为准则

许可证

此库在Apache 2.0许可证下发布。有关更多信息,请参阅许可证文件