drom/tld-extract

TLDExtract,用于提取域名部分,例如域名解析器

2.0.1 2023-12-27 09:05 UTC

This package is auto-updated.

Last update: 2024-09-27 10:45:34 UTC


README

可以考虑使用https://github.com/jeremykendall/php-domain-parser作为维护的替代方案。

TLDExtract

TLDExtract能够准确地将gTLD或ccTLD(通用或国家代码顶级域)从URL的注册域名和子域名中分离出来,例如域名解析器。例如,假设你只想获取“http://www.google.com”中的“google”部分。

Latest Version on Packagist Software License Build Status Coverage Status Total Downloads

每个人都会做错。在“.”上分割并取最后两个元素的方法,只有在考虑简单的例如.com域名时才会走得很远。例如,考虑解析http://forums.bbc.co.uk:上述天真分割方法将给出“co”作为域名和“uk”作为TLD,而不是“bbc”和“co.uk”。

另一方面,TLDExtract通过查找根据公共后缀列表当前存在的所有gTLD和ccTLD来确定它们的外观。因此,给定一个URL,它知道其子域名、域名以及国家代码。

$result = tld_extract('http://forums.news.cnn.com/');
var_dump($result);

object(LayerShifter\TLDExtract\Result)#34 (3) {
  ["subdomain":"LayerShifter\TLDExtract\Result":private]=>
  string(11) "forums.news"
  ["hostname":"LayerShifter\TLDExtract\Result":private]=>
  string(3) "cnn"
  ["suffix":"LayerShifter\TLDExtract\Result":private]=>
  string(3) "com"
}

Result实现了ArrayAccess接口,因此您可以简单访问其结果。

var_dump($result['subdomain']);
string(11) "forums.news"
var_dump($result['hostname']);
string(3) "cnn"
var_dump($result['suffix']);
string(3) "com"

您还可以直接将结果转换为JSON。

var_dump($result->toJson());
string(54) "{"subdomain":"forums.news","hostname":"cnn","suffix":"com"}"

本软件包符合PSR-1PSR-2PSR-4规范。如果您发现符合规范上的疏漏,请通过pull request发送补丁。

TLDExtract会对公共后缀列表网站进行请求吗?

不。 TLDExtract使用从TLDDatabase生成的数据库,该数据库由公共后缀列表生成并定期更新。它不会对解析或验证域名进行任何HTTP请求。

要求

以下版本的PHP受支持。

  • PHP 5.5
  • PHP 5.6
  • PHP 7.0
  • PHP 7.1
  • PHP 7.2
  • PHP 7.3
  • HHVM

安装

通过Composer

$ composer require layershifter/tld-extract

额外的结果方法

LayerShifter\TLDExtract\Result有一些可用的方法

$extract = new LayerShifter\TLDExtract\Extract();

# For domain 'shop.github.com'

$result = $extract->parse('shop.github.com');
$result->getFullHost(); // will return (string) 'shop.github.com'
$result->getRegistrableDomain(); // will return (string) 'github.com'
$result->isValidDomain(); // will return (bool) true
$result->isIp(); // will return (bool) false

# For IP '192.168.0.1'

$result = $extract->parse('192.168.0.1');
$result->getFullHost(); // will return (string) '192.168.0.1'
$result->getRegistrableDomain(); // will return null
$result->isValidDomain(); // will return (bool) false
$result->isIp(); // will return (bool) true

自定义数据库

默认情况下,软件包使用TLDDatabase软件包中的数据库,但您可以轻松覆盖此行为

new LayerShifter\TLDExtract\Extract(__DIR__ . '/cache/mydatabase.php');

有关更多详细信息以及如何保持数据库更新的信息,请参阅TLDDatabase

实现自己的结果

默认情况下,解析后您将接收到LayerShifter\TLDExtract\Result类的对象,但有时您可能需要自己的方法或额外的功能。

您可以创建一个实现了LayerShifter\TLDExtract\ResultInterface的自己的类,并将其用作解析结果。

class CustomResult implements LayerShifter\TLDExtract\ResultInterface {}

new LayerShifter\TLDExtract\Extract(null, CustomResult::class);

解析模式

软件包具有三种解析模式

  • 允许ICANN后缀(域名是由ICANN委派或属于IANA根区数据库的一部分的域名);
  • 允许私有域名(域名是由域名持有者提交给公共后缀列表的修订版,作为其如何操作其域名安全策略的表达);
  • 允许自定义(不在列表中,但可能可用的域名,例如:example、mycompany等)。

为了与公共后缀列表的想法保持兼容,软件包默认运行在这些模式下,但您可以轻松更改此行为

use LayerShifter\TLDExtract\Extract;

new Extract(null, null, Extract::MODE_ALLOW_ICANN);
new Extract(null, null, Extract::MODE_ALLOW_PRIVATE);
new Extract(null, null, Extract::MODE_ALLOW_NOT_EXISTING_SUFFIXES);
new Extract(null, null, Extract::MODE_ALLOW_ICANN | Extract::MODE_ALLOW_PRIVATE);

变更日志

请参阅CHANGELOG获取更多关于最近更改的信息。

测试

$ composer test

贡献

请参阅CONTRIBUTINGCONDUCT获取详细信息。

许可证

此库是在Apache 2.0许可证下发布的。请参阅许可证文件获取更多信息。