panda843 / tld-extract
TLDExtract,域名部分提取库,例如域名解析器
Requires
- php: ^5.5.0 || ^7.0 || ^8.0
- layershifter/tld-database: ^1.0
- panda843/tld-support: ^1.1
- symfony/polyfill-intl-idn: ^1.10
Requires (Dev)
- phpmd/phpmd: @stable
- phpunit/phpunit: ^4.8 || ^5.0
- squizlabs/php_codesniffer: ~2.0
README
TLDExtract
准确地分离了 gTLD 或 ccTLD(通用或国家代码顶级域)与 URL 的注册域名及其子域,例如域名解析器。例如,假设您只想获取 'http://www.google.com' 中的 'google' 部分。
每个人都做错了。 在 '.' 上分割并取最后两个元素的方法只适用于简单的示例,例如 .com 域名。以 http://forums.bbc.co.uk 为例:上述简单分割方法将 'co' 作为域名,'uk' 作为顶级域,而不是分别的 'bbc' 和 'co.uk'。
TLDExtract
另一方面,通过查找根据 公共后缀列表 正在运行的所有 gTLD 和 ccTLD 的外观,知道所有 gTLD 和 ccTLD 的外观。因此,给定一个 URL,它知道其子域来自其域名,其域名来自其国家代码。
$result = tld_extract('http://forums.news.cnn.com/'); var_dump($result); object(LayerShifter\TLDExtract\Result)#34 (3) { ["subdomain":"LayerShifter\TLDExtract\Result":private]=> string(11) "forums.news" ["hostname":"LayerShifter\TLDExtract\Result":private]=> string(3) "cnn" ["suffix":"LayerShifter\TLDExtract\Result":private]=> string(3) "com" }
Result
实现了 ArrayAccess 接口,因此您可以简单地访问其结果。
var_dump($result['subdomain']); string(11) "forums.news" var_dump($result['hostname']); string(3) "cnn" var_dump($result['suffix']); string(3) "com"
您还可以轻松地将结果转换为 JSON。
var_dump($result->toJson()); string(54) "{"subdomain":"forums.news","hostname":"cnn","suffix":"com"}"
此包符合 PSR-1、PSR-2、PSR-4。如果您注意到合规性问题,请通过 pull request 发送补丁。
TLDExtract 会向公共后缀列表网站发出请求吗?
不。 TLDExtract
使用来自 TLDDatabase 的数据库,该数据库是从公共后缀列表生成的,并定期更新。它不会对解析或验证域名进行任何 HTTP 请求。
要求
以下版本的 PHP 支持。
- PHP 5.5
- PHP 5.6
- PHP 7.0
- PHP 7.1
- PHP 7.2
- PHP 7.3
- HHVM
安装
通过 Composer
$ composer require layershifter/tld-extract
其他结果方法
类 LayerShifter\TLDExtract\Result
有一些可用的方法
$extract = new LayerShifter\TLDExtract\Extract(); # For domain 'shop.github.com' $result = $extract->parse('shop.github.com'); $result->getFullHost(); // will return (string) 'shop.github.com' $result->getRegistrableDomain(); // will return (string) 'github.com' $result->isValidDomain(); // will return (bool) true $result->isIp(); // will return (bool) false # For IP '192.168.0.1' $result = $extract->parse('192.168.0.1'); $result->getFullHost(); // will return (string) '192.168.0.1' $result->getRegistrableDomain(); // will return null $result->isValidDomain(); // will return (bool) false $result->isIp(); // will return (bool) true
自定义数据库
默认情况下,包使用来自 TLDDatabase 包的数据库,但您可以轻松地覆盖此行为
new LayerShifter\TLDExtract\Extract(__DIR__ . '/cache/mydatabase.php');
有关更多详细信息以及如何保持数据库更新的信息,请参阅 TLDDatabase。
实现自己的结果
默认情况下,解析后您将收到 LayerShifter\TLDExtract\Result
类的对象,但有时您可能需要自己的方法或额外的功能。
您可以创建自己的类,该类实现了 LayerShifter\TLDExtract\ResultInterface
,并将其用作解析结果。
class CustomResult implements LayerShifter\TLDExtract\ResultInterface {} new LayerShifter\TLDExtract\Extract(null, CustomResult::class);
解析模式
包具有三种解析模式
- 允许 ICANN 后缀(域名是由 ICANN 委派或属于 IANA 根区域数据库的一部分的域名);
- 允许私有域名(域名是域名持有者提交给公共后缀列表的修正案,作为其操作域名安全策略的表达);
- 允许自定义(不在列表中但可用的域名,例如:example、mycompany 等)。
为了与公共后缀列表的概念保持兼容,包默认以所有这些模式运行,但您可以轻松地更改此行为
use LayerShifter\TLDExtract\Extract; new Extract(null, null, Extract::MODE_ALLOW_ICANN); new Extract(null, null, Extract::MODE_ALLOW_PRIVATE); new Extract(null, null, Extract::MODE_ALLOW_NOT_EXISTING_SUFFIXES); new Extract(null, null, Extract::MODE_ALLOW_ICANN | Extract::MODE_ALLOW_PRIVATE);
变更日志
请参阅 CHANGELOG 了解最近更改的详细信息。
测试
$ composer test
贡献
请参阅CONTRIBUTING和CONDUCT以获取详细信息。
许可证
此库在Apache 2.0许可证下发布。请参阅许可证文件获取更多信息。