willwashburn / canonical
从一个HTML字符串中返回规范URL
v3.1.3
2019-12-06 00:11 UTC
Requires
- php: >=5.4.0
- symfony/css-selector: >=2 <=4.3.6
- symfony/dom-crawler: >=2 <=4.3.6
Requires (Dev)
- mockery/mockery: ~0.9
- phpunit/phpunit: ~4.0
- squizlabs/php_codesniffer: 3.*
README
从一个HTML字符串中返回规范URL
用法
$canonical = new \Canonical\Canonical; // using some string of html fetched via curl or file get contents or carrier pigeon $html = file_get_contents('website.html'); $canonical->url($html); //// http://www.yourlink.com
安装
使用composer
composer require willwashburn/canonical
或者,将 "willwashburn/canonical": "~3.1"
添加到您的 composer.json 中
变更日志
- v3.1.3 - 改进正则表达式以匹配
window.location =
- v3.1.2 - 放宽DOM爬虫类的要求
- v3.1.1 - 从默认提取器中移除JavaScript重定向
- v3.1.0 - 使用更一致的命名空间提取器类;放弃夜间支持
- v3.0.0 - 解析类似于http-refresh标签的JavaScript重定向
- v2.1.1 - 修复使用相同实例的canonical调用相同HTML时的错误
- v2.1.0 - 允许在返回对象中访问带有utm参数和hash锚点的URL
- v2.0.0 - 解析http-refresh标签;新命名空间;新返回对象
- v1.2.1 - 优先考虑canonical标签而不是og:url标签
- v1.2.0 - 移除utm参数和hash锚点
- v1.1.0 - 如果没有找到其他标签,则搜索twitter:url元标签
- v1.0.2 - 修复对php 5.4的支持
- v1.0.1 - 在使用前清除爬虫
- v1.0.0 - 使用symfony dom crawler进行基本标签查找,包括og:link和link rel=canonical