willwashburn/canonical

从一个HTML字符串中返回规范URL

v3.1.3 2019-12-06 00:11 UTC

This package is auto-updated.

Last update: 2024-09-06 10:18:39 UTC


README

从一个HTML字符串中返回规范URL

用法

$canonical = new \Canonical\Canonical;

// using some string of html fetched via curl or file get contents or carrier pigeon
$html = file_get_contents('website.html');

$canonical->url($html);
//// http://www.yourlink.com

安装

使用composer

composer require willwashburn/canonical

或者,将 "willwashburn/canonical": "~3.1" 添加到您的 composer.json 中

变更日志

  • v3.1.3 - 改进正则表达式以匹配 window.location =
  • v3.1.2 - 放宽DOM爬虫类的要求
  • v3.1.1 - 从默认提取器中移除JavaScript重定向
  • v3.1.0 - 使用更一致的命名空间提取器类;放弃夜间支持
  • v3.0.0 - 解析类似于http-refresh标签的JavaScript重定向
  • v2.1.1 - 修复使用相同实例的canonical调用相同HTML时的错误
  • v2.1.0 - 允许在返回对象中访问带有utm参数和hash锚点的URL
  • v2.0.0 - 解析http-refresh标签;新命名空间;新返回对象
  • v1.2.1 - 优先考虑canonical标签而不是og:url标签
  • v1.2.0 - 移除utm参数和hash锚点
  • v1.1.0 - 如果没有找到其他标签,则搜索twitter:url元标签
  • v1.0.2 - 修复对php 5.4的支持
  • v1.0.1 - 在使用前清除爬虫
  • v1.0.0 - 使用symfony dom crawler进行基本标签查找,包括og:link和link rel=canonical