aka-dmc / php-url-scraper

本包最新版本(1.6)没有可用的许可证信息。

简单的PHP URL抓取器

1.6 2020-04-22 20:03 UTC

This package is auto-updated.

Last update: 2024-09-23 06:01:11 UTC


README

很简单,但需要一些微调,更好的错误处理,合适的类结构等。但这个只是为了另一个项目快速编写的代码,想分享一下。

这是一个简单的PHP URL抓取器,它将抓取:

  • 标题
  • 描述
  • 图片
  • 元标签
  • OG标签

用法

// include the class
require_once __DIR__ . '/URLScraper.php';

// get the results
$result = URLScraper::get("https://bertmaurau.be/");  

echo json_encode($result, JSON_PRETTY_PRINT);

将得到

{
	"url": "https:\/\/bertmaurau.be\/",
	"domain": "bertmaurau.be",
	"title": "Bert Maurau",
	"description": "Hello World!",
	"image": "https:\/\/bertmaurau.be\/assets\/img\/profile.jpg",
	"tags_meta": {
		"viewport": "width=device-width, initial-scale=1.0",
		"description": "Bert Maurau, a 25 year old, Belgium-based Back-End Web- & Mobile Developer!",
		"author": "Bert Maurau",
		"keywords": "web,design,html,css,html5,development,bert,maurau,bert maurau,portfolio,profile,website,personal,angularjs,php,mysql,ionic,javascript"
	},
	"tags_og": {
		"title": "Bert Maurau",
		"image": "https:\/\/bertmaurau.be\/assets\/img\/profile.jpg",
		"description": "Hello World!"
	}
}