README

轻松从任何地方获取、切割、切块并输出HTML（或XML）内容。

A Top Shelf Craft作品
Michael Rog，所有者

安装

Scraper还可在Craft CMS插件商店中安装。

Scraper插件在Twig模板中公开了一个功能齐全的爬虫对象，允许您从远程源文档中获取、解析和过滤DOM元素。

调用插件时，您可以选择使用SimpleHtmlDom或Symfony组件实例化爬虫

{% set crawler = craft.scraper.using('symfony').get('https://zombo.com') %}

{% set crawler = craft.scraper.using('simplehtmldom').get('https://zombo.com') %}

我通常推荐使用Symfony组件；它们更强大且对错误源代码的抵抗力更强。（SimpleHtmlDom爬虫包含在内，以提供与Craft 2项目的向后兼容性。）

当选择Symfony组件时，get方法实例化一个完整的BrowserKit客户端，让您能够访问所有BrowserKit和DomCrawler方法。

您可以像这样遍历源文档中的DOM元素

{% for node in crawler.filter('h2 > a') %}
    {{ node.text() }}
{% endfor %}

当选择SimpleHtmlDom爬虫时，get方法实例化一个SimpleHtmlDom客户端，让您能够访问所有SimpleHtmlDom方法。

您可以像这样遍历源文档中的DOM元素

{% for node in crawler.find('h1') %}
    {{ node.innertext() }}
{% endfor %}

在StackExchange上提问，并通过电子邮件或Discord通知我。

Craft 4.2.1+

请创建GitHub问题，提交到4.x.dev分支，或者直接给我发电子邮件。