webcoast / versatile-crawler

适用于 TYPO3 CMS 的灵活且可扩展的爬虫

安装次数: 6,527

依赖关系: 0

建议者: 0

安全性: 0

星标: 7

关注者: 3

分支: 5

开放问题: 4

类型:typo3-cms-extension

v3.0.0 2024-06-27 09:35 UTC

README

Versatile Crawler 是一个基本扩展,用于在 TYPO3 CMS 安装中爬取页面和内容。它基于 TYPO3 CMS 8 版本开发。该扩展具有清晰易懂的结构,并为页面和记录提供队列和爬虫功能。

安装与设置

从 GitHub 克隆扩展,手动或通过 composer,并通过扩展管理器激活扩展。在您想开始索引的页面上创建一个爬虫配置记录,例如在主页上。进入调度模块,创建队列任务和进程任务。配置一个触发 TYPO3 CMS 调度器的 cron 作业。

先决条件

  • TYPO3 CMS 8
  • PHP 7 w/ cURL

文档

文档可以在 GitHub wiki 中找到: https://github.com/webcoast-dk/versatile-crawler/wiki

贡献

请随意复制存储库,进行更改并创建一个拉取请求。如果您不擅长编程或没有时间,可以提出一个问题。

致谢

该扩展由 Thorben Nissen 开发和维护(https://www.kapp-hamburg.de/en/

许可证

版权 (C) 2017 Thorben Nissen

本程序是自由软件:您可以重新分配它并/或修改它,具体请参阅自由软件基金会根据其发布的 GNU 通用公共许可证的条款,许可证版本 3 或(根据您的选择)许可证的任何后续版本。

本程序根据希望它会有所帮助的原则进行分发,但没有任何保证;甚至没有关于其适销性或适用于特定目的的暗示性保证。有关详细信息,请参阅 GNU 通用公共许可证。

您应已收到与该程序一起的 GNU 通用公共许可证副本。如果没有,请参阅 https://gnu.ac.cn/licenses/

图标

图标取自 Material design (https://materialdesignicons.com/) 并在 SIL 开放字体许可证 1.1 下授权。