webscraperio/api-client-php

webscraper.io 的 API 客户端

v1.4.0 2022-08-25 12:01 UTC

README

cloud.webscraper.io 的 API 客户端。云爬虫是用于免费 Web Scraper Chrome 扩展的管理爬虫。访问 https://cloud.webscraper.io/api 获取 API 密钥。

安装

使用 composer 安装 API 客户端。

composer require webscraperio/api-client-php

您可能还需要 CSV 解析库。有关更多信息,请访问 http://csv.thephpleague.com/

composer require league/csv

使用方法

Web Scraper Cloud API 文档可在 webscraper.io 上找到。

变更日志

v1.4.0

  • 添加了 downloadScrapingJobXLSX() 方法
  • 在爬虫任务下载函数中添加了 bool $raw 参数

v1.3.0

  • 添加了 getSitemapScheduler($sitemapId) 方法

v1.2.0

  • 添加了 enableSitemapScheduler($sitemapId, $schedulerConfig) 方法
  • 添加了 disableSitemapScheduler($sitemapId) 方法
  • 添加了 getScrapingJobDataQuality($scrapingJobId) 方法

v1.1.0

  • 不再支持 "已停产" 的 PHP 版本 5.6、7.0、7.2。最低要求版本是 PHP 7.3

v0.3.0

  • 添加了 updateSitemap($sitemapId) 方法
  • 添加了回退机制
  • createScrapingJob($scrapingJobConfig) 现在具有可选字段 start_urlscustom_id
  • custom_id 字段现在在 getScrapingJob($scrapingJobId) 和 createScrapingJob($scrapingJobConfig) 响应中返回
    getScrapingJobs() 和 createScrapingJob($scrapingJobConfig) 响应。

v0.2.0

  • getScrapingJobs() 和 getSitemaps() 现在返回迭代器
  • getScrapingJobs($sitemapId) 可以按 sitemap 过滤