webscraperio / api-client-php

webscraper.io 的 API 客户端

维护者

详细信息

github.com/webscraperio/api-client-php

安装量: 52,495

开放问题: 2

v1.4.0 2022-08-25 12:01 UTC

Requires

php: ^7.3 || ^8.0
guzzlehttp/guzzle: ^7.0.1

Requires (Dev)

phpunit/phpunit: ^9.5

Suggests

None

Provides

None

Conflicts

None

Replaces

None

MIT 99b5346f5ccaf6c89b382d57eef61699f79a561a

web scraper webscraperio

dev-master
v1.4.0
v1.3.0
v1.2.0
v1.1.0
v0.3.1
v0.3.0
v0.2.1
v0.2.0
v0.1.2
v0.1.1
v0.1.0
dev-WS-6916/bump-github-actions-to-v4
dev-dependabot/composer/guzzlehttp/psr7-2.5.0
dev-WS-4340/add-raw-option-for-download-routes
dev-dependabot/composer/guzzlehttp/guzzle-7.4.5
dev-WS-3713
dev-get-scrapping-job-test-fix
dev-WS-429/xdebug-to-pcov

This package is auto-updated.

Last update: 2024-09-02 08:55:14 UTC

README

cloud.webscraper.io 的 API 客户端。云爬虫是用于免费 Web Scraper Chrome 扩展的管理爬虫。访问 https://cloud.webscraper.io/api 获取 API 密钥。

安装

使用 composer 安装 API 客户端。

composer require webscraperio/api-client-php

您可能还需要 CSV 解析库。有关更多信息，请访问 http://csv.thephpleague.com/。

composer require league/csv

使用方法

Web Scraper Cloud API 文档可在 webscraper.io 上找到。

变更日志

v1.4.0

添加了 downloadScrapingJobXLSX() 方法
在爬虫任务下载函数中添加了 bool $raw 参数

v1.3.0

添加了 getSitemapScheduler($sitemapId) 方法

v1.2.0

添加了 enableSitemapScheduler($sitemapId, $schedulerConfig) 方法
添加了 disableSitemapScheduler($sitemapId) 方法
添加了 getScrapingJobDataQuality($scrapingJobId) 方法

v1.1.0

不再支持 "已停产" 的 PHP 版本 5.6、7.0、7.2。最低要求版本是 PHP 7.3

v0.3.0

添加了 updateSitemap($sitemapId) 方法
添加了回退机制
createScrapingJob($scrapingJobConfig) 现在具有可选字段 start_urls 和 custom_id
custom_id 字段现在在 getScrapingJob($scrapingJobId) 和 createScrapingJob($scrapingJobConfig) 响应中返回
getScrapingJobs() 和 createScrapingJob($scrapingJobConfig) 响应。

v0.2.0

getScrapingJobs() 和 getSitemaps() 现在返回迭代器
getScrapingJobs($sitemapId) 可以按 sitemap 过滤