webscraperio / api-client-php
webscraper.io 的 API 客户端
v1.4.0
2022-08-25 12:01 UTC
Requires
- php: ^7.3 || ^8.0
- guzzlehttp/guzzle: ^7.0.1
Requires (Dev)
- phpunit/phpunit: ^9.5
- dev-master
- v1.4.0
- v1.3.0
- v1.2.0
- v1.1.0
- v0.3.1
- v0.3.0
- v0.2.1
- v0.2.0
- v0.1.2
- v0.1.1
- v0.1.0
- dev-WS-6916/bump-github-actions-to-v4
- dev-dependabot/composer/guzzlehttp/psr7-2.5.0
- dev-WS-4340/add-raw-option-for-download-routes
- dev-dependabot/composer/guzzlehttp/guzzle-7.4.5
- dev-WS-3713
- dev-get-scrapping-job-test-fix
- dev-WS-429/xdebug-to-pcov
This package is auto-updated.
Last update: 2024-09-02 08:55:14 UTC
README
cloud.webscraper.io 的 API 客户端。云爬虫是用于免费 Web Scraper Chrome 扩展的管理爬虫。访问 https://cloud.webscraper.io/api 获取 API 密钥。
安装
使用 composer 安装 API 客户端。
composer require webscraperio/api-client-php
您可能还需要 CSV 解析库。有关更多信息,请访问 http://csv.thephpleague.com/。
composer require league/csv
使用方法
Web Scraper Cloud API 文档可在 webscraper.io 上找到。
变更日志
v1.4.0
- 添加了
downloadScrapingJobXLSX()
方法 - 在爬虫任务下载函数中添加了
bool $raw
参数
v1.3.0
- 添加了 getSitemapScheduler($sitemapId) 方法
v1.2.0
- 添加了 enableSitemapScheduler($sitemapId, $schedulerConfig) 方法
- 添加了 disableSitemapScheduler($sitemapId) 方法
- 添加了 getScrapingJobDataQuality($scrapingJobId) 方法
v1.1.0
- 不再支持 "已停产" 的 PHP 版本 5.6、7.0、7.2。最低要求版本是 PHP 7.3
v0.3.0
- 添加了 updateSitemap($sitemapId) 方法
- 添加了回退机制
- createScrapingJob($scrapingJobConfig) 现在具有可选字段
start_urls
和custom_id
custom_id
字段现在在 getScrapingJob($scrapingJobId) 和 createScrapingJob($scrapingJobConfig) 响应中返回
getScrapingJobs() 和 createScrapingJob($scrapingJobConfig) 响应。
v0.2.0
- getScrapingJobs() 和 getSitemaps() 现在返回迭代器
- getScrapingJobs($sitemapId) 可以按 sitemap 过滤