giauphan / puphpeteer
PHP 的 Puppeteer 桥接器,支持整个 API。解决安装时的问题
Requires
- php: >=8.0
- giauphan/rialto: *
- psr/log: *
- vierbergenlars/php-semver: ^3.0.2
Requires (Dev)
- monolog/monolog: ^2.0
- phpunit/phpunit: ^9.0
- symfony/console: ^4.0|^5.0
- symfony/process: ^4.0|^5.0
README
在我撰写这些行的时候,PuPHPeteer 的最新版本已经发布近两年了。尽管这个项目周围充满热情,但我已经没有动力继续支持其发展,主要是因为它对我没有任何实际用途。所以,现在坦白告诉你,PuPHPeteer 已经不再维护。
然而,这里有一个由社区维护的分支列表
如果你创建了一个分支并计划维护它,请告诉我,我会在这里链接它。
PuPHPeteer
PHP 的 Puppeteer 桥接器,支持整个 API。基于 Rialto,一个用于从 PHP 管理Node资源的包。
以下是来自 Puppeteer 文档的一些示例 借用并适配 PHP 语法
示例 - 导航到 https://example.com 并将截图保存为 example.png
use Nesk\Puphpeteer\Puppeteer; $puppeteer = new Puppeteer; $browser = $puppeteer->launch(); $page = $browser->newPage(); $page->goto('https://example.com'); $page->screenshot(['path' => 'example.png']); $browser->close();
示例 - 在页面上下文中评估脚本
use Nesk\Puphpeteer\Puppeteer; use Nesk\Rialto\Data\JsFunction; $puppeteer = new Puppeteer; $browser = $puppeteer->launch(); $page = $browser->newPage(); $page->goto('https://example.com'); // Get the "viewport" of the page, as reported by the page. $dimensions = $page->evaluate(JsFunction::createWithBody(" return { width: document.documentElement.clientWidth, height: document.documentElement.clientHeight, deviceScaleFactor: window.devicePixelRatio }; ")); printf('Dimensions: %s', print_r($dimensions, true)); $browser->close();
要求和安装
此包需要 PHP >= 7.3 和 Node >= 8。
使用以下两个命令行安装
composer require giauphan/puphpeteer npm install @nesk/puphpeteer
PuPHPeteer 与 Puppeteer 之间的显著差异
Puppeteer 的类必须实例化
而不是要求 Puppeteer
const puppeteer = require('puppeteer');
您必须实例化 Puppeteer
类
$puppeteer = new Puppeteer;
这将创建一个由 PHP 控制的新的 Node 进程。
您也可以向构造函数传递一些选项,请参阅 Rialto 的文档。PuPHPeteer 还扩展了这些选项
[ // Logs the output of Browser's console methods (console.log, console.debug, etc...) to the PHP logger 'log_browser_console' => false, ]
⏱ 想要在 Puppeteer 的 API 中使用超过 30 秒的超时吗?
如果您使用超过 30 秒的超时,您必须为 read_timeout
选项设置更高的值(默认:35
)
$puppeteer = new Puppeteer([ 'read_timeout' => 65, // In seconds ]); $puppeteer->launch()->newPage()->goto($url, [ 'timeout' => 60000, // In milliseconds ]);
无需使用 await
关键字
使用 PuPHPeteer,每个方法调用或属性获取/设置都是同步的。
一些方法已被别名化
以下方法已被别名化,因为 PHP 不支持方法名中的 $
字符
$
=>querySelector
$$
=>querySelectorAll
$x
=>querySelectorXPath
$eval
=>querySelectorEval
$$eval
=>querySelectorAllEval
就像使用原始方法一样使用这些别名
$divs = $page->querySelectorAll('div');
必须使用 JsFunction
创建评估函数
在页面上下文中评估的函数必须使用 JsFunction
类 创建,这些函数的正文必须用 JavaScript 而不是 PHP 编写。
use Nesk\Rialto\Data\JsFunction; $pageFunction = JsFunction::createWithParameters(['element']) ->body("return element.textContent");
必须使用 ->tryCatch
捕获异常
如果 Node 发生错误,将抛出 Node\FatalException
并关闭进程,您将不得不创建 Puppeteer
的新实例。
为了避免这种情况,您可以要求 Node 捕获这些错误,通过在您的指令前添加 ->tryCatch
use Nesk\Rialto\Exceptions\Node; try { $page->tryCatch->goto('invalid_url'); } catch (Node\Exception $exception) { // Handle the exception... }
相反,将抛出 Node\Exception
异常,Node 进程将保持活跃并可使用。
许可证
MIT 许可证(MIT)。请参阅 许可证文件 了解更多信息。
标志归属
PuPHPeteer 的标志由以下元素组成
- Puppet,由 Luis Prado 提供,来自 Noun Project。
- Elephant,由 Lluisa Iborra 提供,来自 Noun Project。
感谢 Laravel News 选择标志的图标和颜色。