php-xpdf / php-xpdf
XPDF PHP,一个用于操作 XPDF 的面向对象库
4.1.0
2018-04-12 13:07 UTC
Requires
- php: ~7.0
- alchemy/binary-driver: ~1.5
Requires (Dev)
- phpunit/phpunit: ~6.0
- sami/sami: ~3.0
- silex/silex: ~2.0
This package is not auto-updated.
Last update: 2024-09-14 13:12:48 UTC
README
PHP-XPDF 是 XPDF 的面向对象包装器。目前,仅提供 PdfTotext 包装器。
安装
建议通过 Composer 安装 PHP-XPDF
{
"require": {
"php-xpdf/php-xpdf": "~0.2.0"
}
}
依赖项
为了使用 PHP-XPDF,您需要安装 XPDF。根据您的配置,请遵循XPDF 网站上的说明。
文档
驱动初始化
实例化驱动最简单的方法是调用 `create` 方法。
$pdfToText = XPDF\PdfToText::create();
您可以可选地传递配置和记录器(任何 Psr\Logger\LoggerInterface)。
$pdfToText = XPDF\PdfToText::create(array( 'pdftotext.binaries' => '/opt/local/xpdf/bin/pdftotext', 'pdftotext.timeout' => 30, // timeout for the underlying process ), $logger);
提取文本
要从 PDF 中提取文本,请使用 getText 方法。
$text = $pdtTotext->getText('document.pdf');
您可以可选地从一页提取到另一页。
$text = $pdtTotext->getText('document.pdf', $from = 1, $to = 4);
您还可以在每次调用中预先定义要提取的页数。
$pdtTotext->setpageQuantity(2); $pdtTotext->getText('document.pdf'); // extracts page 1 and 2
与 Silex 一起使用
提供 Silex 服务提供者
$app = new Silex\Application(); $app->register(new XPDF\XPDFServiceProvider()); $app['xpdf.pdftotext']->getText('document.pdf');
可以通过传递选项来自定义提供者。
$app->register(new XPDF\XPDFServiceProvider(), array( 'xpdf.configuration' => array( 'pdftotext.timeout' => 30, 'pdftotext.binaries' => '/opt/local/xpdf/bin/pdftotext', ), 'xpdf.logger' => $logger, ));
许可协议
本项目采用MIT 许可协议。