php-xpdf/php-xpdf

XPDF PHP,一个用于操作 XPDF 的面向对象库

4.1.0 2018-04-12 13:07 UTC

This package is not auto-updated.

Last update: 2024-09-14 13:12:48 UTC


README

Build Status

PHP-XPDF 是 XPDF 的面向对象包装器。目前,仅提供 PdfTotext 包装器。

安装

建议通过 Composer 安装 PHP-XPDF

{
    "require": {
        "php-xpdf/php-xpdf": "~0.2.0"
    }
}

依赖项

为了使用 PHP-XPDF,您需要安装 XPDF。根据您的配置,请遵循XPDF 网站上的说明

文档

驱动初始化

实例化驱动最简单的方法是调用 `create` 方法。

$pdfToText = XPDF\PdfToText::create();

您可以可选地传递配置和记录器(任何 Psr\Logger\LoggerInterface)。

$pdfToText = XPDF\PdfToText::create(array(
    'pdftotext.binaries' => '/opt/local/xpdf/bin/pdftotext',
    'pdftotext.timeout' => 30, // timeout for the underlying process
), $logger);

提取文本

要从 PDF 中提取文本,请使用 getText 方法。

$text = $pdtTotext->getText('document.pdf');

您可以可选地从一页提取到另一页。

$text = $pdtTotext->getText('document.pdf', $from = 1, $to = 4);

您还可以在每次调用中预先定义要提取的页数。

$pdtTotext->setpageQuantity(2);
$pdtTotext->getText('document.pdf'); // extracts page 1 and 2

与 Silex 一起使用

提供 Silex 服务提供者

$app = new Silex\Application();
$app->register(new XPDF\XPDFServiceProvider());

$app['xpdf.pdftotext']->getText('document.pdf');

可以通过传递选项来自定义提供者。

$app->register(new XPDF\XPDFServiceProvider(), array(
    'xpdf.configuration' => array(
        'pdftotext.timeout'  => 30,
        'pdftotext.binaries' => '/opt/local/xpdf/bin/pdftotext',
    ),
    'xpdf.logger' => $logger,
));

许可协议

本项目采用MIT 许可协议