liz/php-xpdf

PHP-XPDF,一个用于操作XPDF的面向对象库

4.1.2 2021-01-24 20:54 UTC

This package is auto-updated.

Last update: 2024-09-25 04:46:05 UTC


README

Build Status

PHP-XPDF是XPDF的一个面向对象封装。目前,只有PdfTotext封装可用。

安装

建议通过Composer安装PHP-XPDF

{
    "require": {
        "php-xpdf/php-xpdf": "~0.2.0"
    }
}

依赖项

为了使用PHP-XPDF,您需要安装XPDF。根据您的配置,请遵循XPDF网站上的说明。

文档

驱动程序初始化

实例化驱动程序的最简单方法是调用`create`方法。

$pdfToText = XPDF\PdfToText::create();

您可以可选地传递配置和记录器(任何Psr\Logger\LoggerInterface)。

$pdfToText = XPDF\PdfToText::create(array(
    'pdftotext.binaries' => '/opt/local/xpdf/bin/pdftotext',
    'pdftotext.timeout' => 30, // timeout for the underlying process
), $logger);

提取文本

要从PDF中提取文本,请使用`getText`方法。

$text = $pdtTotext->getText('document.pdf');

您可以从一页提取到另一页。

$text = $pdtTotext->getText('document.pdf', $from = 1, $to = 4);

您还可以在每次调用中预定义要提取的页数。

$pdtTotext->setpageQuantity(2);
$pdtTotext->getText('document.pdf'); // extracts page 1 and 2

与Silex一起使用

有一个Silex服务提供程序可用

$app = new Silex\Application();
$app->register(new XPDF\XPDFServiceProvider());

$app['xpdf.pdftotext']->getText('document.pdf');

可以通过传递选项来自定义提供程序。

$app->register(new XPDF\XPDFServiceProvider(), array(
    'xpdf.configuration' => array(
        'pdftotext.timeout'  => 30,
        'pdftotext.binaries' => '/opt/local/xpdf/bin/pdftotext',
    ),
    'xpdf.logger' => $logger,
));

许可证

本项目遵循MIT许可证