liz / php-xpdf
PHP-XPDF,一个用于操作XPDF的面向对象库
4.1.2
2021-01-24 20:54 UTC
Requires
- php: >=5.3.3
- alchemy/binary-driver: ~2.0
Requires (Dev)
- phpunit/phpunit: ~3.7
- sami/sami: ~1.0
- silex/silex: ~1.0
README
PHP-XPDF是XPDF的一个面向对象封装。目前,只有PdfTotext封装可用。
安装
建议通过Composer安装PHP-XPDF
{ "require": { "php-xpdf/php-xpdf": "~0.2.0" } }
依赖项
为了使用PHP-XPDF,您需要安装XPDF。根据您的配置,请遵循XPDF网站上的说明。
文档
驱动程序初始化
实例化驱动程序的最简单方法是调用`create`方法。
$pdfToText = XPDF\PdfToText::create();
您可以可选地传递配置和记录器(任何Psr\Logger\LoggerInterface
)。
$pdfToText = XPDF\PdfToText::create(array( 'pdftotext.binaries' => '/opt/local/xpdf/bin/pdftotext', 'pdftotext.timeout' => 30, // timeout for the underlying process ), $logger);
提取文本
要从PDF中提取文本,请使用`getText`方法。
$text = $pdtTotext->getText('document.pdf');
您可以从一页提取到另一页。
$text = $pdtTotext->getText('document.pdf', $from = 1, $to = 4);
您还可以在每次调用中预定义要提取的页数。
$pdtTotext->setpageQuantity(2); $pdtTotext->getText('document.pdf'); // extracts page 1 and 2
与Silex一起使用
有一个Silex服务提供程序可用
$app = new Silex\Application(); $app->register(new XPDF\XPDFServiceProvider()); $app['xpdf.pdftotext']->getText('document.pdf');
可以通过传递选项来自定义提供程序。
$app->register(new XPDF\XPDFServiceProvider(), array( 'xpdf.configuration' => array( 'pdftotext.timeout' => 30, 'pdftotext.binaries' => '/opt/local/xpdf/bin/pdftotext', ), 'xpdf.logger' => $logger, ));
许可证
本项目遵循MIT许可证。