sgh/pdfbox

Apache PdfBox ExtractText工具的PHP5封装。

v1.0.0 2015-06-25 06:10 UTC

This package is not auto-updated.

Last update: 2024-09-12 16:04:57 UTC


README

一个用于PdfBox ExtractText工具的PHP接口,用于测试生成的PDF内容。

Build Status Latest Stable Version Latest Unstable Version Total Downloads License

要求

安装

使用composer安装

composer require sgh/pdfbox

基本用法

use SGH\PdfBox\PdfBox;

//$pdf = GENERATED_PDF;
$converter = new PdfBox;
$converter->setPathToPdfBox('/usr/bin/pdfbox-app-1.7.0.jar');
$text = $converter->textFromPdfStream($pdf);
$html = $converter->htmlFromPdfStream($pdf);
$dom  = $converter->domFromPdfStream($pdf);

如果源PDF是一个文件,使用xxxFromPdfFile()代替xxxFromPdfStream(),参数为源路径。

如果您想将转换后的输出保存到文件,请将目标路径指定为xxxFromPdfxxx()方法的第二个参数。

高级用法

转换部分页面而不是整个文档

$converter->getOptions()
    ->setStartPage(2)
	->setEndPage(5);

忽略PDF中的损坏对象

$converter->getOptions()
    ->setForce(true);

排序文本

$converter->getOptions()
    ->setSort(true);

PHPUnit测试

要运行单元测试,请将环境变量PDFBOX_JAR更改为PdfBox JAR文件的完整路径。请参阅phpunit.xml.dist