sgh / pdfbox
Apache PdfBox ExtractText工具的PHP5封装。
v1.0.0
2015-06-25 06:10 UTC
Requires
- php: >=5.3.0
Requires (Dev)
- phpunit/phpunit-dom-assertions: 1.0.*@dev
This package is not auto-updated.
Last update: 2024-09-12 16:04:57 UTC
README
一个用于PdfBox ExtractText工具的PHP接口,用于测试生成的PDF内容。
要求
- PHP >=5.3 或 HHVM
- Java运行环境
- PdfBox JAR文件
- 下载:http://pdfbox.apache.org/downloads.html
- 最低版本:1.2.0
- 推荐版本:>= 1.8.3
- PHP需要shell执行权限
安装
使用composer安装
composer require sgh/pdfbox
基本用法
use SGH\PdfBox\PdfBox; //$pdf = GENERATED_PDF; $converter = new PdfBox; $converter->setPathToPdfBox('/usr/bin/pdfbox-app-1.7.0.jar'); $text = $converter->textFromPdfStream($pdf); $html = $converter->htmlFromPdfStream($pdf); $dom = $converter->domFromPdfStream($pdf);
如果源PDF是一个文件,使用xxxFromPdfFile()
代替xxxFromPdfStream()
,参数为源路径。
如果您想将转换后的输出保存到文件,请将目标路径指定为xxxFromPdfxxx()
方法的第二个参数。
高级用法
转换部分页面而不是整个文档
$converter->getOptions() ->setStartPage(2) ->setEndPage(5);
忽略PDF中的损坏对象
$converter->getOptions() ->setForce(true);
排序文本
$converter->getOptions() ->setSort(true);
PHPUnit测试
要运行单元测试,请将环境变量PDFBOX_JAR
更改为PdfBox JAR文件的完整路径。请参阅phpunit.xml.dist。