vuthaihoc / pdf-parser
用于解析PDF文件中的文本的PHP库,使用symfony/process 3.x
v0.1.2
2016-06-24 06:43 UTC
Requires
- php: >=5.3.3
- symfony/process: ~2.8|~3.0|~3.1
Requires (Dev)
- mikey179/vfsstream: ~1.5
- phpspec/phpspec: ~2.2
README
PHP库,用于将PDF文件解析为文本。pdftotext的包装器。
安装
通过Composer
composer require wrseward/pdf-parser
pdftotext
二进制文件
Debian / Ubuntu
apt-get install poppler-utils
RedHat / CentOS
yum install poppler-utils
OS X
brew install xpdf
验证您的安装 / 获取二进制文件的路径
which pdftotext
用法
$parser = new \Wrseward\PdfParser\Pdf\PdfToTextParser('/usr/bin/pdftotext'); $parser->parse('/path/to/file.pdf'); echo $parser->text();
运行测试
./vendor/bin/phpspec run