quangvule / pdf-to-text
从PDF中提取文本
1.0.1
2016-03-16 10:41 UTC
Requires
- php: ^7.0
- symfony/process: ^3.0
Requires (Dev)
- phpunit/phpunit: ^5.0
This package is auto-updated.
Last update: 2024-09-11 18:28:03 UTC
README
此包提供了一个类,用于从PDF中提取文本。
\Spatie\PdfToText\Pdf::getText('book.pdf'); //returns the text from the pdf
Spatie是一家位于比利时安特卫普的网页设计公司。您可以在我们的网站上找到所有开源项目的概述在这里。
Postcardware
您可以自由使用此包(它遵循MIT许可),但如果它进入您的生产环境,您需要向我们发送一张来自您家乡的明信片,说明您正在使用我们的哪些包。
我们的地址是:Spatie,Samberstraat 69D,2060 安特卫普,比利时。
最棒的明信片将发表在我们的网站开源页面。
要求
幕后,此包利用pdftotext。您可以通过运行以下命令来验证系统上安装的二进制文件
which pdftotext
如果已安装,它将返回二进制文件的路径。
您可以使用以下命令在Ubuntu或Debian上安装二进制文件
apt-get install poppler-utils
如果您使用的是RedHat或CentOS,请使用此命令
yum install poppler-utils
安装
您可以通过composer安装此包
$ composer require spatie/pdf-to-text
使用方法
从PDF中提取文本非常简单。
$text = (new Pdf()) ->setPdf('book.pdf') ->text();
或者更简单
\Spatie\PdfToText\Pdf::getText('book.pdf')
默认情况下,包会假设pdftotext位于/usr/bin/pdftotext
。如果您使用的是不同的位置,请将二进制文件的路径传递给构造函数
$text = (new Pdf('/custom/path/to/pdftotext')) ->setPdf('book.pdf') ->text();
或作为getText函数的第二个参数
\Spatie\PdfToText\Pdf::getText('book.pdf', '/custom/path/to/pdftotext')
变更日志
请参阅CHANGELOG以获取有关最近更改的更多信息。
测试
$ composer test
贡献
请参阅CONTRIBUTING以获取详细信息。
安全
如果您发现任何安全相关的问题,请通过freek@spatie.be发送电子邮件,而不是使用问题跟踪器。
鸣谢
关于Spatie
Spatie是一家位于比利时安特卫普的网页设计公司。您可以在我们的网站上找到所有开源项目的概述在这里。
许可
MIT许可(MIT)。有关更多信息,请参阅许可文件。