quangvule/pdf-to-text

从PDF中提取文本

1.0.1 2016-03-16 10:41 UTC

This package is auto-updated.

Last update: 2024-09-11 18:28:03 UTC


README

Latest Version on Packagist Software License Build Status SensioLabsInsight Quality Score Total Downloads

此包提供了一个类,用于从PDF中提取文本。

 \Spatie\PdfToText\Pdf::getText('book.pdf'); //returns the text from the pdf

Spatie是一家位于比利时安特卫普的网页设计公司。您可以在我们的网站上找到所有开源项目的概述在这里

Postcardware

您可以自由使用此包(它遵循MIT许可),但如果它进入您的生产环境,您需要向我们发送一张来自您家乡的明信片,说明您正在使用我们的哪些包。

我们的地址是:Spatie,Samberstraat 69D,2060 安特卫普,比利时。

最棒的明信片将发表在我们的网站开源页面。

要求

幕后,此包利用pdftotext。您可以通过运行以下命令来验证系统上安装的二进制文件

which pdftotext

如果已安装,它将返回二进制文件的路径。

您可以使用以下命令在Ubuntu或Debian上安装二进制文件

apt-get install poppler-utils

如果您使用的是RedHat或CentOS,请使用此命令

yum install poppler-utils

安装

您可以通过composer安装此包

$ composer require spatie/pdf-to-text

使用方法

从PDF中提取文本非常简单。

$text = (new Pdf())
    ->setPdf('book.pdf')
    ->text();

或者更简单

 \Spatie\PdfToText\Pdf::getText('book.pdf')

默认情况下,包会假设pdftotext位于/usr/bin/pdftotext。如果您使用的是不同的位置,请将二进制文件的路径传递给构造函数

$text = (new Pdf('/custom/path/to/pdftotext'))
    ->setPdf('book.pdf')
    ->text();

或作为getText函数的第二个参数

 \Spatie\PdfToText\Pdf::getText('book.pdf', '/custom/path/to/pdftotext')

变更日志

请参阅CHANGELOG以获取有关最近更改的更多信息。

测试

$ composer test

贡献

请参阅CONTRIBUTING以获取详细信息。

安全

如果您发现任何安全相关的问题,请通过freek@spatie.be发送电子邮件,而不是使用问题跟踪器。

鸣谢

关于Spatie

Spatie是一家位于比利时安特卫普的网页设计公司。您可以在我们的网站上找到所有开源项目的概述在这里

许可

MIT许可(MIT)。有关更多信息,请参阅许可文件