README

smalot/pdfparser是一个独立的PHP包，提供各种工具来从PDF文件中提取数据。

此库正在积极维护。虽然目前此库的作者没有进行积极开发，但我们欢迎任何添加/扩展功能的pull request！

功能

加载/解析对象和头信息
提取元数据（作者、描述...）
从有序页面中提取文本
支持压缩PDF
支持MAC OS Roman字符编码
处理文本部分中的十六进制和八进制编码
创建自定义配置（见CustomConfig.md）。

目前，不支持安全文档和表单数据提取。

许可证

此库在LGPLv3许可证下。

安装

自v1.0.0版本以来，此库需要PHP 7.1+。您可以通过Composer安装它

composer require FabioMezzo/pdfparser

如果您不能使用Composer，可以包含alt_autoload.php-dist。它将自动包含所有所需的文件。

快速示例

<?php

// Parse PDF file and build necessary objects.
$parser = new \Smalot\PdfParser\Parser();
$pdf = $parser->parseFile('/path/to/document.pdf');

$text = $pdf->getText();
echo $text;

更多使用信息可以在此找到：here。

文档

文档可以在doc文件夹中找到。

fabiomezzo / pdfparser

维护者

详细信息

README

功能

许可证

安装

快速示例

文档