dnru / pdfparser

PDF解析库。可以读取并提取PDF文件中的信息。

维护者

详细信息

github.com/dnru/pdfparser

v0.15.1 2020-05-27 07:55 UTC

Requires

php: ^5.6|^7.0
ext-mbstring: *
ext-zlib: *
tecnickcom/tcpdf: ^6.2.22

Requires (Dev)

atoum/atoum: ^3.1
friendsofphp/php-cs-fixer: ^2.16.3

Suggests

None

Provides

None

Conflicts

None

Replaces

None

LGPL-3.0 6bc9dcbab5154f7d9f4c99e9cd3391f7ba019dc1

Sebastien MALOT <sebastien.woop@malot.fr>

text parser pdf parse extract

This package is auto-updated.

Last update: 2024-09-29 06:20:14 UTC

README

Pdf Parser 是一个独立的PHP库，提供各种工具从PDF文件中提取数据。

网站： http://www.pdfparser.org

在我们的演示页面上测试API。

此项目由 Actualys 支持。

特性

包含的特性

加载/解析对象和头信息
提取元数据（作者、描述...）
从有序页面中提取文本
支持压缩PDF
支持MAC OS Roman字符编码
处理文本部分中的十六进制和八进制编码
PSR-0兼容（自动加载）
PSR-1兼容（代码风格）

目前，不支持加密文档。

此库仍在积极开发中。因此，用户在使用master版本时必须期望会有BC不兼容。

文档

在网站上阅读文档.

原始PDF参考文件可以从以下URL下载： http://www.adobe.com/devnet/pdf/pdf_reference_archive.html

许可证

此库采用LGPLv3许可证。