daneren2005 / pdfparser

PDF解析库。可以读取并从PDF文件中提取信息。

维护者

详细信息

github.com/daneren2005/pdfparser

v0.14.1 2020-05-21 20:40 UTC

Requires

php: >=5.3.0
ext-mbstring: *
ext-zlib: *
tecnickcom/tcpdf: ~6.0

Requires (Dev)

atoum/atoum: ^2.8 | ^3.0

Suggests

None

Provides

None

Conflicts

None

Replaces

None

LGPL-3.0 d670d38a3752448aa07f7ff5e3ddb236f74bd161

Sebastien MALOT <sebastien.woop@malot.fr>

text parser pdf parse extract

This package is auto-updated.

Last update: 2024-08-29 05:52:29 UTC

README

Pdf Parser是一个独立的PHP库，提供各种工具从PDF文件中提取数据。

网站： http://www.pdfparser.org

在我们的演示页面上测试API。

本项目由Actualys支持。

特性

包含的特性

加载/解析对象和头部信息
提取元数据（作者、描述、...）
从有序页面中提取文本
支持压缩PDF
支持MAC OS Roman字符集编码
处理文本部分中的十六进制和八进制编码
符合PSR-0标准（自动加载器）
符合PSR-1标准（代码风格）

目前不支持加密文档。

此库仍在积极开发中。因此，当使用master版本时，用户必须期望出现BC不兼容性。

文档

在网站上阅读文档.

原始PDF参考文件可以从以下URL下载：http://www.adobe.com/devnet/pdf/pdf_reference_archive.html

许可

此库遵循LGPLv3许可。