dnru / pdfparser
PDF解析库。可以读取并提取PDF文件中的信息。
v0.15.1
2020-05-27 07:55 UTC
Requires
- php: ^5.6|^7.0
- ext-mbstring: *
- ext-zlib: *
- tecnickcom/tcpdf: ^6.2.22
Requires (Dev)
- atoum/atoum: ^3.1
- friendsofphp/php-cs-fixer: ^2.16.3
- dev-master
- v0.15.1
- v0.15.0
- v0.14.0
- v0.13.3
- v0.13.2
- v0.13.1
- v0.13.0
- v0.12.0
- v0.11
- v0.10.0
- v0.9.26
- v0.9.25
- v0.9.24
- v0.9.23
- v0.9.22
- v0.9.21
- v0.9.20
- v0.9.19
- v0.9.18
- v0.9.17
- v0.9.16
- v0.9.15
- v0.9.14
- v0.9.13
- v0.9.12
- v0.9.11
- v0.9.10
- v0.9.9
- v0.9.8
- v0.9.7
- v0.9.6
- v0.9.5
- v0.9.4
- v0.9.3
- v0.9.2
- v0.9.1
- v0.9.0
- dev-feature/remove-tcpdf-lib
This package is auto-updated.
Last update: 2024-09-29 06:20:14 UTC
README
Pdf Parser 是一个独立的PHP库,提供各种工具从PDF文件中提取数据。
在我们的 演示页面 上测试API。
此项目由 Actualys 支持。
特性
包含的特性
- 加载/解析对象和头信息
- 提取元数据(作者、描述...)
- 从有序页面中提取文本
- 支持压缩PDF
- 支持MAC OS Roman字符编码
- 处理文本部分中的十六进制和八进制编码
- PSR-0兼容(自动加载)
- PSR-1兼容(代码风格)
目前,不支持加密文档。
此库仍在积极开发中。因此,用户在使用master版本时必须期望会有BC不兼容。
文档
原始PDF参考文件可以从以下URL下载: http://www.adobe.com/devnet/pdf/pdf_reference_archive.html
许可证
此库采用LGPLv3许可证。