lyhiving / pdfparser

PDF解析库。可以读取和提取PDF文件中的信息。

维护者

详细信息

github.com/lyhiving/pdfparser

v2.0.2 2021-12-16 04:17 UTC

Requires

php: >=7.1
ext-zlib: *
symfony/polyfill-mbstring: ^1.18

Requires (Dev)

None

Suggests

None

Provides

None

Conflicts

None

Replaces

None

LGPL-3.0 24b6cbfaaf01b13a0f15f83161036daeae0a4d59

Sebastien MALOT <sebastien.woop@malot.fr>

text parser pdf parse extract

This package is auto-updated.

Last update: 2024-09-16 10:49:07 UTC

README

PDF解析器是一个独立的PHP库，提供各种工具从PDF文件中提取数据。

网站： https://www.pdfparser.org

在我们的演示页面上测试API。

本项目由Actualys支持。

功能

包含的功能

加载/解析对象和标题
提取元数据（作者、描述、...）
从有序页面中提取文本
支持压缩PDF
支持MAC OS Roman字符编码
处理文本部分的十六进制和八进制编码
符合PSR-0规范（自动加载）
符合PSR-1规范（代码风格）

目前，不支持受保护文档。

此库正在积极维护。虽然目前库的作者没有积极开发，但我们欢迎任何添加/扩展功能的拉取请求！

文档

在网站上阅读文档.

原始PDF参考文件可以从此URL下载：http://www.adobe.com/devnet/pdf/pdf_reference_archive.html

对于开发者：请阅读DEVELOPER.md以获取有关PDFParser库本地开发更多信息。

安装

使用Composer

获取Composer
运行composer require smalot/pdfparser

使用替代文件加载器

如果您无法使用Composer，可以将alt_autoload.php-dist包含到您的项目中。它将一次性加载所有所需文件。之后您可以使用PDFParser类和其他类。

许可证

此库遵循LGPLv3许可证。