lyhiving/pdfparser

PDF解析库。可以读取和提取PDF文件中的信息。

v2.0.2 2021-12-16 04:17 UTC

README

PDF解析器是一个独立的PHP库,提供各种工具从PDF文件中提取数据。

CI Scrutinizer Code Quality Code Coverage License

Latest Stable Version Total Downloads Monthly Downloads Daily Downloads

网站: https://www.pdfparser.org

在我们的演示页面上测试API。

本项目由Actualys支持。

功能

包含的功能

  • 加载/解析对象和标题
  • 提取元数据(作者、描述、...)
  • 从有序页面中提取文本
  • 支持压缩PDF
  • 支持MAC OS Roman字符编码
  • 处理文本部分的十六进制和八进制编码
  • 符合PSR-0规范(自动加载
  • 符合PSR-1规范(代码风格

目前,不支持受保护文档。

此库正在积极维护。虽然目前库的作者没有积极开发,但我们欢迎任何添加/扩展功能的拉取请求!

文档

在网站上阅读文档.

原始PDF参考文件可以从此URL下载:http://www.adobe.com/devnet/pdf/pdf_reference_archive.html

对于开发者:请阅读DEVELOPER.md以获取有关PDFParser库本地开发更多信息。

安装

使用Composer

  • 获取Composer
  • 运行composer require smalot/pdfparser

使用替代文件加载器

如果您无法使用Composer,可以将alt_autoload.php-dist包含到您的项目中。它将一次性加载所有所需文件。之后您可以使用PDFParser类和其他类。

许可证

此库遵循LGPLv3许可证