dev-el/pdfparser

PDF解析库。可以读取并提取PDF文件中的信息。

v1.0.5 2021-06-24 12:23 UTC

README

Pdf Parser是一个独立的PHP库,提供各种工具来从PDF文件中提取数据。

License

Latest Stable Version Total Downloads Monthly Downloads Daily Downloads

原作者网站: https://www.pdfparser.org

在他们的演示页面上测试原始API。

原始项目由Actualys支持。

特性

包含的特性

  • 加载/解析对象和头信息
  • 提取元数据(作者、描述...)
  • 从有序页面中提取文本
  • 支持压缩PDF
  • 支持MAC OS罗马字符编码
  • 处理文本部分中的十六进制和八进制编码
  • 符合PSR-0规范(自动加载
  • 符合PSR-1规范(代码风格

目前,不支持加密文档。

此库正在积极维护。 目前作者没有积极开发此库,但我们欢迎任何添加/扩展功能的pull request!

文档

在网站上阅读文档.

原始PDF参考文件可以从此URL下载: http://www.adobe.com/devnet/pdf/pdf_reference_archive.html

对于开发者:请阅读DEVELOPER.md以获取有关PDFParser库本地开发更多信息。

安装

使用Composer

  • 获取Composer
  • 运行composer require dev-el/pdfparser

使用备用文件加载器

如果您无法使用Composer,可以将alt_autoload.php-dist包含到您的项目中。它将一次性加载所有必需的文件。之后,您可以使用PDFParser类和其他类。

许可协议

此库在LGPLv3许可协议下。