dpassola/pdfparser

PDF解析库。可以读取并从PDF文件中提取信息。

1.0.3 2021-07-28 13:23 UTC

README

Pdf Parser是一个独立的PHP库,提供各种工具从PDF文件中提取数据。

CI Scrutinizer Code Quality Code Coverage License

Latest Stable Version Total Downloads Monthly Downloads Daily Downloads

网站: https://www.pdfparser.org

在我们的演示页面上测试API。

此项目由Actualys支持。

特性

包含的特性

  • 加载/解析对象和头部信息
  • 提取元数据(作者、描述、...)
  • 从有序页面中提取文本
  • 支持压缩PDF
  • 支持MAC OS Roman字符编码
  • 处理文本部分中的十六进制和八进制编码
  • PSR-0兼容(自动加载
  • PSR-1兼容(代码风格

目前,不支持加密文档。

此库正在积极维护。 目前,该库的作者没有进行活跃的开发,但我们欢迎任何增加/扩展功能的pull request!

文档

在网站上阅读文档.

原始PDF参考文件可以从以下URL下载:http://www.adobe.com/devnet/pdf/pdf_reference_archive.html

对于开发者:请阅读DEVELOPER.md以获取有关PDFParser库本地开发的更多信息。

安装

使用Composer

  • 获取Composer
  • 运行composer require smalot/pdfparser

使用备用文件加载器

如果您无法使用Composer,可以将alt_autoload.php-dist包含到您的项目中。它将一次性加载所有所需的文件。之后,您可以使用PDFParser类和其他类。

许可证

此库采用LGPLv3许可证