daneren2005/pdfparser

PDF解析库。可以读取并从PDF文件中提取信息。

v0.14.1 2020-05-21 20:40 UTC

README

Pdf Parser是一个独立的PHP库,提供各种工具从PDF文件中提取数据。

Build Status Current Version composer.lock

Total Downloads Monthly Downloads Daily Downloads

网站: http://www.pdfparser.org

在我们的演示页面上测试API。

本项目由Actualys支持。

特性

包含的特性

  • 加载/解析对象和头部信息
  • 提取元数据(作者、描述、...)
  • 从有序页面中提取文本
  • 支持压缩PDF
  • 支持MAC OS Roman字符集编码
  • 处理文本部分中的十六进制和八进制编码
  • 符合PSR-0标准(自动加载器
  • 符合PSR-1标准(代码风格

目前不支持加密文档。

此库仍在积极开发中。因此,当使用master版本时,用户必须期望出现BC不兼容性。

文档

在网站上阅读文档.

原始PDF参考文件可以从以下URL下载:http://www.adobe.com/devnet/pdf/pdf_reference_archive.html

许可

此库遵循LGPLv3许可