sjoorm/pdfparser

PDF解析库。可以读取和提取PDF文件中的信息。

0.9.271 2016-05-03 17:06 UTC

README

PDF解析器是一个独立的PHP库,提供各种工具来从PDF文件中提取数据。

Build Status Total Downloads Current Version HHVM Status

网站: http://www.pdfparser.org

在我们的演示页面上测试API。

该项目由Actualys支持。

功能

包含的功能

  • 加载/解析对象和标题
  • 提取元数据(作者、描述等)
  • 从有序页面中提取文本
  • 支持压缩PDF
  • 支持MAC OS罗马字符集编码
  • 处理文本部分中的十六进制和八进制编码
  • 遵循PSR-0标准(自动加载
  • 遵循PSR-1标准(代码风格

目前,不支持受保护文档。

此库仍在积极开发中。因此,当使用master版本时,用户必须预计会有BC断开。

文档

在网站上阅读文档.

原始PDF参考文件可以从以下URL下载:http://www.adobe.com/devnet/pdf/pdf_reference_archive.html

许可证

此库遵循GPLv3许可证