lukemadhanga/php-document-parser

关于此包的最新版本(0.1.5)没有可用的许可证信息。

用于从.doc、.docx、.rtf或.txt文件中获取文本的PHP解析器

0.1.5 2020-02-05 14:39 UTC

This package is auto-updated.

Last update: 2024-09-06 00:16:58 UTC


README

用于从.doc、.docx、.rtf或.txt文件中获取文本的PHP解析器

作者

  • @facuonline
  • Luke Madhanga @LukeMadhanga

如果您希望用户能够将文档上传到内容管理系统,而不是强制他们复制粘贴,则此库非常完美。支持的文件类型包括 .doc.docx.txt.rtf

composer require lukemadhanga/php-document-parser

可能需要您安装PHP Zip

sudo apt-get install php7.0-zip

上面的 Ubuntu 命令将根据您的PHP版本以及服务器上运行的操作系统版本而有所不同

方法

parseFromFile

从文件解析文档

参数

string $filename 要解析的文件的路径

string $mimetype 文件的MIME类型。这将用于确定在解码时使用哪种算法

返回 string 文件的文本

parseFromString

从字符串解析文件

参数

string $string 要解析的文件的內容

string $mimetype 文件的MIME类型。这将用于确定在解码时使用哪种算法

返回 string 文档中的文本

变更日志

2019年9月21日(0.1.4)

更好的ODT支持 合并了PR#13,以提供更好的ODT支持。作者:facuonline

2019年8月1日(0.1.3)

PHP 单元测试 合并了PR#12,以提供PHP单元测试。作者:facuonline

2019年3月21日(0.1.2)

DOCX处理 合并了PR#10,以提供更好的DOCX处理。包括异常处理的错误修复。作者:facuonline

2017年9月13日

添加了composer

composer require lukemadhanga/php-document-parser

2016年4月29日

改进了.doc处理

解析.doc文件的脚本不可靠:在复杂文档上会中断。我建议安装antiword命令行实用程序,因为它对于大多数文档几乎完美。