lukemadhanga / php-document-parser
用于从.doc、.docx、.rtf或.txt文件中获取文本的PHP解析器
Requires
- php: >=5.3.3
Requires (Dev)
- phpunit/phpunit: ^8.2
README
用于从.doc、.docx、.rtf或.txt文件中获取文本的PHP解析器
作者
- @facuonline
- Luke Madhanga @LukeMadhanga
如果您希望用户能够将文档上传到内容管理系统,而不是强制他们复制粘贴,则此库非常完美。支持的文件类型包括 .doc、.docx、.txt 和 .rtf。
composer require lukemadhanga/php-document-parser
可能需要您安装PHP Zip
sudo apt-get install php7.0-zip
上面的 Ubuntu
命令将根据您的PHP版本以及服务器上运行的操作系统版本而有所不同
方法
parseFromFile
从文件解析文档
参数
string $filename
要解析的文件的路径
string $mimetype
文件的MIME类型。这将用于确定在解码时使用哪种算法
返回 string 文件的文本
parseFromString
从字符串解析文件
参数
string $string
要解析的文件的內容
string $mimetype
文件的MIME类型。这将用于确定在解码时使用哪种算法
返回 string 文档中的文本
变更日志
2019年9月21日(0.1.4)
更好的ODT支持 合并了PR#13,以提供更好的ODT支持。作者:facuonline
2019年8月1日(0.1.3)
PHP 单元测试 合并了PR#12,以提供PHP单元测试。作者:facuonline
2019年3月21日(0.1.2)
DOCX处理 合并了PR#10,以提供更好的DOCX处理。包括异常处理的错误修复。作者:facuonline
2017年9月13日
添加了composer
composer require lukemadhanga/php-document-parser
2016年4月29日
改进了.doc处理
解析.doc文件的脚本不可靠:在复杂文档上会中断。我建议安装antiword
命令行实用程序,因为它对于大多数文档几乎完美。