jaybizzle / doc-to-text
从Word文档中提取文本
v2.0.0
2020-10-12 09:59 UTC
Requires
- php: ^7.3
- symfony/process: ^4.0|^5.0
Requires (Dev)
- phpunit/phpunit: ^8.0|^9.0
This package is auto-updated.
Last update: 2024-09-16 04:01:48 UTC
README
此包提供了一个类,用于从Word文档中提取文本。
<?php use Jaybizzle\DocToText\Doc; echo Doc::getText('book.doc'); // returns the text from the doc
要求
幕后,此包利用了antiword。您可以通过执行以下命令来验证二进制文件是否已安装在您的系统上:
which antiword
如果已安装,它将返回二进制文件的路径。
要在Ubuntu或Debian上安装二进制文件,您可以使用以下命令:
apt-get install antiword
安装
您可以通过composer安装此包
composer require jaybizzle/doc-to-text
用法
从文档中提取文本很简单。
$text = (new Doc()) ->setDoc('book.doc') ->text();
或者更简单
echo Doc::getText('book.doc');
默认情况下,该包将假设antiword
命令位于/usr/bin/antiword
。如果它位于其他位置,请通过构造函数或作为getText
静态方法的第二个参数传递其二进制路径。
$text = (new Doc('/custom/path/to/antiword')) ->setDoc('book.doc') ->text();
或者作为getText
静态方法的第三个参数
echo Doc::getText('book.doc', '/custom/path/to/antiword');
有时您可能想使用antiword选项。为此,您可以使用setOptions
方法设置它们。
$text = (new Doc()) ->setDoc('table.doc') ->setOptions(['f', 'w 80']) ->text() ;
或者作为getText
静态方法的第三个参数
echo Doc::getText('book.doc', null, ['f', 'w 80']);
变更日志
有关最近更改的更多信息,请参阅CHANGELOG。
测试
composer test
安全
如果您发现任何安全问题,请通过mbeech@mark-beech.co.uk发送电子邮件,而不是使用问题跟踪器。
致谢
许可证
MIT许可证(MIT)。有关更多信息,请参阅许可证文件。