jaybizzle/doc-to-text

从Word文档中提取文本

v2.0.0 2020-10-12 09:59 UTC

This package is auto-updated.

Last update: 2024-09-16 04:01:48 UTC


README

Latest Version on Packagist Software License Build Status Quality Score Total Downloads

此包提供了一个类,用于从Word文档中提取文本。

<?php

use Jaybizzle\DocToText\Doc;

echo Doc::getText('book.doc'); // returns the text from the doc

要求

幕后,此包利用了antiword。您可以通过执行以下命令来验证二进制文件是否已安装在您的系统上:

which antiword

如果已安装,它将返回二进制文件的路径。

要在Ubuntu或Debian上安装二进制文件,您可以使用以下命令:

apt-get install antiword

安装

您可以通过composer安装此包

composer require jaybizzle/doc-to-text

用法

从文档中提取文本很简单。

$text = (new Doc())
    ->setDoc('book.doc')
    ->text();

或者更简单

echo Doc::getText('book.doc');

默认情况下,该包将假设antiword命令位于/usr/bin/antiword。如果它位于其他位置,请通过构造函数或作为getText静态方法的第二个参数传递其二进制路径。

$text = (new Doc('/custom/path/to/antiword'))
    ->setDoc('book.doc')
    ->text();

或者作为getText静态方法的第三个参数

echo Doc::getText('book.doc', '/custom/path/to/antiword');

有时您可能想使用antiword选项。为此,您可以使用setOptions方法设置它们。

$text = (new Doc())
    ->setDoc('table.doc')
    ->setOptions(['f', 'w 80'])
    ->text()
;

或者作为getText静态方法的第三个参数

echo Doc::getText('book.doc', null, ['f', 'w 80']);

变更日志

有关最近更改的更多信息,请参阅CHANGELOG

测试

 composer test

安全

如果您发现任何安全问题,请通过mbeech@mark-beech.co.uk发送电子邮件,而不是使用问题跟踪器。

致谢

许可证

MIT许可证(MIT)。有关更多信息,请参阅许可证文件