finbarrmccarthy / tika
此包的最新版本(dev-master)没有可用的许可证信息。
Apache Tika 的 ZF2 包装器
dev-master
2014-01-21 15:12 UTC
Requires
- php: >=5.3.2
- symfony/process: ~2.1
This package is not auto-updated.
Last update: 2024-09-24 07:06:51 UTC
README
这是一个 Apache Tika 的 ZF2 包装器。
它允许您从复杂的文档中检索文本、元数据和语言。
支持格式
它支持 opendocument、office .doc 和 .docx、pdf、图片、视频以及更多!
详细信息请参见 http://tika.apache.org/1.1/formats.html
使用 composer 安装
在您的 composer.json 中添加依赖项 finbarrmccarthy/tika
{
"require": {
"finbarrmccarthy/tika": "@dev"
}
}
使用 composer 安装
php composer.phar install
用法
在您的项目中,假设您当前目录下有一个 opendocument 测试文件 test.odt
<?php
use FinbarrMcCarthy\Lib\Tika\TikaApp;
$testFile = new \SplFileInfo(__DIR__."/yourdocument.pdf");
$tikaApp = new TikaApp();
$plaintext = $tikaApp->getText($testFile);
$metadataArray = $tikaApp->getMetaData($testFile);
$language = $tikaApp->getLanguage($testFile);