ogogo/tika

此包最新版本(dev-master)没有可用的许可信息。

Apache Tika 的 ZF2 封装器

dev-master 2015-01-31 13:39 UTC

This package is not auto-updated.

Last update: 2024-09-24 15:59:18 UTC


README

这是一个 Apache Tika 的 ZF2 封装器。

它允许您从复杂文档中检索文本、元数据和语言。

支持的格式

它支持 opendocument、office .doc 和 .docx、pdf、图片、视频等更多格式!

详细信息请参阅 http://tika.apache.org/1.7/formats.html

使用 composer 安装

在您的 composer.json 中添加包依赖 ogogo/tika

{
    "require": {
        "ogogo/tika": "dev-master" 
    }   
}

使用 composer 安装

php composer.phar install

使用方法

在您的项目中,假设当前目录下有一个 opendocument 测试文件 test.odt

<?php
use Ogogo\Lib\Tika\TikaApp;
 
$testFile = new \SplFileInfo(__DIR__."/yourdocument.pdf");
$tikaApp = new TikaApp();
 
$plaintext = $tikaApp->getText($testFile);
 
$metadataArray = $tikaApp->getMetaData($testFile);

$language = $tikaApp->getLanguage($testFile);