opencontent / eztika-ls
OpenContent eZ Tika(Paul Borgermans eZ Tika 的分支)
1.0
2019-05-27 12:58 UTC
Requires
This package is auto-updated.
Last update: 2024-08-28 01:12:59 UTC
README
eZ Tika 是一个扩展,允许将多种二进制文件格式转换为搜索引擎使用的纯文本(如果您已将属性设置为可搜索)
目前,大多数常见格式已启用(另见 binaryfile.ini.append.php)
- application/pdf
- application/msword
- application/vnd.ms-excel
- application/vnd.ms-powerpoint
- application/vnd.visio
- application/vnd.ms-outlook
- application/xml
- application/rtf
- application/vnd.oasis.opendocument.text
- application/vnd.oasis.opendocument.presentation
- application/vnd.oasis.opendocument.spreadsheet
- application/vnd.oasis.opendocument.formula
- application/zip
- application/vnd.openxmlformats-officedocument.wordprocessingml.document
- application/vnd.openxmlformats-officedocument.spreadsheetml.sheet
- application/vnd.openxmlformats-officedocument.presentationml.presentation
- application/octet-stream (默认不启用)
许可证 GNU GPL 2.0 - Apache Tika 使用 ASF 许可证(Apache)
安装
-
提取 eztika 扩展并将其放置在扩展文件夹中。
-
检查 web 服务器是否可以执行 extension/eztika/bin 文件
chmod +x extension/eztika/bin/eztika
或者
将 eztika shell 脚本和 tika-app-version.jar 从扩展 bin 文件夹复制到 web 服务器可以访问的位置,并编辑 shell 脚本以及设置 tika.jar 文件的路径(确保它是可执行的)
-
在 eZ Publish 中启用扩展。通过打开
settings/override/site.ini.append.php
并在[ExtensionSettings]
块中添加ActiveExtensions[]=eztika
来完成此操作 -
通过运行脚本更新类自动加载:php bin/php/ezpgenerateautoloads.php -e
-
如果出现问题,您可以在
eztika.in.append.php
中启用调试
[DebugSettings]
# Debug=enabled|disabled
# if enabled
# - write Debug Messages to eztika.log
#
# Note: an error message to error.log is always written
# if eztika can not extract any content from binaryfile
Debug=disabled
# KeepTempFiles=enabled|disabled
# if enabled var/cache/ eztika_xxx.txt tmp files are not unlinked
# to debug metadata which is extracted from the binaryfile
# The setting is only active if Debug=enabled
KeepTempFiles=disabled