contextualcode/ezplatform-search-binary-extractor

eZ Platform 扩展包,允许索引二进制文件的内容

v4.0.1 2024-07-10 16:56 UTC

README

曾经可以使用第三方二进制程序索引 eZ Publish 中的二进制文件。但在最新的 eZ Platform 版本中,此功能缺失。而这个扩展包提供了这一功能。

此外,它还提供了一个 PDF 文件的二进制提取示例。该示例使用第三方二进制程序 pdftotext

安装

  1. 使用 composer 安装 contextualcode/ezplatform-search-binary-extractor

     composer require contextualcode/ezplatform-search-binary-extractor
    
  2. 您的 composer.json 必须包含以下行

     "config": {
         "bin-dir": "bin/"
     }
    

用法

首先,请确认需要可搜索的二进制文件字段类型的“可搜索”复选框已勾选。

安装扩展包后,所有 PDF 文件的内容都将被索引。您需要运行以下命令重建搜索索引:

php bin/console ezplatform:reindex

您还可以构建自己的自定义二进制提取器。只需遵循几个简单的步骤

  1. 创建一个新的服务,该服务实现 BinaryExtractor。请以 BinaryExtractor\Pdf 为例。

  2. 使用 ezplatform.field_type.ezbinaryfile.binary_extractor 标签 标记您的服务。