dachcom-digital/lucene-search

Pimcore 5.x 网站索引器(由Zend Search Lucene驱动)

v2.3.2 2019-10-10 07:33 UTC

README

lucenesearch crawler

注意

Pimcore Lucene Search Bundle 将在 Dynamic Search Bundle 达到稳定状态后标记为废弃。之后,在某些情况下将支持修复错误。然而,PR 总是受欢迎的。

要求

  • Pimcore >= 5.8
  • Pimcore >= 6.0

Pimcore 4

在此获取 Pimcore4 版本。

安装

  1. 将以下代码添加到您的 composer.json
  2. 通过扩展管理器激活并安装它
"require" : {
    "dachcom-digital/lucene-search" : "~2.3.0"
}

配置

要启用 LuceneSearch,请将以下行添加到您的 AppBundle/Resources/config/pimcore/config.yml

lucene_search:
    enabled: true

完整的设置可能看起来像这样

lucene_search:
    enabled: true
    fuzzy_search_results: false
    search_suggestion: true
    seeds:
        - 'http://your-domain.dev'
    filter:
        valid_links:
            - '@^http://your-domain.dev.*@i'
    view:
        max_per_page: 10
    crawler:
        content_max_size: 4
        content_start_indicator: '<!-- main-content -->'
        content_end_indicator: '<!-- /main-content -->'

您需要将配置参数添加到您的 config.yml 中以覆盖默认值。执行此命令以获取有关 LuceneSearch 所有配置元素的详细信息

# configuration about all config parameters
$ bin/console config:dump-reference LuceneSearchBundle

# configuration info about the "fuzzy_search_results" parameter
$ bin/console config:dump-reference LuceneSearchBundle fuzzy_search_results

我们还添加了关于所有可能配置值的详细文档

功能

  • 维护驱动索引
  • 自动完成
  • 受限制的文档 & 用户组(推荐使用 member 插件,但不是必需的)

用法

默认
默认情况下,爬虫引擎将在每晚自动启动。请确保 pimcore 默认维护脚本已正确安装。

命令行命令
如果您想手动启动爬虫,请使用此命令

$ php bin/console lucenesearch:crawl -f -v

日志

您可以在后端(LuceneSearch 设置页面的底部)找到上次爬取的一些日志。当然,您也会在 var/logs 文件夹中找到一些日志。 注意:请启用 pimcore 设置中的调试模式以获取所有类型的日志。

更多信息

  • 分类:了解有关基于分类的爬取/搜索的更多信息。
  • 自定义头:了解如何向爬虫请求添加自定义头(如认证令牌)。
  • 限制:了解有关受限制的爬取/索引的更多信息。
  • 自定义元内容:了解有关爬取/搜索自定义元内容的更多信息。
  • 爬虫事件:将自定义字段添加到索引的爬虫过程中。
  • Lucene 文档修改:在 Pimcore 更新/删除事件中删除或更改 lucene 文档的可用性。
  • 前端实现:获取将 lucene 搜索集成到您的网站的分步指南。

版权和许可

版权: DACHCOM.DIGITAL
有关许可详情,请访问LICENSE.md

升级信息

在更新之前,请查看我们的升级说明!