heimrichhannot / contao-hyphenator
1.1.4
2018-10-22 12:24 UTC
Requires
- php: ~5.4 || ~7.0
- contao-community-alliance/composer-plugin: ~2.4 || ~3.0
- contao/core-bundle: ^3.5.1 || ~4.1
- org_heigl/hyphenator: >=2.0,<3
- wa72/htmlpagedom: ^1.3
README
这是一个Contao模块,提供服务器端分词(感谢org_heigl/hyphenator)。它默认支持标题和段落。
选项
为了扩展功能,所有选项都可以在您的localconfig中进行调整。
选项 | 类型 | 默认值 | 描述 |
---|---|---|---|
hyphenator_tags | 字符串 | h1,h2,h3,h4,h5,h6,p | 分词器应查看哪种类型的标签。 |
hyphenator_wordMin | 整数 | 10 | 长度低于给定值的单词将不会整体分词。将选项设置为高于rightMin和leftMin之和的值是有意义的。 |
hyphenator_leftMin | 整数 | 5 | 单词左侧需要保留多少个字符不分词。 |
hyphenator_rightMin | 整数 | 5 | 单词右侧需要保留多少个字符不分词。 |
hyphenator_quality | 整数 | 9 | 分词的质量应该有多好。数字越高,越好。这可以是0(完全不分词)到9(最佳分词)之间的任何整数。 |
hyphenator_hyphen | 字符串 | | 此字符应用作连字符字符。 |
hyphenator_filter | 字符串 | 简单 | 使用逗号分隔的过滤器列表,用于后处理分词文本。过滤器必须扩展Org\Heigl\Filter\Filter-class。可以使用类名中的部分名称作为过滤器的名称。因此,对于SimpleFilter,只需使用“Simple”作为过滤器的名称即可。 |
hyphenator_tokenizers | 数组 | array('Whitespace', 'Punctuation') | 要用于分割待分词文本的分词器列表。分词器必须实现Org\Heigl\Tokenizer\Tokenizer-interface。可以使用类名中的部分名称作为分词器的名称。因此,对于WhitespaceTokenizer,只需使用“Whitespace”作为分词器的名称即可。 |
hyphenator_skipPages | 数组 | 空 | 要跳过分词的Contao页面ID数组。 |