tvaliasek/tnt-czech-stemmer

Czech语言分词器的x3wils移植版本的分支,用于TNTSearch分词

v1.1 2018-11-24 19:46 UTC

This package is auto-updated.

Last update: 2024-09-25 09:40:15 UTC


README

这是x3wil/czech-stemmer仓库的分支,类已被修改以配合TNTSearch使用

Czech语言分词器的移植

原始代码是由Jacques Savoy编写的Java类,发布在BSD许可下。详情请访问 Jacques Savoy

安装

使用Composer进行安装

composer require 'tvaliasek/tnt-czech-stemmer'

使用方法

use TeamTNT\TNTSearch\TNTSearch;

$tnt = new TNTSearch;

$tnt->loadConfig([
    'driver'    => 'mysql',
    'host'      => 'localhost',
    'database'  => 'dbname',
    'username'  => 'user',
    'password'  => 'pass',
    'storage'   => '/var/www/tntsearch/examples/',
    'stemmer'   => \Tvaliasek\Search\TNTCzechStemmer::class
]);

独立使用

use tvaliasek\Search\CzechStemmer;

CzechStemmer::stemmLight('velkého');
// velk

CzechStemmer::stemmAgressive('velkého');
// vel