wamania/php-stemmer

原生PHP词干提取器

v3.0.1 2023-05-11 10:50 UTC

This package is auto-updated.

Last update: 2024-08-24 07:08:53 UTC


README

PHP原生Snowball词干提取器实现 https://snowballstem.org/

仅接受UTF-8编码

语言

可用

  • 加泰罗尼亚语(由Orestes Sanchez Benavente提供 orestes@estotienearreglo.es
  • 丹麦语
  • 荷兰语
  • 英语
  • 芬兰语(由Mikko Saari提供)
  • 法语
  • 德语
  • 意大利语
  • 挪威语
  • 葡萄牙语
  • 罗马尼亚语
  • 俄语
  • 西班牙语
  • 瑞典语

安装

对于PHP5,使用1.3

composer require wamania/php-stemmer "^1.3"

对于PHP7,使用2.x(分支2.x与1.x向后兼容)

composer require wamania/php-stemmer "^2.0"

对于PHP^7.3和PHP^8.0,使用3.x(向后兼容,但phpunit^9不与PHP < 7.3兼容)

composer require wamania/php-stemmer "^3.0"

使用

对于2.x,您应该使用工厂

use Wamania\Snowball\StemmerFactory;

// use ISO_639 (2 or 3 letters) or language name in english
$stemmer = StemmerFactory::create('fr');
$stemmer = StemmerFactory::create ('spanish');

// then 
$stem = $stemmer->stem('automóvil');

或管理器

use Wamania\Snowball\StemmerManager;

$manager = new StemmerManager();
$stem = $manager->stem('automóvil', 'es');

在1.3中,您必须手动实例化

use Wamania\Snowball\French;

$stemmer = new French();
$stem = $stemmer->stem('anticonstitutionnellement');