writecrow/lemmatizer

非词性还原工具

dev-master 2019-11-08 03:50 UTC

This package is auto-updated.

Last update: 2024-09-08 15:13:46 UTC


README

Circle CI

这是一个PHP库,可以从给定的单词中获取词元,并获取映射到词元的一组单词列表。此库不支持词性指定。

源数据

这个词元字典主要基于WordNet,这是普林斯顿大学维护的一个项目。

演示

https://lemmatizer.markfullmer.com/查看词元化器的实际应用

在应用程序中的使用

包含的index.php文件包含一个交互式演示。

通过您喜欢的任何方法(例如,use writecrow\Lemmatizer\Lemmatizer;)让您的代码了解Lemmatizer类

然后传递一个单词到两个方法之一

print Lemmatizer::getLemma('leaves');
// Will print 'leaf'

print Lemmatizer::getWordsFromLemma('leaf');
// Will print 'leaves,leafing,leafed,leafs'

测试

可以通过执行vendor/bin/phpunit来运行单元测试(在composer install之后)。