seoservice2020 / phpmorphy
phpMorphy - 用于俄罗斯语、乌克兰语、英语和德语的形态分析库。
Requires
- php: >=7.2 <8.0
- ext-mbstring: *
Requires (Dev)
- phpunit/phpunit: ^8.0
README
phpMorphy 是用于俄罗斯语、乌克兰语、英语和德语的形态分析库。
本版本仅支持 PHP 7.2、7.3 和 7.4。
此库允许检索任何单词的以下形态信息
- 基础(正常)形式;
- 所有形式;
- 语法(词性、语素)信息。
安装
从您的终端运行以下命令
composer require seoservice2020/phpmorphy
或者在您的 composer.json
文件的 require 部分添加以下内容
{ "require": { "seoservice2020/phpmorphy": "~2.2" } }
然后运行 composer update
使用方法
请参阅 examples 目录中的示例。
构建词典
要从以下来源之一构建您的词典
-
从词典源的本机格式创建一个 XML 文件,例如,对于 AOT,使用
bin/dict-processing/convert-mrd2xml.php
脚本php bin/dict-processing/convert-mrd2xml.php path/to/aot/dict/file.mwz path/to/otput/
对于俄语,您还可以使用
bin/dict-processing/convert-russian-jo.php
将带有俄语词典的 XML 转换为不带ё
字符的格式。 -
使用
bin/dict-build/build-dict.php
构建 phpMorphy 词典文件目前该软件包包含一些适用于 Windows 的 morphy 构建工具(请参阅
bin/morph-builder/
文件夹),但您可以指定自己的 morphy 构建工具版本。重要!Morphy 构建可执行文件应放在bin/morphy_builder.exe
文件中。您可能需要为脚本提供特定于源的数据,例如,对于 AOT,您需要提供 AOT 源 根路径。
morphy 构建工具路径和 AOT 路径参数都是可选的。与之前一样,您也可以提供环境变量
MORPHY_DIR
- morphy 构建工具的根路径RML
- AOT 源的根路径
首先检查环境变量以支持向后兼容性。
示例
php bin/dict-build/build-dict.php path/to/xml/ru_RU.xml path/to/otput/ utf-8 1 1 path/to/morphy/builder/root/folder/ path/to/aot/root/folder
导出词典
如果您需要使用与 phpMorphy 相关的某些特定词典,请在 dicts/categorized/
文件夹中找到分类词典。所有词典均为大写。
默认词典是
- 俄语:支持带
ё
字符的 AOT UTF-8 大写词典 - 英语:AOT UTF-8 大写词典
- 德语:AOT UTF-8 大写词典
- 乌克兰语:MySpell UTF-8 大写词典
速度(已弃用)
单词模式
批量模式
注意
所有值都是每秒单词数速度。测试平台:PHP 5.2.3,AMD Duron 800,512Mb 内存,WinXP。