seoservice2020/phpmorphy

phpMorphy - 用于俄罗斯语、乌克兰语、英语和德语的形态分析库。

2.2.2 2021-01-31 05:13 UTC

This package is auto-updated.

Last update: 2024-09-29 05:29:17 UTC


README

Latest Stable Version Total Downloads tests codecov License

phpMorphy 是用于俄罗斯语、乌克兰语、英语和德语的形态分析库。

本版本仅支持 PHP 7.2、7.3 和 7.4。

此库允许检索任何单词的以下形态信息

  • 基础(正常)形式;
  • 所有形式;
  • 语法(词性、语素)信息。

安装

从您的终端运行以下命令

composer require seoservice2020/phpmorphy

或者在您的 composer.json 文件的 require 部分添加以下内容

{
    "require": {
        "seoservice2020/phpmorphy": "~2.2"
    }
}

然后运行 composer update

使用方法

请参阅 examples 目录中的示例。

构建词典

要从以下来源之一构建您的词典

  1. 从词典源的本机格式创建一个 XML 文件,例如,对于 AOT,使用 bin/dict-processing/convert-mrd2xml.php 脚本

    php bin/dict-processing/convert-mrd2xml.php path/to/aot/dict/file.mwz path/to/otput/

    对于俄语,您还可以使用 bin/dict-processing/convert-russian-jo.php 将带有俄语词典的 XML 转换为不带 ё 字符的格式。

  2. 使用 bin/dict-build/build-dict.php 构建 phpMorphy 词典文件

    目前该软件包包含一些适用于 Windows 的 morphy 构建工具(请参阅 bin/morph-builder/ 文件夹),但您可以指定自己的 morphy 构建工具版本。重要!Morphy 构建可执行文件应放在 bin/morphy_builder.exe 文件中。

    您可能需要为脚本提供特定于源的数据,例如,对于 AOT,您需要提供 AOT 源 根路径。

    morphy 构建工具路径和 AOT 路径参数都是可选的。与之前一样,您也可以提供环境变量

    • MORPHY_DIR - morphy 构建工具的根路径
    • RML - AOT 源的根路径

    首先检查环境变量以支持向后兼容性。

    示例

    php bin/dict-build/build-dict.php path/to/xml/ru_RU.xml path/to/otput/ utf-8 1 1 path/to/morphy/builder/root/folder/ path/to/aot/root/folder

导出词典

如果您需要使用与 phpMorphy 相关的某些特定词典,请在 dicts/categorized/ 文件夹中找到分类词典。所有词典均为大写。

默认词典是

  • 俄语:支持带 ё 字符的 AOT UTF-8 大写词典
  • 英语:AOT UTF-8 大写词典
  • 德语:AOT UTF-8 大写词典
  • 乌克兰语:MySpell UTF-8 大写词典

速度(已弃用)

单词模式

批量模式

注意

所有值都是每秒单词数速度。测试平台:PHP 5.2.3,AMD Duron 800,512Mb 内存,WinXP。