sheronov_v2 / php-mystem
Yandex MyStem 程序的 PHP 封装器
dev-master
2024-04-25 16:45 UTC
Requires
- php: ^7.2|>=8.0
- ext-curl: *
- ext-json: *
- ext-mbstring: *
- ext-zip: *
This package is auto-updated.
Last update: 2024-09-25 17:46:10 UTC
README
Yandex MyStem 程序的 PHP 封装器 https://yandex.ru/dev/mystem/
安装
- 添加github仓库
composer config repositories.php-mystem vcs https://github.com/sheronov/php-mystem
- 要求安装包
composer require sheronov/php-mystem
- 首次启动时,包将从yandex下载mystem二进制文件,但您可以手动操作
./vendor/bin/mystem-downloader.php
默认情况下,它下载Windows、Linux和macOS的所有mystem二进制文件。
如果您只想为单个系统下载,请提供参数
- -l - Linux的二进制文件
- -w - Windows的二进制文件
- -m - Macos的二进制文件
用法
词形还原(将词形形式还原为其词元——其正常(词典)形式。)
use Sheronov\PhpMyStem\MyStem; MyStem::lemma('Бегущий'); //бежать MyStem::lemmatization('Бегущий по лезвию'); /* array ( 0 => array ( 'text' => 'Бегущий', 'lemma' => 'бежать', 'weight' => 1, 'gram' => 'V,нп=(непрош,вин,ед,прич,полн,муж,несов,действ,неод|непрош,им,ед,прич,полн,муж,несов,действ)', 'part_letter' => 'V', 'part_more' => 'verb', 'wrong' => false, ), 1 => array ( 'text' => 'по', 'lemma' => 'по', 'weight' => 1, 'gram' => 'PR=', 'part_letter' => 'PR', 'part_more' => 'preposition', 'wrong' => false, ), 2 => array ( 'text' => 'лезвию', 'lemma' => 'лезвие', 'weight' => 1, 'gram' => 'S,сред,неод=дат,ед', 'part_letter' => 'S', 'part_more' => 'noun', 'wrong' => false, ), ) */
使用自定义参数从Yandex文档运行原始二进制文件
\Sheronov\PhpMyStem\MyStem::run($someText, ['--weight', '-gi']); // unprepared decoded array from json