angkor/khmercut

高棉分词

0.1.4 2024-08-30 07:49 UTC

This package is auto-updated.

Last update: 2024-09-30 08:02:40 UTC


README

Status Total Downloads Latest Stable Version License: MIT

Khmercut 是一个基于 Rust 包 seanghay/khmercut 的 PHP Laravel 框架包装器。这使得开发者可以在 Laravel 应用程序中利用 khmercut Rust 包提供的功能。

安装

您可以通过 composer 安装此包

composer require angkor/khmercut

下载

您可以从发布链接下载构建版本,选择合适的平台并将其移动到所需的位置。

使用

发布配置文件以设置二进制路径

php artisan vendor:publish --provider="Angkor\Khmercut\KhmercutServiceProvider" --tag="config"

设置 .env 变量

TOKENIZER_BINARY_PATH=usr/local/bin/khmercut
use use Angkor\Khmercut\Tokenizer;

Tokenizer::make('Pretty girl សួស្តីស្រីស្អាត Hello World សួស្តីពិភពលោក');

//output: "Pretty girl សួស្តី\u{200B}ស្រី\u{200B}ស្អាត Hello World សួស្តី\u{200B}ពិភពលោក";

Tokenizer::make('Pretty girl សួស្តីស្រីស្អាត Hello World សួស្តីពិភពលោក', '|');

//output: "Pretty girl សួស្តី|ស្រី|ស្អាត Hello World សួស្តី|ពិភពលោក";

Tokenizer 只会在高棉单词中添加 ZERO WIDTH SPACE

测试

composer test

变更日志

请参阅 CHANGELOG 了解最近更改的详细信息。

贡献

请参阅 CONTRIBUTING 了解详情。

安全性

如果您发现任何与安全相关的问题,请通过电子邮件 semsphy@gmail.com 而不是使用问题跟踪器。

鸣谢

许可证

MIT 许可证 (MIT)。请参阅 许可证文件 了解更多信息。