muhfirdaus19 / bahasata
印尼语 PHP 文本处理
dev-main
2021-07-25 10:18 UTC
Requires
- php: >=5.3
Requires (Dev)
- phpunit/phpunit: 4.8.7
This package is auto-updated.
Last update: 2024-09-25 16:48:19 UTC
README
印尼语 PHP 文本处理
关于
Bahasata 是用 PHP 编写的印尼语文本处理的示例。
目前只有词干提取器和分词器
安装方法
Bahasata 可以通过 Composer 进行安装。
composer require muhfirdaus19/bahasata:dev-main
使用方法
文本分词
分离单词和句子
use Bahasata\Bahasata; // include autoloader require './vendor/autoload.php'; $bahasata = new Bahasata(); $write = $bahasata->write('tetap bersama, jaga kesehatan!'); $result = $write->get(); // tetap bersama, jaga kesehatan! $result = $write->wordsTokenizer()->get(); // ['tetap' ,'bersama' ,'jaga' ,'kesehatan'] $result = $write->sentencesTokenizer()->get(); // ['tetap bersama' ,'jaga kesehatan'] print_r($result);
词干提取器
寻找句子或单词的基本形式。例如:makan -> makan
use Bahasata\Bahasata; // include autoloader require './vendor/autoload.php'; $bahasata = new Bahasata(); $result = $bahasata->stem('merekomendasikan'); // rekomendasi $write = $bahasata->write('saya rekomendasikan untuk memakan sayur'); $result = $write->wordsTokenizer()->stem()->get(); // ['saya', 'rekomendasi', 'untuk', 'makan', 'sayur'] print_r($result);
版权和许可证
muhfirdaus19/bahasata 库的版权归 Muhammad Firdaus 所有,并根据 MIT 许可证的条款许可使用。有关更多信息,请参阅 LICENSE。