muhfirdaus19/bahasata

印尼语 PHP 文本处理

dev-main 2021-07-25 10:18 UTC

This package is auto-updated.

Last update: 2024-09-25 16:48:19 UTC


README

印尼语 PHP 文本处理

关于

Bahasata 是用 PHP 编写的印尼语文本处理的示例。
目前只有词干提取器和分词器

安装方法

Bahasata 可以通过 Composer 进行安装。

composer require muhfirdaus19/bahasata:dev-main

使用方法

文本分词

分离单词和句子

use Bahasata\Bahasata;

// include autoloader
require './vendor/autoload.php';

$bahasata = new Bahasata();
$write = $bahasata->write('tetap bersama, jaga kesehatan!');

$result = $write->get();
// tetap bersama, jaga kesehatan!

$result = $write->wordsTokenizer()->get();
// ['tetap' ,'bersama' ,'jaga' ,'kesehatan']

$result = $write->sentencesTokenizer()->get();
// ['tetap bersama' ,'jaga kesehatan']

print_r($result);

词干提取器

寻找句子或单词的基本形式。例如:makan -> makan

use Bahasata\Bahasata;

// include autoloader
require './vendor/autoload.php';

$bahasata = new Bahasata();
$result = $bahasata->stem('merekomendasikan');
// rekomendasi

$write = $bahasata->write('saya rekomendasikan untuk memakan sayur');
$result = $write->wordsTokenizer()->stem()->get();
// ['saya', 'rekomendasi', 'untuk', 'makan', 'sayur']

print_r($result);

版权和许可证

muhfirdaus19/bahasata 库的版权归 Muhammad Firdaus 所有,并根据 MIT 许可证的条款许可使用。有关更多信息,请参阅 LICENSE