tediscript/perangkum

用于总结印度尼西亚语言(印尼语)的PHP库

dev-master 2015-01-15 12:00 UTC

This package is not auto-updated.

Last update: 2024-09-24 03:23:23 UTC


README

Perangkum是一个PHP库,可以用于总结(摘要)印度尼西亚语(印尼语)的文本。

工作原理

  • 从文件中读取文本
  • 将文本分割成段落集合
  • 将段落分割成句子集合
  • 对句子进行加权
  • 选择并返回主要句子

安装方法

Perangkum可以通过Composer安装。

  1. 打开终端(命令行)并将目录切换到您的项目目录。
  2. 下载Composer,方法为:php -r "readfile('https://getcomposer.org.cn/installer');" | php
  3. 创建composer.json文件,或如果已存在,则添加require sastrawi
{
    "require": {
        "tediscript/perangkum": "*"
    }
}

然后,从命令行运行php composer.phar installphp composer.phar update。如果您还不了解如何使用Composer,请阅读Composer入门指南

使用方法

克隆Perangkum项目并运行index.php文件

  • 本项目使用来自Sastrawi的库来执行印尼语的词干提取。

许可证

  • Perangkum的许可证是MIT许可证(MIT)
  • Sastrawi的许可证是MIT许可证(MIT)