tediscript / perangkum
用于总结印度尼西亚语言(印尼语)的PHP库
dev-master
2015-01-15 12:00 UTC
Requires
This package is not auto-updated.
Last update: 2024-09-24 03:23:23 UTC
README
Perangkum是一个PHP库,可以用于总结(摘要)印度尼西亚语(印尼语)的文本。
工作原理
- 从文件中读取文本
- 将文本分割成段落集合
- 将段落分割成句子集合
- 对句子进行加权
- 选择并返回主要句子
安装方法
Perangkum可以通过Composer安装。
- 打开终端(命令行)并将目录切换到您的项目目录。
- 下载Composer,方法为:
php -r "readfile('https://getcomposer.org.cn/installer');" | php
- 创建
composer.json
文件,或如果已存在,则添加require sastrawi
{ "require": { "tediscript/perangkum": "*" } }
然后,从命令行运行php composer.phar install
或php composer.phar update
。如果您还不了解如何使用Composer,请阅读Composer入门指南。
使用方法
克隆Perangkum项目并运行index.php文件
库
- 本项目使用来自Sastrawi的库来执行印尼语的词干提取。
许可证
- Perangkum的许可证是MIT许可证(MIT)
- Sastrawi的许可证是MIT许可证(MIT)