xcalder / text-rank
此包最新版本(dev-master)没有可用的许可证信息。
从给定文本中提取相关关键词
dev-master
2018-08-09 15:08 UTC
Requires
- ext-mbstring: *
- xcalder/languagedetector: ~0.1
Suggests
- ext-stem: Improves keywords selection
This package is auto-updated.
Last update: 2024-09-16 21:32:27 UTC
README
从给定文本中提取相关关键词
如何使用
为了使用此类,您必须实例化一个 Config
对象。
<?php require __DIR__ . "/vendor/autoload.php"; use \crodas\TextRank\Config; use \crodas\TextRank\TextRank; $config = new Config; $textrank = new TextRank($config); $keywords = $textrank->getKeywords($some_long_text); var_dump($keywords);
通过添加有关语言的一些信息(stopword
列表,使用 pecl install stem
安装的 stemmer
),可以获得更好的结果。
<?php require __DIR__ . "/vendor/autoload.php"; use \crodas\TextRank\Config; use \crodas\TextRank\TextRank; use \crodas\TextRank\Stopword; $config = new Config; $config->addListener(new Stopword); $textrank = new TextRank($config); $keywords = $textrank->getKeywords($some_long_text); var_dump($keywords);
这样做将检测文本的语言并删除常见单词(来自停用词列表)。如果可用 ext-stem
,结果将更好。
总结长文本
此类还可以总结长文本
$config = new \crodas\TextRank\Config; $config->addListener(new \crodas\TextRank\Stopword); $analizer = new \crodas\TextRank\Summary($config); $summary = $analizer->getSummary($text);
$summary
至少是文本句子的 5%。