crodas / text-rank
本包最新版本(dev-master)没有提供许可证信息。
从给定文本中提取相关关键词
dev-master
2013-12-08 07:56 UTC
Requires
- ext-mbstring: *
- crodas/languagedetector: ~0.1
Suggests
- ext-stem: Improves keywords selection
This package is auto-updated.
Last update: 2024-09-12 18:28:48 UTC
README
从给定文本中提取相关关键词
如何使用
为了使用该类,您必须实例化一个Config
对象。
<?php require __DIR__ . "/vendor/autoload.php"; use \crodas\TextRank\Config; use \crodas\TextRank\TextRank; $config = new Config; $textrank = new TextRank($config); $keywords = $textrank->getKeywords($some_long_text); var_dump($keywords);
通过添加少量关于语言的信息(stopword
列表,带有pecl install stem
的stemmer
),可以得到更好的结果。
<?php require __DIR__ . "/vendor/autoload.php"; use \crodas\TextRank\Config; use \crodas\TextRank\TextRank; use \crodas\TextRank\Stopword; $config = new Config; $config->addListener(new Stopword); $textrank = new TextRank($config); $keywords = $textrank->getKeywords($some_long_text); var_dump($keywords);
这样做将检测文本的语言并移除常见单词(来自stopword列表)。如果ext-stem
可用,结果将更好。
总结长文本
此类还可以总结长文本
$config = new \crodas\TextRank\Config; $config->addListener(new \crodas\TextRank\Stopword); $analizer = new \crodas\TextRank\Summary($config); $summary = $analizer->getSummary($text);
$summary
最多是文本句子的5%。