crodas/text-rank

本包最新版本(dev-master)没有提供许可证信息。

从给定文本中提取相关关键词

dev-master 2013-12-08 07:56 UTC

This package is auto-updated.

Last update: 2024-09-12 18:28:48 UTC


README

从给定文本中提取相关关键词

如何使用

为了使用该类,您必须实例化一个Config对象。

<?php

require __DIR__ . "/vendor/autoload.php";

use \crodas\TextRank\Config;
use \crodas\TextRank\TextRank;

$config   = new Config;
$textrank = new TextRank($config);

$keywords = $textrank->getKeywords($some_long_text);

var_dump($keywords);

通过添加少量关于语言的信息(stopword列表,带有pecl install stemstemmer),可以得到更好的结果。

<?php

require __DIR__ . "/vendor/autoload.php";

use \crodas\TextRank\Config;
use \crodas\TextRank\TextRank;
use \crodas\TextRank\Stopword;

$config = new Config;
$config->addListener(new Stopword);

$textrank = new TextRank($config);
$keywords = $textrank->getKeywords($some_long_text);

var_dump($keywords);

这样做将检测文本的语言并移除常见单词(来自stopword列表)。如果ext-stem可用,结果将更好。

总结长文本

此类还可以总结长文本

$config = new \crodas\TextRank\Config;
$config->addListener(new \crodas\TextRank\Stopword);
$analizer = new \crodas\TextRank\Summary($config);
$summary = $analizer->getSummary($text);         

$summary最多是文本句子的5%。