xcalder/text-rank

此包最新版本(dev-master)没有可用的许可证信息。

从给定文本中提取相关关键词

dev-master 2018-08-09 15:08 UTC

This package is auto-updated.

Last update: 2024-09-16 21:32:27 UTC


README

从给定文本中提取相关关键词

如何使用

为了使用此类,您必须实例化一个 Config 对象。

<?php

require __DIR__ . "/vendor/autoload.php";

use \crodas\TextRank\Config;
use \crodas\TextRank\TextRank;

$config   = new Config;
$textrank = new TextRank($config);

$keywords = $textrank->getKeywords($some_long_text);

var_dump($keywords);

通过添加有关语言的一些信息(stopword 列表,使用 pecl install stem 安装的 stemmer),可以获得更好的结果。

<?php

require __DIR__ . "/vendor/autoload.php";

use \crodas\TextRank\Config;
use \crodas\TextRank\TextRank;
use \crodas\TextRank\Stopword;

$config = new Config;
$config->addListener(new Stopword);

$textrank = new TextRank($config);
$keywords = $textrank->getKeywords($some_long_text);

var_dump($keywords);

这样做将检测文本的语言并删除常见单词(来自停用词列表)。如果可用 ext-stem,结果将更好。

总结长文本

此类还可以总结长文本

$config = new \crodas\TextRank\Config;
$config->addListener(new \crodas\TextRank\Stopword);
$analizer = new \crodas\TextRank\Summary($config);
$summary = $analizer->getSummary($text);         

$summary 至少是文本句子的 5%。