prostoroman/page-analyzer

此包的最新版本(dev-master)没有可用的许可证信息。

计算html内容的单词频率以优化SEO

dev-master 2017-07-18 04:13 UTC

This package is not auto-updated.

Last update: 2024-09-15 03:08:41 UTC


README

计算html内容中的单词频率(输入字符串、文件或URL)。

$analyzer = new PageAnalyzer\Analyzer();
$stats = $analyzer->analyse('http://www.lipsum.com/');
var_dump($stats);

选项

示例:如何忽略noindex中的内容,从分析中排除停用词,并检查在排名中使用的特定标签。

$options = [
  'ignoreNoindex' => true,
  'stopWords' => ['в', 'и', 'от', 'для'],
  'checkTags' => ['title', 'keywords', 'description', 'a', 'b,strong', 'h1,h2,h3,h4,h5,h6']
];
$analyzer = new PageAnalyzer\Analyzer(['stopWords' => $stopWords]);
var_dump($stats);

请查看:这里提供的演示

欢迎任何贡献。谢谢!