dakota/multibyte-keyword-generator

由peterkahl的多字节关键字生成器派生的Composer安装包

v1.7.0 2014-08-29 07:46 UTC

This package is auto-updated.

Last update: 2024-09-09 23:03:44 UTC


README

版权所有 (c) 2009-2012, Peter Kahl。保留所有权利。 www.colossalmind.com

https://github.com/peterkahl/multibyte-keyword-generator

关于

此PHP类在很大程度上基于Ver Pangonilo的"自动关键词生成器"类,并进行了额外的改进,包括更好的词语分割和能够处理多字节字符串。

此类可以自动根据文本字符串的内容为您网页生成META关键词。这消除了思考最佳关键词的繁琐过程。此方法的主要原理是文本字符串中单个词或多个词的出现的次数。

提供给此类的字符串可能包含HTML标签和标点符号。利用换行和标点的存在,更好地猜测最佳的多词短语。

此多字节关键字生成器将自动创建单个词关键词、2词和3词短语。所有关键词和短语都会经过过滤,以移除常见(无用)的词。常见词在类中定义,并可关联到特定语言。

此类非常灵活。可以使用最小设置并依赖默认设置。或者,可以选择获取最终结果的任何组合:1词关键词、2词短语、3词短语。每个选项都可以禁用。例如,可以配置此类仅获取1词关键词,或仅获取2词短语,或仅获取3词短语,或全部,或任何组合。

此类能够处理多语言文本和多字节字符串。

此类能够处理所有欧洲语言,并可能处理许多其他语言。如果您自己的语言中尚未包含此类,可能需要为您的语言定义常见(无用)的词。

许可证

本程序是免费软件:您可以在自由软件基金会发布的GNU通用公共许可证的条款下重新分发和/或修改它,许可证版本为3,或(根据您的选择)许可证的任何后续版本。

本程序以希望它将是有用的目的进行分发,但没有任何保证;甚至没有关于适销性或特定用途适用性的暗示保证。有关详细信息,请参阅GNU通用公共许可证。

您应该已经随本程序一起收到了GNU通用公共许可证的一个副本。如果没有,请参阅https://gnu.ac.cn/licenses/

变更日志

0.9 ..... 2009-11-05 初始发布

1.0 ..... 2010-01-19 改进了removeDuplicateKw()函数以更好地处理删除重复的复数词(英语),如"class"和"classes"。

1.1 ..... 2010-01-19 将array_one_dim()函数更改为array_flatten()。

1.2 ..... 2010-08-14 改进了html2txt()函数中的正则表达式。

1.3 ..... 2010-08-20 在process_text()函数中添加了对字符':'的词语分割。

1.4 ..... 2011-05-08

1.5 ..... 2012-02-26

1.6 ..... 2012-02-26

1.7 ..... 2012-11-02 在GitHub上添加了仓库链接。