foxorm/gibberish-detector

此包已被废弃,不再维护。未建议替代包。

判断文本是否包含无意义文字。

v1.1.0 2016-12-08 15:28 UTC

This package is not auto-updated.

Last update: 2020-01-19 15:06:08 UTC


README

判断文本是否包含无意义文字。

示例 1:您希望短语如 "Hello, world" 而不是 "dsfknifdkoindwsif32839hdd"。

示例 2:您希望用户名如 "jamesjohn" 而不是 "WWWWWWWWWWWWWWWWWWW"。

它是如何工作的?

马尔可夫链。在这种情况下,它们描述了哪些字母应该或不应该相邻。通过展示良好文本和不良文本的示例,它教会软件如何猜测哪些字母组合看起来像无意义文字,以及哪些字母组合看起来合理可能为良好文本。

我该如何使用它?

  1. 训练马尔可夫链
$trainingSuccessful = Gibberish::train(
	$big_text_file,
	$good_text_file,
	$bad_text_file,
	$matrix_file
	);
  1. 将新文本与马尔可夫链进行测试
$oddsItsGoodText = Gibberish::test($inputText, $matrix_file, true);

是谁制作的?

最初由Rob Renaud用Python编写。 rrenaud@gmail.com https://github.com/rrenaud/Gibberish-Detector

由Oliver Lillie翻译成PHP。 buggedcom@gmail.com https://github.com/buggedcom/Gibberish-Detector-PHP

由Richard512改进

由Jo Surikat在composer中实现 jo@surikat.pro https://github.com/redcatphp/gibberish-detector