foxorm / gibberish-detector
此包已被废弃,不再维护。未建议替代包。
判断文本是否包含无意义文字。
v1.1.0
2016-12-08 15:28 UTC
This package is not auto-updated.
Last update: 2020-01-19 15:06:08 UTC
README
判断文本是否包含无意义文字。
示例 1:您希望短语如 "Hello, world" 而不是 "dsfknifdkoindwsif32839hdd"。
示例 2:您希望用户名如 "jamesjohn" 而不是 "WWWWWWWWWWWWWWWWWWW"。
它是如何工作的?
马尔可夫链。在这种情况下,它们描述了哪些字母应该或不应该相邻。通过展示良好文本和不良文本的示例,它教会软件如何猜测哪些字母组合看起来像无意义文字,以及哪些字母组合看起来合理可能为良好文本。
我该如何使用它?
- 训练马尔可夫链
$trainingSuccessful = Gibberish::train(
$big_text_file,
$good_text_file,
$bad_text_file,
$matrix_file
);
- 将新文本与马尔可夫链进行测试
$oddsItsGoodText = Gibberish::test($inputText, $matrix_file, true);
是谁制作的?
最初由Rob Renaud用Python编写。 rrenaud@gmail.com https://github.com/rrenaud/Gibberish-Detector
由Oliver Lillie翻译成PHP。 buggedcom@gmail.com https://github.com/buggedcom/Gibberish-Detector-PHP
由Richard512改进
由Jo Surikat在composer中实现 jo@surikat.pro https://github.com/redcatphp/gibberish-detector