amberlampsio / gibberish-detector-php
乱码检测库
此包的官方仓库似乎已消失,因此包已被冻结。
v0.1
2019-08-22 19:05 UTC
Requires
- php: >=7.1.0
Requires (Dev)
- phpunit/phpunit: ^7
This package is not auto-updated.
Last update: 2021-02-06 10:25:43 UTC
README
判断文本是否包含乱码。
示例 1:你希望短语如 "Hello, world" 而不是 "dsfknifdkoindwsif32839hdd"
示例 2:你希望用户名如 "jamesjohn" 而不是 "WWWWWWWWWWWWWWWWWWW"
它是如何工作的?
马尔可夫链。在这种情况下,它们描述了哪些字母可以或不可以相邻。通过展示好的文本和差的文本的例子,它教会软件如何猜测哪些字母组合看起来像是乱码,哪些字母组合看起来合理地可能是好文本。
我该如何使用它?
- 训练马尔可夫链
$trainingSuccessful = Gibberish::train(
$big_text_file,
$good_text_file,
$bad_text_file,
$matrix_file
);
- 测试新文本与马尔可夫链的匹配度
$oddsItsGoodText = Gibberish::test($inputText, $matrix_file, true);
是谁创建的?
最初由Rob Renaud用Python编写。
由Oliver Lillie翻译成PHP。
由Richard512改进