amberlampsio/gibberish-detector-php

乱码检测库

此包的官方仓库似乎已消失,因此包已被冻结。

v0.1 2019-08-22 19:05 UTC

This package is not auto-updated.

Last update: 2021-02-06 10:25:43 UTC


README

判断文本是否包含乱码。

示例 1:你希望短语如 "Hello, world" 而不是 "dsfknifdkoindwsif32839hdd"

示例 2:你希望用户名如 "jamesjohn" 而不是 "WWWWWWWWWWWWWWWWWWW"

它是如何工作的?

马尔可夫链。在这种情况下,它们描述了哪些字母可以或不可以相邻。通过展示好的文本和差的文本的例子,它教会软件如何猜测哪些字母组合看起来像是乱码,哪些字母组合看起来合理地可能是好文本。

我该如何使用它?

  1. 训练马尔可夫链
$trainingSuccessful = Gibberish::train(
	$big_text_file,
	$good_text_file,
	$bad_text_file,
	$matrix_file
	);
  1. 测试新文本与马尔可夫链的匹配度
$oddsItsGoodText = Gibberish::test($inputText, $matrix_file, true);

是谁创建的?

最初由Rob Renaud用Python编写。

由Oliver Lillie翻译成PHP。

由Richard512改进