api-skeletons/correct-utf8-encoding

通过检查字符串中的每个字节来纠正错误编码和多次编码的UTF8字符。

1.0.0 2019-01-19 23:51 UTC

This package is auto-updated.

Last update: 2024-08-29 04:54:35 UTC


README

Build Status Gitter Patreon Total Downloads

当UTF-8数据被错误处理时,它可能会变成多次编码。无效UTF-8序列的数据无法正确导入数据库,并在正确编码的网页中显示错误。

该模块提供的类逐字节检查字符串。它不使用预定义序列来匹配数据。相反,它遍历字符串以寻找可能的UTF8数据,并在数据上循环直到生成有效的UTF-8字符。

用法

use ApiSkeletons\Utf8;

$correctUtf8Encoding = new Utf8\CorrectUtf8Encoding();

$validString = $correctUtf8Encoding($invalidString);

评论

这个库与在Packagist上可用的其他UTF8纠正工具不同。这个工具是否比其他产品更好,完全取决于您使用该工具的成功程度。对我来说,这个工具纠正了一个20年的数据集,整个数据库的字段和字节都是逐个纠正的。

请随时通过contact@apiskeletons.com与我们分享使用该工具成功或失败的故事。

纠正整个数据库

有一个配套应用程序使用这个库来纠正整个数据库中的每个无效UTF8字符。请参阅https://github.com/API-Skeletons/utf8convert