hamidgh83/language-detection

PHP 语言检测库。可以从给定的文本字符串中检测语言。

v3.5.5 2022-04-29 08:30 UTC

This package is auto-updated.

Last update: 2024-09-29 05:02:09 UTC


README

Version Total Downloads Dependents License

language-detection

这是对 language-detection 的扩展,您可以在那里找到它的文档。

此库可以检测给定文本字符串的语言。它可以解析给定的训练文本到许多不同的语法的 N-gram 序列中,并构建一个 JSON 格式的数据库文件,用于检测阶段。然后它可以读取给定的文本并使用训练阶段生成的数据库来检测其语言。该库附带用于训练和检测 110 种语言的文本样本。

使用 Composer 安装

注意:此库需要启用 多字节字符串 扩展才能工作。

$ composer require hamidgh83/language-detection

基本用法

此库的基本用法与原始库相同,但已添加以下方法:

bestResult()

返回最佳结果字符串。

$ld->detect('Mag het een onsje meer zijn?')->bestResult();

结果

string(2) "nl"

getSupportLanguages()

此方法返回一个支持的语言数组。

$ld->getSupportLanguages();

结果

Array
(
    0 => ab
    1 => af
    2 => am
    3 => ar
    4 => ay
    5 => az-Cyrl
    6 => az-Latn
    7 => be
    8 => bg
    9 => bi
    10 => bn
    11 => bo
    12 => br
    [...]
)

getLanguageProps($lang)

每种语言都有其自己的属性,您可以按以下方式获取它:

$lng    = new Language();
$result = $lng->detect('This is an example text.');
$props  = $lng->getLanguageProps($result->bestResult());

结果

Array
(
    'props' => Array(
        'language' => 'English',
        'language' => Array (
            'United Kingdom',
            'United States of America'
        ),
        'direction' => 'ltr'
    )
)

支持的语言

该库目前支持 110 种语言。要查看所有支持的语言概述,请参阅 此处