gmo/language-detection

此包的最新版本(v2.0.0)没有可用的许可证信息。

语言检测库

v2.0.0 2018-06-25 20:18 UTC

This package is auto-updated.

Last update: 2024-08-26 09:14:37 UTC


README

这是一个用于检测文本语言的语言检测库。支持拉丁语和非拉丁语。返回 ISO-639-1 语言代码和 % 置信度。如果无法检测到语言,则返回空值作为语言代码。

为了检测拉丁语,必须安装基于 Python 的服务守护进程。安装程序支持 SystemV 和 Upstart 来运行守护进程。

安装

composer install sudo vendor/bin/install-ldig.sh install

或者

composer install sudo vendor/bin/install-ldig.sh install upstart

用法

$detector = GMO\LanguageDetection\Detector();
$language = $detector->detect('Bienvenidos');
$languageCode = $language->getCode();       // "es"
$confidence = $language->getConfidence();       // 0.999999

ldig

基于拉丁语的语言检测基于 ldig 库。

我从以下网址获取了 ldig 代码: https://github.com/shuyo/ldig 我基于 ldig/ldig.py 和 ldig/server.py 中的代码创建了 ldig/detect.py 和 ldig/detectServer.py 脚本。这些脚本是为了使其更适用于日常使用。

待办事项

  • 为 libs/ldig/install-ldig.sh 添加卸载器
  • 添加更多测试用例