startcodein / indicsoundex
基于Santhosh Thottingal算法的印度语言soundex包。
0.1.0
2015-10-17 07:19 UTC
Requires
- php: >=5.5.9
- ext-mbstring: *
Requires (Dev)
- phpunit/phpunit: 5.0.*
This package is not auto-updated.
Last update: 2024-09-28 17:54:47 UTC
README
基于Santhosh Thottingal算法的印度语言soundex包。有关算法的更多信息,请查看这里
Soundex是一种音位算法,用于通过在英语中发音来索引名称。本模块实现了适用于英语以及适用于印度语言的改进版Soundex算法。
包括以下印度主要语言
- 印地语 (hi_IN)
- 孟加拉语 (bn_IN)
- 旁遮普语 (pa_IN)
- 古吉拉特语 (gu_IN)
- 奥里亚语 (or_IN)
- 泰米尔语 (ta_IN)
- 泰卢固语 (te_IN)
- 卡纳达语 (kn_IN)
- 马拉雅拉姆语 (ml_IN)
- 英语 (en_US)
可以通过包括该语言的soundex字符映射来将其扩展到任何语言。
快速入门
使用git安装
git clone https://github.com/startcodein/IndicSoundex.git
使用composer安装
composer require startcodein/indicsoundex:@dev
生成soundex
<?php
use Startcode\IndicSoundex\IndicSoundex as IndicSoundex;
$sound = new IndicSoundex();
echo $sound->soundex('ಬೆಂಗಳೂರು').PHP_EOL;
echo $sound->soundex('आम्र् फल्').PHP_EOL;
echo $sound->soundex('vasudev').PHP_EOL;
echo $sound->soundex('Rupert्').PHP_EOL;
这将给出以下输出
ಬDNFQCPC
आNPMQ000
v2310000
r1630000
比较字符串soundex
<?php
use Startcode\IndicSoundex\IndicSoundex as IndicSoundex;
$sound = new IndicSoundex();
echo $sound->compare('बॆंगळूरु','आम्र् फल्').PHP_EOL;
echo $sound->compare('Bangalore','ಬೆಂಗಳೂರು').PHP_EOL;
echo $sound->compare('बॆंगळूरु','बॆंगळूरु').PHP_EOL;
echo $sound->compare('അമ്മ','അമ').PHP_EOL;
这将给出如下输出
-1 //Not equal
-1 //Not equal
0 // Same word
1 // Similar
2 //Diff lang similar
许可证
版权(c) 2015 Sanoob Pattanath
本程序是自由软件;您可以在自由软件基金会发布的GNU通用公共许可证的条款下重新分发和/或修改它;许可证版本3,或(按您的选择)任何较新版本。本程序是在希望它有用的希望下分发的,但没有任何保证;甚至没有关于适销性或特定用途适用性的暗示保证。有关更多详细信息,请参阅GNU库通用公共许可证。
贡献
任何形式的贡献都非常欢迎。如果您发现任何错误或安全问题,请通过电子邮件hello[at]pattanath.com或通过github提出问题。