startcodein/indicsoundex

基于Santhosh Thottingal算法的印度语言soundex包。

0.1.0 2015-10-17 07:19 UTC

This package is not auto-updated.

Last update: 2024-09-28 17:54:47 UTC


README

基于Santhosh Thottingal算法的印度语言soundex包。有关算法的更多信息,请查看这里

Soundex是一种音位算法,用于通过在英语中发音来索引名称。本模块实现了适用于英语以及适用于印度语言的改进版Soundex算法。

包括以下印度主要语言

  • 印地语 (hi_IN)
  • 孟加拉语 (bn_IN)
  • 旁遮普语 (pa_IN)
  • 古吉拉特语 (gu_IN)
  • 奥里亚语 (or_IN)
  • 泰米尔语 (ta_IN)
  • 泰卢固语 (te_IN)
  • 卡纳达语 (kn_IN)
  • 马拉雅拉姆语 (ml_IN)
  • 英语 (en_US)

可以通过包括该语言的soundex字符映射来将其扩展到任何语言。
快速入门

使用git安装

git clone https://github.com/startcodein/IndicSoundex.git

使用composer安装

composer require startcodein/indicsoundex:@dev

生成soundex

<?php 

   use Startcode\IndicSoundex\IndicSoundex as IndicSoundex;
   
   $sound = new IndicSoundex();

   echo $sound->soundex('ಬೆಂಗಳೂರು').PHP_EOL;
   echo $sound->soundex('आम्र् फल्').PHP_EOL;
   echo $sound->soundex('vasudev').PHP_EOL;
   echo $sound->soundex('Rupert्').PHP_EOL;

这将给出以下输出

ಬDNFQCPC
आNPMQ000
v2310000
r1630000

比较字符串soundex

<?php 

   use Startcode\IndicSoundex\IndicSoundex as IndicSoundex;
   
   $sound = new IndicSoundex();

   echo $sound->compare('बॆंगळूरु','आम्र् फल्').PHP_EOL;
   echo $sound->compare('Bangalore','ಬೆಂಗಳೂರು').PHP_EOL;
   echo $sound->compare('बॆंगळूरु','बॆंगळूरु').PHP_EOL;
   echo $sound->compare('അമ്മ','അമ').PHP_EOL;

这将给出如下输出

-1  //Not equal
-1  //Not equal
0   // Same word
1   // Similar
2   //Diff lang similar

许可证

版权(c) 2015 Sanoob Pattanath

本程序是自由软件;您可以在自由软件基金会发布的GNU通用公共许可证的条款下重新分发和/或修改它;许可证版本3,或(按您的选择)任何较新版本。本程序是在希望它有用的希望下分发的,但没有任何保证;甚至没有关于适销性或特定用途适用性的暗示保证。有关更多详细信息,请参阅GNU库通用公共许可证。

贡献

任何形式的贡献都非常欢迎。如果您发现任何错误或安全问题,请通过电子邮件hello[at]pattanath.com或通过github提出问题。