zoujingli/ip2region

PHP版的Ip2Region

v2.0.6 2024-08-02 01:01 UTC

README

Latest Stable Version Total Downloads Monthly Downloads Daily Downloads PHP Version Require License

本库基于ip2region简单整合,方便PHP项目使用Composer来安装。

通过Composer安装

composer require zoujingli/ip2region

在项目中快速调用

$ip2region = new \Ip2Region();
$result = $ip2region->simple('8.8.8.8');
var_dump($result);

// 高级用法可以直接调用 XdbSearcher 类。

Ip2region是什么

ip2region v2.0 - 是一个离线IP地址定位库和IP定位数据管理框架,10微秒级别的查询效率,提供了众多主流编程语言的xdb数据生成和查询客户端实现。

Ip2region特性

1、标准化的数据格式

每个ip数据段的region信息都固定了格式:国家|区域|省份|城市|ISP,只有中国的数据绝大部分精确到了城市,其他国家部分数据只能定位到国家,前面的选项全部是0。

2、数据去重和压缩

xdb格式生成程序会自动去重和压缩部分数据,默认的全部IP数据,生成的ip2region.xdb数据库是11MiB,随着数据的详细度增加数据库的大小也慢慢增大。

3、极速查询响应

即使是完全基于xdb文件的查询,单次查询响应时间在十微秒级别,可通过如下两种方式开启内存加速查询:

  1. vIndex索引缓存:使用固定的512KiB的内存空间缓存vector index数据,减少一次IO磁盘操作,保持平均查询效率稳定在10-20微秒之间。
  2. xdb整个文件缓存:将整个xdb文件全部加载到内存,内存占用等同于xdb文件大小,无磁盘IO操作,保持微秒级别的查询效率。

4、IP数据管理框架

v2.0格式的xdb支持亿级别的IP数据段行数,region信息也可以完全自定义,例如:你可以在region中追加特定业务需求的数据,例如:GPS信息/国际统一地域信息编码/邮编等。也就是你完全可以使用ip2region来管理你自己的IP定位数据。

xdb数据查询

API介绍,使用文档和测试程序请参考对应searcher查询客户端下的ReadMe介绍,全部查询binding实现情况如下:

xdb数据生成

API介绍,使用文档和测试程序请参考对应maker生成程序下的ReadMe介绍,全部生成maker实现情况如下:

并发查询必读

全部查询客户端的search接口都不是并发安全的实现,不同进程/线程/协程需要通过创建不同的查询对象来安全使用,并发量很大的情况下,基于文件查询的方式可能会导致打开文件数过多的错误,请修改内核的最大允许打开文件数(fs.file-max=一个更高的值),或者将整个xdb加载到内存进行安全并发使用。

相关备注

1、使用声明

ip2region重点在于研究IP定位数据的存储设计和各种语言的查询实现,并没有原始IP数据的支撑,本项目不保证及时的数据更新,没有也不会有商用版本,你可以使用自定义的数据导入ip2region进行管理。

2、技术交流

ip2region微信交流群,请先加微信:lionsoul2014 (请备注ip2region)

3、数据更新

基于检测算法的数据更新方式视频分享:数据更新实现视频分享 - part1数据更新实现视频分享 - part2

4、数据结构

  1. xdb数据结构分析:“ip2region xdb 数据结构和查询过程详解”
  2. xdb查询过程分析:“ip2region xdb 数据结构和查询过程详解”
  3. xdb生成过程分析:“ip2region xdb 二进制数据生成过程详解”

关于ip2region v2.0的PHP用法

完全基于文件的查询

$dbFile = "ip2region.xdb file path";
try {
    $searcher = XdbSearcher::newWithFileOnly($dbFile);
} catch (Exception $e) {
    printf("failed to create searcher with '%s': %s\n", $dbFile, $e);
    return;
}

$ip = '1.2.3.4';
$sTime = XdbSearcher::now();
$region = $searcher->search($ip);
if ($region === null) {
    // something is wrong
    printf("failed search(%s)\n", $ip);
    return;
}

printf("{region: %s, took: %.5f ms}\n", $region, XdbSearcher::now() - $sTime);

// 备注:并发使用,每个线程或者协程需要创建一个独立的 searcher 对象。

缓存VectorIndex索引

如果你的php母环境支持,可以预先加载vectorIndex缓存,然后做成全局变量,每次创建Searcher的时候使用全局的vectorIndex,可以减少一次固定的IO操作从而加速查询,减少io压力。

// 1、从 dbPath 加载 VectorIndex 缓存,把下述的 vIndex 变量缓存到内存里面。
$vIndex = XdbSearcher::loadVectorIndexFromFile($dbPath);
if ($vIndex === null) {
    printf("failed to load vector index from '%s'\n", $dbPath);
    return;
}

// 2、使用全局的 vIndex 创建带 VectorIndex 缓存的查询对象。
try {
    $searcher = XdbSearcher::newWithVectorIndex($dbFile, $vIndex);
} catch (Exception $e) {
    printf("failed to create vectorIndex cached searcher with '%s': %s\n", $dbFile, $e);
    return;
}

// 3、查询
$sTime = XdbSearcher::now();
$region = $searcher->search('1.2.3.4');
if ($region === null) {
    printf("failed search(1.2.3.4)\n");
    return;
}

printf("{region: %s, took: %.5f ms}\n", $region, XdbSearcher::now() - $sTime);

// 备注:并发使用,每个线程或者协程需要创建一个独立的 searcher 对象,但是都共享统一的只读 vectorIndex。

缓存整个xdb数据

如果你的PHP母环境支持,可以预先加载整个xdb的数据到内存,这样可以实现完全基于内存的查询,类似之前的memory search查询。

// 1、从 dbPath 加载整个 xdb 到内存。
$cBuff = XdbSearcher::loadContentFromFile($dbPath);
if ($cBuff === null) {
    printf("failed to load content buffer from '%s'\n", $dbPath);
    return;
}

// 2、使用全局的 cBuff 创建带完全基于内存的查询对象。
try {
    $searcher = XdbSearcher::newWithBuffer($cBuff);
} catch (Exception $e) {
    printf("failed to create buffer cached searcher: %s\n", $dbFile, $e);
    return;
}

// 3、查询
$sTime = XdbSearcher::now();
$region = $searcher->search('1.2.3.4');
if ($region === null) {
    printf("failed search(1.2.3.4)\n");
    return;
}

printf("{region: %s, took: %.5f ms}\n", $region, XdbSearcher::now() - $sTime);

// 备注:并发使用,用整个 xdb 缓存创建的 searcher 对象可以安全用于并发。

查询测试

通过search_test.php脚本来进行查询测试:

➜  php git:(v2.0_xdb) ✗ php ./search_test.php
php ./search_test.php [command options]
options:
 --db string             ip2region binary xdb file path
 --cache-policy string   cache policy: file/vectorIndex/content

例如:使用默认的data/ip2region.xdb进行查询测试:

➜  php git:(v2.0_xdb) ✗ php ./search_test.php --db=../../data/ip2region.xdb --cache-policy=vectorIndex
ip2region xdb searcher test program, cachePolicy: vectorIndex
type 'quit' to exit
ip2region>> 1.2.3.4
{region: 美国|0|华盛顿|0|谷歌, ioCount: 7, took: 0.04492 ms}
ip2region>> 

输入ip即可进行查询测试。也可以分别设置cache-policy为file/vectorIndex/content来测试三种不同缓存实现的效率。

bench测试

通过bench_test.php脚本来进行自动bench测试,一方面确保xdb文件没有错误,另一方面通过大量的查询测试平均查询性能:

➜  php git:(v2.0_xdb) ✗ php ./bench_test.php
php ./bench_test.php [command options]
options:
 --db string             ip2region binary xdb file path
 --src string            source ip text file path
 --cache-policy string   cache policy: file/vectorIndex/content

例如:通过默认的data/ip2region.xdb和data/ip.merge.txt进行bench测试:

➜  php git:(v2.0_xdb) ✗ php ./bench_test.php --db=../../data/ip2region.xdb --src=../../data/ip.merge.txt --cache-policy=vectorIndex
Bench finished, {cachePolicy: vectorIndex, total: 3417955, took: 15s, cost: 0.005 ms/op}

可以通过设置cache-policy参数来分别测试file/vectorIndex/content三种不同的缓存实现的性能。@Note:请注意bench使用的src文件需要是生成对应的xdb文件的相同的源文件。