mehrab-wj / tiktoken-php
python tiktoken 的克隆版,适用于 PHP!适用于与 OpenAI 模型一起使用的快速 BPE 标记化器。
v1.0.0
2023-04-19 18:36 UTC
Requires
- php: ^8.1
- ext-mbstring: *
Requires (Dev)
- friendsofphp/php-cs-fixer: ^3.14
- phpstan/phpstan: ^1.9
- phpunit/phpunit: ^9.5
- rector/rector: ^0.15.12
- symfony/var-dumper: ^6.2
README
适用于 GPT 模型的 PHP 文本标记器
关于
一个 PHP 工具包,用于将文本标记化,就像 GPT 系列模型处理文本一样。
从 semji/gpt3-tokenizer-php 分支而来,用于修复错误和改进。
要求
- PHP 8.1
- mbstring 扩展 在此处详细了解如何安装 mbstring
用法
首先使用 composer 安装包
composer require mehrab-wj/tiktoken-php
use TikToken\Encoder; $prompt = "Ai is cool"; $encoder = new Encoder(); $tokens = $encoder->encode($prompt); // [32, 72, 318, 3608] // Get tokens count: echo count($tokens); // 4