textualization / ropherta
使用ONNX框架计算RoBERTa嵌入。
v0.0.11
2024-04-29 13:11 UTC
Requires
- ankane/onnxruntime: v0.1.7
- textualization/ropherta-tokenizer: v0.0.7
Requires (Dev)
- phpunit/phpunit: ^9.5.8
README
这将为PHP世界带来Transformers的强大功能。
安装
将此项目添加到您的依赖中
composer require textualization/ropherta
composer update
在使用之前,您需要安装ONNX框架
composer exec -- php -r "require 'vendor/autoload.php'; OnnxRuntime\Vendor::check();"
并下载RoBERTa ONNX模型(这需要一些时间,模型大小为477Mb)
composer exec -- php -r "require 'vendor/autoload.php'; Textualization\Ropherta\Vendor::check();"
计算嵌入
$model = new RophertaModel(); $emb = $model->embeddings("Text");
检查 \Textualization\Ropherta\Distances
来检查两个嵌入是否彼此更接近。
使用自定义嵌入
$model = new RophertaModel("/path/to/model.onnx"); $emb = $model->embeddings("Text");
要微调模型,您需要一个大量领域文本并在具有GPU的机器上使用Python。有关详细信息,请参阅tuning。
赞助商
我们感谢我们的赞助商