ddeboer / tesseract
为 Tesseract OCR 引擎提供的包装器
1.1
2013-06-26 21:04 UTC
Requires
This package is auto-updated.
Last update: 2024-09-06 08:56:10 UTC
README
Tesseract:Tesseract OCR 引擎的包装器
一个小型PHP >=5.3库,它使得使用开源Tesseract OCR 引擎更容易。
安装
您需要一个可工作的Tesseract安装。有关安装和添加语言支持的信息,请参阅Tesseract的README。
然后通过Composer安装此库,它可在Packagist上找到
$ composer require ddeboer/tesseract:1.0
使用方法
如果 tesseract
二进制文件在您的路径中,只需做
use Ddeboer\Tesseract\Tesseract; $tesseract = new Tesseract();
否则,使用二进制文件路径构建Tesseract
$tesseract = new Tesseract('/usr/local/bin/tesseract');
获取版本和受支持的语言信息
$version = $tesseract->getVersion(); $languages = $tesseract->getSupportedLanguages();
对图像文件执行OCR
$text = $tesseract->recognize('myfile.tif');
可选地,指定语言(们)作为第二个参数
$text = $tesseract->recognize('myfile.tif', array('nld', 'eng'));
并指定Tesseract的页面分割模式作为第三个参数
$text = $tesseract->recognize('myfile.tif', null, Tesseract::PAGE_SEG_MODE_AUTOMATIC_OSD);