ddeboer/tesseract

为 Tesseract OCR 引擎提供的包装器

1.1 2013-06-26 21:04 UTC

This package is auto-updated.

Last update: 2024-09-06 08:56:10 UTC


README

Build Status

Tesseract:Tesseract OCR 引擎的包装器

一个小型PHP >=5.3库,它使得使用开源Tesseract OCR 引擎更容易。

安装

您需要一个可工作的Tesseract安装。有关安装和添加语言支持的信息,请参阅Tesseract的README

然后通过Composer安装此库,它可在Packagist上找到

$ composer require ddeboer/tesseract:1.0

使用方法

如果 tesseract 二进制文件在您的路径中,只需做

use Ddeboer\Tesseract\Tesseract;

$tesseract = new Tesseract();

否则,使用二进制文件路径构建Tesseract

$tesseract = new Tesseract('/usr/local/bin/tesseract');

获取版本和受支持的语言信息

$version = $tesseract->getVersion();

$languages = $tesseract->getSupportedLanguages();

对图像文件执行OCR

$text = $tesseract->recognize('myfile.tif');

可选地,指定语言(们)作为第二个参数

$text = $tesseract->recognize('myfile.tif', array('nld', 'eng'));

并指定Tesseract的页面分割模式作为第三个参数

$text = $tesseract->recognize('myfile.tif', null, Tesseract::PAGE_SEG_MODE_AUTOMATIC_OSD);