sanskritick/laraocr

使用Tesseract等不同OCR引擎的Laravel光学字符识别(OCR)包

1.0.1 2021-01-08 08:00 UTC

This package is auto-updated.

Last update: 2024-09-08 15:41:42 UTC


README

Laravel Optical Character Reader(OCR)包,底层使用Tesseract等OCR引擎。

特性

  1. 使用WebUI/编程接口从图片中读取文本
  2. 可以作为Laravel Facade使用
  3. 可配置和可扩展

要求

OCR引擎Tesseract应安装在系统上(例如,对于Ubuntu:sudo apt-get install tesseract-ocr)。请遵循Tesseract安装指南在此处。请确保您在命令行中可以使用tesseract命令。

安装

在您的Laravel项目根目录中执行以下命令以安装此包

composer require sanskritick/laraocr

然后,使用php artisan vendor:publish命令发布此包

这就完成了!

用法

此包可用于从图片读取文本,可以通过Web和编程等多种类型的接口使用。

编程

您可以从代码的任何位置简单地访问OCR外观来扫描图像,如下所示

\OCR::scan($imagePath);

WebUI

在此包成功安装后,我们已经有了一个Web界面来解析图像中的文本。只需转到{project-url}/ocr,选择您的图像,然后点击解析图像按钮。

select_image

上传图像

selected_image

上传的图像

output

解析的文本

愿望清单

  • Artisan命令从CLI读取图像并显示解析的文本
  • RESTful API接受图像并返回解析的文本
  • 多语言支持
  • 添加OCR引擎中已有的更多选项

贡献

任何人都可以随时为该项目做出贡献。如果您想

  1. 只需创建一个issue(即使您想修复该问题)。
  2. 修复任何问题或添加任何新功能后,只需发送一个pull request
  3. 我将很高兴添加您的代码以改进该项目。谢谢...

许可

此包采用Apache License, Version 2.0许可。