sturt / salary
从图像中解析工资条,获取工资金额
v1.0.0
2018-12-16 07:05 UTC
Requires
- php: >=7.0
- thiagoalessio/tesseract_ocr: ^2.7
This package is auto-updated.
Last update: 2024-09-08 03:21:22 UTC
README
从图像格式工资条中提取工资真实数值
安装
爬虫需要 PHP 7.1 或 7.2。这个版本仅支持 Laravel 5.5 或 5.6。
要获取最新版本,只需使用 Composer 引入项目。
通过 Composer
$ composer require sturt/salary
安装后,如果您不使用自动包发现,则需要将 sturt\salary\SalaryServiceProvider::class,
服务提供者在您的 config/app.php
中注册。
配置
爬虫支持可选配置。
要开始,您需要发布所有供应商资产
$ php artisan vendor:publish
这将在您的应用中创建一个 config/sa.php
文件,您可以修改它来设置配置。同时,请确保检查此包中原始配置文件在版本间的更改。
配置
从配置中打开 sa.php
return [
// add more patterns if needed
'patterns' => [
'net pay',
'et pay',
'net payable',
'gross pay',
'total pay',
'net pay',
],
// Image file stored path
'FILE_PATH' => base_path() ."/public/uploads/",
//Change Route ULR
'ROUTE_NAME' => 'upload_salary_slip',
// Change Language - More language coming soon
'OCR_LANG' => 'eng',
];
用法
get request to /upload_salary_slip/file.jpg located in public/uploads/
输出
成功
{"status":200,"salary":"35,430.00"}
文件未找到
{"status":204,"file_not_found":"\/public\/file Not found"}
注意 Windows 用户
有许多方法可以安装 Tesseract OCR 到您的系统,但如果您只是想要快速启动,我推荐使用 Capture2Text 包与 Chocolatey。
choco install capture2text --version 3.9
⚠️ Capture2Text 的最新版本已停止提供 tesseract
二进制文件。
注意 macOS 用户
使用 MacPorts,您可以按如下方式安装对单个语言的支持
$ sudo port install tesseract-<langcode>
但是,使用 Homebrew 则不可行。它默认仅提供 英语 支持,因此如果您打算使用其他语言,最快的解决方案是安装所有语言。
$ brew install tesseract --with-all-languages
许可证
tesseract-ocr-for-php 采用 MIT 许可证 发布。