sturt/salary

从图像中解析工资条,获取工资金额

v1.0.0 2018-12-16 07:05 UTC

This package is auto-updated.

Last update: 2024-09-08 03:21:22 UTC


README

从图像格式工资条中提取工资真实数值

安装

爬虫需要 PHP 7.1 或 7.2。这个版本仅支持 Laravel 5.5 或 5.6。

要获取最新版本,只需使用 Composer 引入项目。

通过 Composer

$ composer require sturt/salary

安装后,如果您不使用自动包发现,则需要将 sturt\salary\SalaryServiceProvider::class, 服务提供者在您的 config/app.php 中注册。

配置

爬虫支持可选配置。

要开始,您需要发布所有供应商资产

$ php artisan vendor:publish

这将在您的应用中创建一个 config/sa.php 文件,您可以修改它来设置配置。同时,请确保检查此包中原始配置文件在版本间的更改。

配置

从配置中打开 sa.php

return [
    // add more patterns if needed
    'patterns'      =>  [
        'net pay',
        'et pay',
        'net payable',
        'gross pay',
        'total pay',
        'net pay',
    ],

    // Image file stored path
    
    'FILE_PATH'     =>   base_path() ."/public/uploads/",
    
    //Change Route ULR
    
    'ROUTE_NAME'    =>  'upload_salary_slip',

    // Change Language - More language coming soon
    'OCR_LANG'      =>  'eng',

]; 

用法

get request to /upload_salary_slip/file.jpg located in public/uploads/

输出

成功

{"status":200,"salary":"35,430.00"}

文件未找到

{"status":204,"file_not_found":"\/public\/file Not found"}

注意 Windows 用户

有许多方法可以安装 Tesseract OCR 到您的系统,但如果您只是想要快速启动,我推荐使用 Capture2Text 包与 Chocolatey

choco install capture2text --version 3.9

⚠️ Capture2Text 的最新版本已停止提供 tesseract 二进制文件。


注意 macOS 用户

使用 MacPorts,您可以按如下方式安装对单个语言的支持

$ sudo port install tesseract-<langcode>

但是,使用 Homebrew 则不可行。它默认仅提供 英语 支持,因此如果您打算使用其他语言,最快的解决方案是安装所有语言。

$ brew install tesseract --with-all-languages

许可证

tesseract-ocr-for-php 采用 MIT 许可证 发布。