OCR视图识别(Tess4J)

freps / 2024-11-17 / 原文

1.概述

图片文字识别

OCR (Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程

2.Tess4j快速入门

1.导入依赖

    <dependencies>
        <dependency>
            <groupId>net.sourceforge.tess4j</groupId>
            <artifactId>tess4j</artifactId>
            <version>4.1.1</version>
        </dependency>
    </dependencies>

2.用到的资源

https://wwyl.lanzouv.com/iYTJh2d944gj

3.测试