文字识别(OCR)工具箱

文字识别(OCR)目前在多个行业中得到了广泛应用,比如金融行业的单据识别输入,餐饮行业中的发票识别,
交通领域的车票识别,企业中各种表单识别,以及日常工作生活中常用的身份证,驾驶证,护照识别等等。
OCR(文字识别)是目前常用的一种AI能力。

OCR工具箱功能:

  1. 方向检测
  • 0度
  • 90度
  • 180度
  • 270度
  1. 图片旋转

  2. 文字识别(提供三个模型)

  • mobile模型
  • light模型
  • 服务器端模型
  1. 版面分析(支持5个类别, 用于配合文字识别,表格识别的流水线处理)
  • Text
  • Title
  • List
  • Table
  • Figure
  1. 表格识别
  • 生成html表格
  • 生成excel文件

运行OCR识别例子

1.1 文字方向检测:

  • 例子代码: OcrDetectionExample.java
  • 运行成功后,命令行应该看到下面的信息:
[INFO ] - Result image has been saved in: build/output/detect_result.png
[INFO ] - [class: "0", probability: 1.00000, bounds: [x=0.073, y=0.069, width=0.275, height=0.026]class: "0", probability: 1.00000, bounds: [x=0.652, y=0.158, width=0.222, height=0.040]class: "0", probability: 1.00000, bounds: [x=0.143, y=0.252, width=0.144, height=0.026]class: "0", probability: 1.00000, bounds: [x=0.628, y=0.328, width=0.168, height=0.026]class: "0", probability: 1.00000, bounds: [x=0.064, y=0.330, width=0.450, height=0.023]
]
  • 输出图片效果如下:

1.2 文字方向检测帮助类(增加置信度信息显示,便于调试):

  • 例子代码: OcrDetectionHelperExample.java
  • 运行成功后,命令行应该看到下面的信息:
[INFO ] - Result image has been saved in: build/output/detect_result_helper.png
[INFO ] - [class: "0 :1.0", probability: 1.00000, bounds: [x=0.073, y=0.069, width=0.275, height=0.026]class: "0 :1.0", probability: 1.00000, bounds: [x=0.652, y=0.158, width=0.222, height=0.040]class: "0 :1.0", probability: 1.00000, bounds: [x=0.143, y=0.252, width=0.144, height=0.026]class: "0 :1.0", probability: 1.00000, bounds: [x=0.628, y=0.328, width=0.168, height=0.026]class: "0 :1.0", probability: 1.00000, bounds: [x=0.064, y=0.330, width=0.450, height=0.023]
]
  • 输出图片效果如下:

2. 图片旋转:

每调用一次rotateImg方法,会使图片逆时针旋转90度。

  • 例子代码: RotationExample.java
  • 旋转前图片:
  • 旋转后图片效果如下:

3. 文字识别:

再使用本方法前,请调用上述方法使图片文字呈水平(0度)方向。

  • 例子代码: LightOcrRecognitionExample.java
  • 运行成功后,命令行应该看到下面的信息:
[INFO ] - [class: "你", probability: -1.0e+00, bounds: [x=0.319, y=0.164, width=0.050, height=0.057]class: "永远都", probability: -1.0e+00, bounds: [x=0.329, y=0.349, width=0.206, height=0.044]class: "无法叫醒一个", probability: -1.0e+00, bounds: [x=0.328, y=0.526, width=0.461, height=0.044]class: "装睡的人", probability: -1.0e+00, bounds: [x=0.330, y=0.708, width=0.294, height=0.043]
]
  • 输出图片效果如下:

4. 版面分析:

  • 运行成功后,命令行应该看到下面的信息:
[INFO ] - [class: "Text", probability: 0.98750, bounds: [x=0.081, y=0.620, width=0.388, height=0.183]class: "Text", probability: 0.98698, bounds: [x=0.503, y=0.464, width=0.388, height=0.167]class: "Text", probability: 0.98333, bounds: [x=0.081, y=0.465, width=0.387, height=0.121]class: "Figure", probability: 0.97186, bounds: [x=0.074, y=0.091, width=0.815, height=0.304]class: "Table", probability: 0.96995, bounds: [x=0.506, y=0.712, width=0.382, height=0.143]
]
  • 输出图片效果如下:

5. 表格识别:

  • 运行成功后,命令行应该看到下面的信息:
<html><body><table><thead><tr><td>Methods</td><td>R</td><td>P</td><td>F</td><td>FPS</td></tr></thead><tbody><tr><td>SegLink[26]</td><td>70.0</td><td>86.0</td><td>770</td><td>89</td></tr><tr><td>PixelLink[4j</td><td>73.2</td><td>83.0</td><td>77.8</td><td></td></tr>
...</tbody></table> </body>
</html>
  • 输出图片效果如下:

  • 生成excel效果如下:

目录:

http://www.aias.top/

Git地址:

https://github.com/mymagicpower/AIAS
https://gitee.com/mymagicpower/AIAS

人工智能Java SDK:文字识别(OCR)工具箱相关推荐

  1. 【图片识别】java 图片文字识别 ocr (转)

    http://www.cnblogs.com/inkflower/p/6642264.html 最近在开发的时候需要识别图片中的一些文字,网上找了相关资料之后,发现google有一个离线的工具,以下为 ...

  2. python批量识别图片中文字_python实现中文图片文字识别--OCR about chinese text--tesseract...

    0.我的环境: win7 32bits python 3.5 pycharm 5.0 1.相关库 安装pillow: pip install pillow 安装tesseract: 自带了英文语言包, ...

  3. java实现自动识别验证码并自动填写提交(调用百度通用文字识别OCR接口+大图找小图之图像识别算法+模拟鼠标键盘动作)

    一.使用的技术: 1.调用百度AI通用文字识别OCR接口 2.图像识别算法 二.实现方案与步骤: 1.得到验证码的图片的坐标:先将验证码截图,然后再对整个电脑屏幕截图,通过大图找小图的方法,计算出小图 ...

  4. html识别文字转语音,万能君工具箱v1.8 - 基于百度AI实现语音转文字/文字转语音/文字识别OCR/翻译...

    一.需求分析 1.音频转文字:目前市面上的音频转文字大多收费.音频转文字的需求是:上传一段音频,直接识别成文字,对于会议记录的比较好使,注意不是实时的语音识别. 2.文字转语音:转的语音不要太生硬. ...

  5. 通用文字识别 OCR 等免费 API 大全分享

    智能识别 OCR 类 API 通用文字识别OCR:多场景.多语种.高精度的整图文字检测和识别服务,多项指标行业领先,可识别中.英.日.韩.法.德多种语言. 二维码识别OCR:对图片中的二维码.条形码进 ...

  6. attention 文字识别算法_支持40种语言的图片文字识别(OCR)项目

    Hi!大家好呀!我是你们努力的喵哥! OCR(光学字符识别)是我们日常很常用的人工智能技术.我们总会有从图片中提取文字的需求.你是不是有需要从图片复制文字的经历?手打是最低效的选择.我们可以使用 OC ...

  7. python图片转文字easyocr_支持40种语言的图片文字识别(OCR)项目

    Hi!大家好呀!我是你们努力的喵哥! OCR(光学字符识别)是我们日常很常用的人工智能技术.我们总会有从图片中提取文字的需求.你是不是有需要从图片复制文字的经历?手打是最低效的选择.我们可以使用 OC ...

  8. 微信小程序整合百度文字识别OCR

    本文介绍 ​ 之前有过一点小程序的学习,并最近写的项目有用到识别图片中的文字的场景,但是又不想花钱,就千方百计的找白嫖资源,经过一天的折磨,终于找到了白嫖的方法(百度智能云),虽说是白嫖,但也是有次数 ...

  9. JAVA-调用百度文字识别OCR进行身份证识别

    1.第三方接口         文字识别OCR,需要进行注册和实名认证后,获取对应的应用列表以及免费测试额度 2.调用例子  <!-- 百度识别 --> <dependency> ...

  10. 吴恩达《Machine Learning》精炼笔记 12:大规模机器学习和图片文字识别 OCR

    作者 | Peter 编辑 | AI有道 系列文章: 吴恩达<Machine Learning>精炼笔记 1:监督学习与非监督学习 吴恩达<Machine Learning>精 ...

最新文章

  1. AI一分钟 | ​被大家吐槽的网红机器人索菲亚开微博了;阿里人工智能团队iDST获得道路场景分割三项第一
  2. 分布式存储的三个基本问题
  3. 深度学习入门篇--手把手教你用 TensorFlow 训练模型
  4. 池州天气预报软件测试,池州天气预报15天
  5. SQL Server 中使用 Try Catch 处理异常
  6. 消息长度_填坑笔记:RocketMQ消息订阅失败问题?
  7. windows server 触屏_宜昌触屏万能蒸烤箱价格-华春新能源有限公司
  8. 阅文集团副总裁傅徐军:最佳技术架构选型方法论
  9. ios---NSNotificationCenter传值
  10. 华为方舟编译器 下载 和 LiteOS Studio Setup 2019-04-16.exe SDK下载
  11. 我的CSDN原创高质量免积分下载资源列表(持续更新)
  12. STM32——蜂鸣器示例代码
  13. 北大飞跃手册_飞跃手册 | 保研篇——北京大学
  14. 送 9 个漫步者蓝牙耳机,程序员听歌神器
  15. 查看文件夹和文件大小
  16. 画基因结构图 gggenes 用法
  17. 网钛CMS采集插件-无需登陆自动采集发布插件
  18. 8.4 向量应用(二)——空间直线
  19. 卡巴斯基联手功夫巨星成龙 五月鸟巢开唱
  20. ae计算机配置要求,CG馒头分享AE cs6对电脑所需配置需求

热门文章

  1. 故障:卡死原因及解决
  2. 从管易云·奇门到微盟通过接口配置打通数据
  3. 【C++】memset函数
  4. kubernetes搭建 二、Etcd集群
  5. 经纬度坐标转化为XYZ坐标的理解
  6. Eclipse Virgo插件
  7. 应用市场上架注册企业级账号
  8. JSD-2204-API-多线程-Day06
  9. java aarch64_aarch64环境下,搭建并配置服务器tomcat:
  10. 基于云平台的物联网架构和原理