人工智能Java SDK:文字识别(OCR)工具箱
文字识别(OCR)工具箱
文字识别(OCR)目前在多个行业中得到了广泛应用,比如金融行业的单据识别输入,餐饮行业中的发票识别,
交通领域的车票识别,企业中各种表单识别,以及日常工作生活中常用的身份证,驾驶证,护照识别等等。
OCR(文字识别)是目前常用的一种AI能力。
OCR工具箱功能:
- 方向检测
- 0度
- 90度
- 180度
- 270度
图片旋转
文字识别(提供三个模型)
- mobile模型
- light模型
- 服务器端模型
- 版面分析(支持5个类别, 用于配合文字识别,表格识别的流水线处理)
- Text
- Title
- List
- Table
- Figure
- 表格识别
- 生成html表格
- 生成excel文件
运行OCR识别例子
1.1 文字方向检测:
- 例子代码: OcrDetectionExample.java
- 运行成功后,命令行应该看到下面的信息:
[INFO ] - Result image has been saved in: build/output/detect_result.png
[INFO ] - [class: "0", probability: 1.00000, bounds: [x=0.073, y=0.069, width=0.275, height=0.026]class: "0", probability: 1.00000, bounds: [x=0.652, y=0.158, width=0.222, height=0.040]class: "0", probability: 1.00000, bounds: [x=0.143, y=0.252, width=0.144, height=0.026]class: "0", probability: 1.00000, bounds: [x=0.628, y=0.328, width=0.168, height=0.026]class: "0", probability: 1.00000, bounds: [x=0.064, y=0.330, width=0.450, height=0.023]
]
- 输出图片效果如下:
1.2 文字方向检测帮助类(增加置信度信息显示,便于调试):
- 例子代码: OcrDetectionHelperExample.java
- 运行成功后,命令行应该看到下面的信息:
[INFO ] - Result image has been saved in: build/output/detect_result_helper.png
[INFO ] - [class: "0 :1.0", probability: 1.00000, bounds: [x=0.073, y=0.069, width=0.275, height=0.026]class: "0 :1.0", probability: 1.00000, bounds: [x=0.652, y=0.158, width=0.222, height=0.040]class: "0 :1.0", probability: 1.00000, bounds: [x=0.143, y=0.252, width=0.144, height=0.026]class: "0 :1.0", probability: 1.00000, bounds: [x=0.628, y=0.328, width=0.168, height=0.026]class: "0 :1.0", probability: 1.00000, bounds: [x=0.064, y=0.330, width=0.450, height=0.023]
]
- 输出图片效果如下:
2. 图片旋转:
每调用一次rotateImg方法,会使图片逆时针旋转90度。
- 例子代码: RotationExample.java
- 旋转前图片:
- 旋转后图片效果如下:
3. 文字识别:
再使用本方法前,请调用上述方法使图片文字呈水平(0度)方向。
- 例子代码: LightOcrRecognitionExample.java
- 运行成功后,命令行应该看到下面的信息:
[INFO ] - [class: "你", probability: -1.0e+00, bounds: [x=0.319, y=0.164, width=0.050, height=0.057]class: "永远都", probability: -1.0e+00, bounds: [x=0.329, y=0.349, width=0.206, height=0.044]class: "无法叫醒一个", probability: -1.0e+00, bounds: [x=0.328, y=0.526, width=0.461, height=0.044]class: "装睡的人", probability: -1.0e+00, bounds: [x=0.330, y=0.708, width=0.294, height=0.043]
]
- 输出图片效果如下:
4. 版面分析:
- 运行成功后,命令行应该看到下面的信息:
[INFO ] - [class: "Text", probability: 0.98750, bounds: [x=0.081, y=0.620, width=0.388, height=0.183]class: "Text", probability: 0.98698, bounds: [x=0.503, y=0.464, width=0.388, height=0.167]class: "Text", probability: 0.98333, bounds: [x=0.081, y=0.465, width=0.387, height=0.121]class: "Figure", probability: 0.97186, bounds: [x=0.074, y=0.091, width=0.815, height=0.304]class: "Table", probability: 0.96995, bounds: [x=0.506, y=0.712, width=0.382, height=0.143]
]
- 输出图片效果如下:
5. 表格识别:
- 运行成功后,命令行应该看到下面的信息:
<html><body><table><thead><tr><td>Methods</td><td>R</td><td>P</td><td>F</td><td>FPS</td></tr></thead><tbody><tr><td>SegLink[26]</td><td>70.0</td><td>86.0</td><td>770</td><td>89</td></tr><tr><td>PixelLink[4j</td><td>73.2</td><td>83.0</td><td>77.8</td><td></td></tr>
...</tbody></table> </body>
</html>
输出图片效果如下:
生成excel效果如下:
目录:
http://www.aias.top/
Git地址:
https://github.com/mymagicpower/AIAS
https://gitee.com/mymagicpower/AIAS
人工智能Java SDK:文字识别(OCR)工具箱相关推荐
- 【图片识别】java 图片文字识别 ocr (转)
http://www.cnblogs.com/inkflower/p/6642264.html 最近在开发的时候需要识别图片中的一些文字,网上找了相关资料之后,发现google有一个离线的工具,以下为 ...
- python批量识别图片中文字_python实现中文图片文字识别--OCR about chinese text--tesseract...
0.我的环境: win7 32bits python 3.5 pycharm 5.0 1.相关库 安装pillow: pip install pillow 安装tesseract: 自带了英文语言包, ...
- java实现自动识别验证码并自动填写提交(调用百度通用文字识别OCR接口+大图找小图之图像识别算法+模拟鼠标键盘动作)
一.使用的技术: 1.调用百度AI通用文字识别OCR接口 2.图像识别算法 二.实现方案与步骤: 1.得到验证码的图片的坐标:先将验证码截图,然后再对整个电脑屏幕截图,通过大图找小图的方法,计算出小图 ...
- html识别文字转语音,万能君工具箱v1.8 - 基于百度AI实现语音转文字/文字转语音/文字识别OCR/翻译...
一.需求分析 1.音频转文字:目前市面上的音频转文字大多收费.音频转文字的需求是:上传一段音频,直接识别成文字,对于会议记录的比较好使,注意不是实时的语音识别. 2.文字转语音:转的语音不要太生硬. ...
- 通用文字识别 OCR 等免费 API 大全分享
智能识别 OCR 类 API 通用文字识别OCR:多场景.多语种.高精度的整图文字检测和识别服务,多项指标行业领先,可识别中.英.日.韩.法.德多种语言. 二维码识别OCR:对图片中的二维码.条形码进 ...
- attention 文字识别算法_支持40种语言的图片文字识别(OCR)项目
Hi!大家好呀!我是你们努力的喵哥! OCR(光学字符识别)是我们日常很常用的人工智能技术.我们总会有从图片中提取文字的需求.你是不是有需要从图片复制文字的经历?手打是最低效的选择.我们可以使用 OC ...
- python图片转文字easyocr_支持40种语言的图片文字识别(OCR)项目
Hi!大家好呀!我是你们努力的喵哥! OCR(光学字符识别)是我们日常很常用的人工智能技术.我们总会有从图片中提取文字的需求.你是不是有需要从图片复制文字的经历?手打是最低效的选择.我们可以使用 OC ...
- 微信小程序整合百度文字识别OCR
本文介绍 之前有过一点小程序的学习,并最近写的项目有用到识别图片中的文字的场景,但是又不想花钱,就千方百计的找白嫖资源,经过一天的折磨,终于找到了白嫖的方法(百度智能云),虽说是白嫖,但也是有次数 ...
- JAVA-调用百度文字识别OCR进行身份证识别
1.第三方接口 文字识别OCR,需要进行注册和实名认证后,获取对应的应用列表以及免费测试额度 2.调用例子 <!-- 百度识别 --> <dependency> ...
- 吴恩达《Machine Learning》精炼笔记 12:大规模机器学习和图片文字识别 OCR
作者 | Peter 编辑 | AI有道 系列文章: 吴恩达<Machine Learning>精炼笔记 1:监督学习与非监督学习 吴恩达<Machine Learning>精 ...
最新文章
- AI一分钟 | ​被大家吐槽的网红机器人索菲亚开微博了;阿里人工智能团队iDST获得道路场景分割三项第一
- 分布式存储的三个基本问题
- 深度学习入门篇--手把手教你用 TensorFlow 训练模型
- 池州天气预报软件测试,池州天气预报15天
- SQL Server 中使用 Try Catch 处理异常
- 消息长度_填坑笔记:RocketMQ消息订阅失败问题?
- windows server 触屏_宜昌触屏万能蒸烤箱价格-华春新能源有限公司
- 阅文集团副总裁傅徐军:最佳技术架构选型方法论
- ios---NSNotificationCenter传值
- 华为方舟编译器 下载 和 LiteOS Studio Setup 2019-04-16.exe SDK下载
- 我的CSDN原创高质量免积分下载资源列表(持续更新)
- STM32——蜂鸣器示例代码
- 北大飞跃手册_飞跃手册 | 保研篇——北京大学
- 送 9 个漫步者蓝牙耳机,程序员听歌神器
- 查看文件夹和文件大小
- 画基因结构图 gggenes 用法
- 网钛CMS采集插件-无需登陆自动采集发布插件
- 8.4 向量应用(二)——空间直线
- 卡巴斯基联手功夫巨星成龙 五月鸟巢开唱
- ae计算机配置要求,CG馒头分享AE cs6对电脑所需配置需求