最近和朋友聊天,聊到一个充满使命感但又略显心酸的话题——下班回家在网上给小朋友抄题。。。那么问题来了,除了大家所知的QQ文字识别功能之外,还有哪些方式可以做到文字识别呢。

作为一名热心的Python小工,我想这个问题可以尝试着使用Python解决一下,解放双手,搞起……

Google一下,我们发现很多大厂(百度、阿里、腾讯等)都已有相关的API开放使用。那么我们今天就以百度为例,分享下如何使用百度文字识别(OCR)服务实现文字提取,其实三者都尝试过,感觉百度的效果比较好(非评测),所以本文就以百度为例喽。

百度大脑AI开发平台

先简单介绍下百度大脑AI开发平台,首先我们需要注册下AI开发平台用户,非常简单,手机号码注册即可,官网地址如下。

登录后我们可以在控制台看到,开发平台提供的众多服务,其中有文字识别服务。

接下来,我们创建一个文字识别服务应用,如下

简单操作后,我们就可以成功创建一个服务应用,如下,其中AppID、API Key、Secret Key是我们后面调用OCR服务时需要用到的。

接下来,我们看下如何使用Python调用百度OCR服务实现文字提取。

Python实现

安装百度ai接口的Python第三方库

代码设计中的几个核心步骤图片压缩:由于OCR服务对图片大小有限制,因此在使用时若图片大小超过最大限制,要进行压缩处理。

OCR调用:实现利用百度OCR服务提取单张图片文字,返回文字内容。

批量处理:实现N张图片的文字提取,并且保存提取结果到文本文件中。

图片压缩

OCR服务调用

该函数中使用到在上面章节,提到的AppID、API Key、Secret Key信息。

在代码中,我们使用了basicGeneral(通用文字识别),每天免费使用50000次,还有basicAccurate通用文字识别(高精度版),每天免费使用500次。基本满足我们日常使用,若不够,可以再使用其他文字识别服务。

批量处理

通过传入单张图片或多张图片,调用OCR服务实现批量图片文字提取。

效果如何呢

测试图片A

识别结果

我们可以看到,再有背景干扰下,文字识别提取准确率仍可以达到100%。

测试图片B

识别结果

我们可以看到,大量文字中,文字识别提取准确率几乎为100%,且格式仍旧保留。

批量处理结果

我们对测试图片A/B进行批量处理,结果格式如下

若对您有所帮助,欢迎大家评论、留言,私下可获取源码。

python 百度ocr安装_Python利用百度文字识别(OCR)服务实现图片文字提取,准确率超高...相关推荐

  1. python 百度ocr安装_Python基于百度AI实现OCR文字识别

    百度AI功能还是很强大的,百度AI开放平台真的是测试接口的天堂,免费接口很多,当然有量的限制,但个人使用是完全够用的,什么人脸识别.MQTT服务器.语音识别等等,应有尽有. 看看OCR识别免费的量 快 ...

  2. python 百度ocr安装_Python调用百度OCR实现图片文字识别的示例代码

    百度AI提供了一天50000次的免费文字识别额度,可以愉快的免费使用!下面直接上方法: 首先在百度AI创建一个应用,按照下图创建即可,创建后会获得如下: 创建后会获得如下信息: APP_ID = '* ...

  3. python爬取百度地图数据_Python利用百度地图爬取商家信息

    import requests import json import pandas as pd def request_hospital_data(): ak="换成自己的 AK" ...

  4. python批量识别图片中文字_python实现中文图片文字识别--OCR about chinese text--tesseract...

    0.我的环境: win7 32bits python 3.5 pycharm 5.0 1.相关库 安装pillow: pip install pillow 安装tesseract: 自带了英文语言包, ...

  5. 百度文字识别OCR接口使用

    原文:https://www.meiwen.com.cn/subject/cyjvectx.html 动机&成品展示 最近,家里老人有需要把图片里的文字识别读取的功能,想要教他们用市面上功能齐 ...

  6. Android 集成百度文字识别OCR身份证银行卡驾驶证识别

    SDK提供了下列百度AI开放平台RESTful接口的封装.文字识别的服务,可实现一些通用文字,网络图片文字,身份证,银行卡,驾驶证,行驶证,车牌,营业执照,通用票据等的识别需求,简化输入操作. 本篇主 ...

  7. java实现自动识别验证码并自动填写提交(调用百度通用文字识别OCR接口+大图找小图之图像识别算法+模拟鼠标键盘动作)

    一.使用的技术: 1.调用百度AI通用文字识别OCR接口 2.图像识别算法 二.实现方案与步骤: 1.得到验证码的图片的坐标:先将验证码截图,然后再对整个电脑屏幕截图,通过大图找小图的方法,计算出小图 ...

  8. html识别文字转语音,万能君工具箱v1.8 - 基于百度AI实现语音转文字/文字转语音/文字识别OCR/翻译...

    一.需求分析 1.音频转文字:目前市面上的音频转文字大多收费.音频转文字的需求是:上传一段音频,直接识别成文字,对于会议记录的比较好使,注意不是实时的语音识别. 2.文字转语音:转的语音不要太生硬. ...

  9. JAVA-调用百度文字识别OCR进行身份证识别

    1.第三方接口         文字识别OCR,需要进行注册和实名认证后,获取对应的应用列表以及免费测试额度 2.调用例子  <!-- 百度识别 --> <dependency> ...

最新文章

  1. 少走弯路:强烈推荐的TensorFlow快速入门资料(可下载)
  2. java中利用反射创建对象,利用java反射机制动态创建对象
  3. MS SQL Server查询优化方法
  4. 怎么设置表格根据窗口自动调整_Word排版技巧之表格美化,你值得拥有!
  5. linux下的文本编辑
  6. Linux:文件描述符
  7. java 路径获取文件名称_java 根据文件获取文件名及路径的方法
  8. 【jvm】jvm 执行模式设置
  9. nvidia的jetson系列的方案_NVIDIAJetson系统在工业网络中的集成
  10. 【进阶】PyTorch自定义CUDA算子教程与运行时间分析
  11. Spark系列(三)SparkContext分析
  12. Unity 使用ParticleSystem.Simulate让粒子播放不受时间缩放影响和ParticleSystem.Simulate详解
  13. 深入浅出4G标准:LTE FDD和LTE TDD
  14. Laravel框架的运行过程
  15. 无人机原理图、pcb图下载地址
  16. CSDN钱包提现协议
  17. 计算机毕业设计android的学生考勤请假app(源码+系统+mysql数据库+Lw文档)
  18. 使用arduino D1 wifi模块(WeMos D1)连接阿里云物联网平台并成功实现APP点亮板载LED(九)---制作APP
  19. 信息时代,书香更宜人
  20. supermap开发帮助文档链接

热门文章

  1. xml与java对象互转
  2. 原型链,什么是原型链?原型链的作用
  3. web修改计算机用户密码,Windows Server 2012 通过RD Web用户自助修改密码
  4. 趣图:本宝宝不开森,才不要学什么 JS
  5. C/C++指针详解之提高篇
  6. python布尔类型运算_Python中布尔类型以及与或非运算
  7. 搬家系统APP的设计与实现
  8. 启用新款iMac 2021 的彩色Hello屏幕保护程序!!
  9. chatgpt一键生成 PPT
  10. 大数据照进房地产,真正的行家才是赢家