一、首先要有百度账号

一般百度账号都是通用的,如果没有可以在百度AI开放平台注册一个账号。
地址:http://ai.baidu.com

二、安装sdk

pip install baidu-aip

备注:在pycharm里也可以在setting----Project Interpreter—右边绿色加号,输入baidu,安装baidu-aip

三、创建应用

登录百度云控制台,文字识别 --> 创建应用 --> 应用名称等内容自己根据需要填写
应用创建完成后,会生成一个应用,字段代表的含义

AppID      #账号ID
APIkey     #针对接口访问的授权方式
SecretKey  #密钥

四、文字识别代码

#!/usr/bin/env python
#-*- coding:utf-8 -*-from aip import AipOcr  # 文字识别  pip install baidu-aip
import os# 定义变量
AppID = "15245350"  #账号ID
APIkey = "6CVO9xxxxxxxxxxxx"  #针对接口访问的授权方式
SecretKey = "BkrxxxxxxxxxxxxB6W7AMuC"  #密钥
IMG_EXT = ['.png', '.jpg', '.jpeg', '.bmp']  #常见图片格式后缀名# 初始化操作
client = AipOcr(AppID, APIkey, SecretKey)# 1、调用接口获取图片里面的文本内容
def cor_basic_general(file_path_name):print('图片转换地址为:{}'.format(file_path_name))with open(file_path_name, 'rb') as f:content = f.read()api_result = client.basicGeneral(content)  # 调用通用文字识别接口# print(api_result)"""api_result的值:{'log_id': 3303489525243973687,'words_result_num': 4,'words_result': [{'words': '修仙路,踏歌行。身怀万阵之祖,如何登上遗忘之巅?世界顶级雇佣兵王穿越了,来到了一片遗忘之地,这里崇'}, {'words': '尚力量,强者为尊。造枪造炮卖胸罩,打人打脸卖保险,弹琴唱歌修真路,杀人夺宝难拘束!这个世界太疯狂'}, {'words': '了,摩托车会飞,枪炮与法宝共存,不仅有飞来飞去的神仙姐姐,还有这身材惹火的职业御姐……这不是想象'}, {'words': '是真实的,因为它就在我们“隔壁'}]}"""words_result = (i['words'] for i in api_result['words_result'])  # 文本内容result = '\n'.join(words_result)  # 图片的文本内容按照换行符拼接return result# 2、判断文件类型,写入文件
def handdle_file(file_path_name):filename,ext = os.path.splitext(file_path_name)  # 将文件名和拓展名分开if ext in IMG_EXT:newname = filename + '.txt'  # 保存到txt文件result = cor_basic_general(file_path_name)  # 调用上述方法with open(newname, 'w',encoding='utf-8') as f:f.write(result)# 3、处理路径下的所有图片
def handdle_path(path):if os.path.isdir(path):for child_dir_or_file in os.listdir(path):child_path = os.path.join(path, child_dir_or_file)if os.path.isfile(child_path):handdle_file(child_path)else:handdle_path(child_path)if __name__ == '__main__':file_path = r'H:\python\ocr'    # 图片路径handdle_path(file_path)

五、扩展

人脸识别和文字识别类似,代码如下

#!/usr/bin/env python
#-*- coding:utf-8 -*-from aip import AipFace""" 人脸识别的 APPID AK SK """
AppID = "15245350"  #账号ID
APIkey = "6CVO9xxxxxxxxxxxx"  #针对接口访问的授权方式
SecretKey = "BkrxxxxxxxxxxxxB6W7AMuC"  #密钥#初始化操作
client = AipFace(AppID, APIkey, SecretKey)""" 读取图片 """
def get_file_content(file_path_name):with open(file_path_name, 'rb') as fp:return fp.read()images = [get_file_content('example0.jpg'),get_file_content('example1.jpg'),
]""" 调用人脸比对 """
result_json = client.match(images);
print(result_json)
result = result_json['result'][0]['score']
if result > 80:print("同一個人")
else:print("不是同一個人")

python使用百度aip文字识别相关推荐

  1. python(自动化)利用selenium+百度ocr文字识别验证码实现自动登陆登陆CET-四级报名系统

    操作步骤: 1:登陆打开CET-考试系统 2:填写相关登陆信息 3:调用百度ocr实现文字验证码识别 4:实现登陆 如何使用和调用百度ocr文字识别接口 1:进入百度AI开发平台:链接 2:在页面上选 ...

  2. 百度 图片文字识别 Python版本

    百度图片文字识别文档:https://cloud.baidu.com/doc/OCR/s/Sk3h7xyad 1. 创建应用 登录百度智能云,在产品服务/文字识别-概览下创建应用 2. 查看应用列表, ...

  3. 利用百度AI文字识别实现网页游戏火影忍者OL自动定向劫镖功能(python)

    在实验室有师兄写了一个自动答题的程序的启发下,决定写一个自动打劫系统. 介绍:所谓定向劫镖,即劫特定玩家的镖.游戏里要求每个区的每个角色的名字是唯一的,因此可以通过玩家游戏名称实现定向劫镖. 经过观察 ...

  4. python常用的OCR文字识别与图片定位方式

    python常用的OCR文字识别与图片定位方式 前言 统一版本 更换pip源 1. Python调用百度文字识别ocr的实现方式 1.1 使用PyCharm安装依赖 baidu-aip chardet ...

  5. 百度OCR文字识别API使用心得 com.baidu.ocr.sdk.exception.SDKError[283604]

    百度OCR文字识别API使用心得 com.baidu.ocr.sdk.exception.SDKError[283604] 本文转载自好基友upuptop:https://blog.csdn.net/ ...

  6. Java调用百度OCR文字识别的接口

    调用百度OCR文字识别的接口,来自于百度官网,亲测可以使用 跳转链接 FileUtil的下载链接 Base64Util下载链接 HttpUtil下载链接 GsonUtils下载链接 Accurate. ...

  7. C# pdf 转图片 and 创建百度AI文字识别应用(识别图片中的文字和数字)

    /// <summary>/// pdf 转图片/// </summary>public static void Turnpicture(){string str = &quo ...

  8. 百度云 文字识别API在线调用测试

    1.0:百度云文字识别应用创建 1.1:找到文字识别产品 1.2:点击使用文字识别 1.3:点击创建应用 1.4:点击  查看应用 ,并输入基本信息,点击立即创建 2.0:token 获取 2.1:找 ...

  9. 中山大学羽毛球场馆自动订场(Python+selenium+百度aip)

    双鸭山南校人太多,小伙伴们日常约球抢不到室内的场馆,只好去室外打.所以趁考完试有时间写了一个自动抢羽毛球场的脚本,网好的时候20秒订场无压力.下面来分享一波这个脚本的一些技术细节(重点讲一下图像降噪和 ...

最新文章

  1. android文件的读取方法,Android读取写入文件的方法
  2. Part2_1 Urllib的get请求和post请求
  3. 前端经典案例——购物车,Jquery实现
  4. camel apache_Apache Camel 3的工作终于开始了
  5. idea怎么给项目改名_IDEA相关配置【java项目改造成web项目】
  6. 安全研究员俩娃徒手绕过 Linux Mint 屏保和密码,并成功访问桌面
  7. x/(x+1)=ln(x+1)=x
  8. LinQ—Lambda表达式
  9. vue中Component错误
  10. vue设置isactive_Vue 编码风格指南!
  11. com.autonavi.amap.mapcore.MapCore.nativeNewInstance:(Ljava/lang/String;Ljava/lang/String;)J
  12. 智慧油气田可视化,打造油气田管控的“最强大脑”
  13. gentoo linux u盘安装,Gentoo系统安装步骤详解
  14. HC05蓝牙模块与stm32通信
  15. 电脑计算机丢失UxTheme,Win7系统电脑开机提示uxtheme.dll丢失的解决方法
  16. Google Adsense api 推荐介绍 ~!没有网站照样赚钱!
  17. 布莱克斯科尔斯模型(一)
  18. Tomcat服务器的默认端口是多少?怎样修改tomcat的端口?
  19. S7-1200 PLC与PAC3200电能表的Modbus RTU通信(详细步骤)
  20. R语言:结构方程模型、潜变量分析

热门文章

  1. vue(移动端)使用高德地图实现精准定位
  2. 2023年的COSO,会有什么不一样?
  3. 几何画板与运筹学作图注记
  4. PPT文档翻译软件怎么用?如何翻译整篇PPT文档
  5. CPA二十一--划出和追加保证金(转载)
  6. 微信互动营销有哪些方式?
  7. 彩色图像转灰度图像原理python
  8. CVE的提交与Github写入技巧
  9. 完全模拟FIFA2014世界杯 原创求顶!
  10. 集成微控制器使太阳能微型逆变器设计成本有效