转载:

+AI场景,3步懂图像识别产品 | 人人都是产品经理​www.woshipm.com

本文重点讲述基于成熟的第三方AI平台阿里、某度、腾讯、谷歌等等中选择一个可供使用的SDK基于Python语言实现图像识别功能的GUI界面,从而一观图像识别车型、图像识别文本产品的实现过程。

我们正处于各种图像识别的场景里,你去某些生鲜超市不用手机可以实现刷脸支付,去银行ATM机不用卡片可以刷脸取现,在很多城市的许多十字路口没有交警但是你如果违规驾驶你的车辆被AI摄像头识别的清清楚楚等等场景里均有机器视觉的应用图像识别的产品应用。

本文不复述图像识别在安防、金融、旅游等方面的产品应用过程,本文仅仅用AI子任务图像识别技术来看AI产品实现的过程,为啥AI产品要懂实现过程?

因为目前的AI处于快速发展时期,无论是对AI产品、AI技术还是AI从业相关的AI爱好者,在AI快速发展的时期跟随AI技术懂AI产品的实现过程是非常有意义的事情。

因此本文重点讲述基于成熟的第三方AI平台阿里、某度、腾讯、谷歌等等中选择一个可供使用的SDK基于Python语言实现图像识别功能的GUI界面,从而一观图像识别车型、图像识别文本产品的实现过程。

一、首先实现工具介绍

语言:Python

产品开发工具平台:下载某度AI项目下的SDK

产品开发设计工具:Tkinker,Python的GUI设计工具有Tkinter,Wxpython,PyQt 等各有优缺点。Tkinter是 Python自带的标准GUI 库,安装Python 后直接使用 Tkinter,不需额外安装,使用前用 from tkinter import*导入 tkinter。第三方 GUI界面设计后经过转换成Python语言才可使用。

产品开发的关键技术:

设计产品是,利用Tkinter技术开发GUI界面,基于某度AI提供的开源技术,实现5个功能:人脸检测、动物识别、植物识别、车型识别、文字识别。用户选择图片后,单击对应的按钮,获得识别结果,其中文字识别的结果以 txt形式保存在硬盘上,其余结果显示在窗体上。

某度AI结果抓取:

某度AI提供的结果信息量大,用户需要对其中数据进行抓取。下列代码对某度人脸检测功能颜值结果进行抓取,结果存放在变量,详情知识点见链接 http://996.pm/MeANw

resul=result[‘result’]
resul=resul[‘face_list’]
res=resu[0]
linelian=res[‘beauty’]

二、其次功能实现过程

1. 产品界面设计实现过程

程序运行后,首先显示欢迎界面(核心代码是,tkinter、messagebox、showinfo( 欢’迎’,”某度AI人工智能”+”n”+”2018年11月出品”))。

界面设计,在界面上设置3个标签,5 个按钮等控件。3 个标签分别显示图片,某度AI结果,运行时间等。7个按钮有“选择图片”,“结束”以及五个实现某度图像功能按钮。

采用place函数设置各个控件的位置,以下代码分别实现标签和按钮的位置:

btn=button(root,text=”选择图片”,command=xz)。place(x=120,y=20)
label=Label(root,width=23,height=6,bg=’blue’,fg=’white’)。
place(x=450,y=150)

2. 选择图片功能实现过程

选择图片,按钮打开选择文件对话框,并将其显示在界面的标签Label上,其核心代码是:

pilImage=tkinter。filedialog。askopenfilename()
pil=Image。open(pilImage)
tkImage=ImageTk。PhotoImage(image=pilImage)
label=Label(root,image=tkImage,width=ww,height=hh)

3. 识别按钮功能设计实现过程

采用def函数功能将按钮与某度AI结果进行定义。以下代码实现,动物检测,按钮与某度AI结果的链接。

def dongwujiance
client=AipImageClassify(APP_ID,API_KEY,SECRET_KEY)
def get _file_content(filePath):
with open(filePath,’rb’) as fp:
return fp.read()
byn=Button(root,text=”动物识别”,command=dongwujiance)

4. 菜单设计实现过程

菜单设计的代码是:

smenul=Menu(fmenul,tearoff=0)
fmenul.add_cascade(label=’关于’,menu=smenul)
for item in[‘版权信息’]:
smenul.add_command(label=item,command=syu)
root[‘menu’]=fmenul

5. 版权信息的代码实现过程

defsyu():
tkinter.messagebox.showinfo(‘版权’,’版本号0.5.2’+’n’+’制作:LineLian的微信号是firstodytm赋能团队’)

6. 生成可执行文件实现过程

编写代码后进行测试。测试后,删除全部断点及部分注释,生成可执行文件,提供给用户使用。生成可执行文件exe的方法是在DOS中输入代码:

>pip install pyinstaller
>pyinstaller – F-w python.py

三、然后实现结果

应用程序执行“车型识别”界面如下图:

文字识别保存在:“d:ocr。txt”。

功能结果如下图:

四、总结+AI产品实现的关键要素

  1. +AI的场景例如本文用于识别车辆、文字等场景。
  2. +AI的产品需要的技术本文是调用用成熟的第三方图像识别接口,这也是典型的对+AI型产品快速实现的方法,同时也是区别于纯AI、AI+的特征。
  3. 对算力的需求,如果公司产生图像的业务比较稳定发展,可以借用第三方云服务来实现。

最后AI助力图像识别、文本识别效率比较高,关键是商业化应用,有商业意义的地方本文图像识别技术落地就更更符合产品逻辑,不会像有的AI技术朋友问笔者:“你不是应该更关注产品怎么吸引用户吗?为何还要懂技术呢?”

答案是:AI处于快速发展时期,对于从事AI产品和AI领域相关的人非常有必要懂AI实现的过程。因为AI技术和AI的相关都处于快速发展状态下。不像传统技术那么死板和已经技术固话,所以很多产品懂AI相关的技术更能创新应用AI。

python 图像识别_AI场景,3步懂图像识别产品相关推荐

  1. app inventor调用图像识别_+AI场景,3步懂图像识别产品

    本文重点讲述基于成熟的第三方AI平台阿里.某度.腾讯.谷歌等等中选择一个可供使用的SDK基于Python语言实现图像识别功能的GUI界面,从而一观图像识别车型.图像识别文本产品的实现过程. 我们正处于 ...

  2. +AI场景,3步懂图像识别产品

    我们正处于各种图像识别的场景里,你去某些生鲜超市不用手机可以实现刷脸支付,去银行ATM机不用卡片可以刷脸取现,在很多城市的许多十字路口没有交警但是你如果违规驾驶你的车辆被AI摄像头识别的清清楚楚等等场 ...

  3. Python徒手实现识别手写数字—图像识别算法(K最近邻)

    Python徒手实现识别手写数字-图像识别算法(K最近邻) 写在前面 这一段的内容可以说是最难的一部分之一了,因为是识别图像,所以涉及到的算法会相比之前的来说比较困难,所以我尽量会讲得清楚一点. 而且 ...

  4. [Python从零到壹] 六十一.图像识别及经典案例篇之基于纹理背景和聚类算法的图像分割

    祝大家新年快乐,阖家幸福,健康快乐! 欢迎大家来到"Python从零到壹",在这里我将分享约200篇Python系列文章,带大家一起去学习和玩耍,看看Python这个有趣的世界.所 ...

  5. [Python从零到壹] 六十.图像识别及经典案例篇之基于阈值及边缘检测的图像分割

    欢迎大家来到"Python从零到壹",在这里我将分享约200篇Python系列文章,带大家一起去学习和玩耍,看看Python这个有趣的世界.所有文章都将结合案例.代码和作者的经验讲 ...

  6. 一张图看懂图像识别算法发展历史

    一张图看懂图像识别算法发展历史

  7. 计算机视觉技术的应用实例,图像识别技术都有哪些?图像识别技术原理及应用实例...

    图像识别是计算机视觉和人工智能领域的重要组成部分,其终极目标是使计算机具有分析和理解图像内容的能力.图像识别是一个综合性的问题,涵盖图像匹配.图像分类.图像检索.人脸检测.行人检测等技术,并在互联网搜 ...

  8. python爬虫简单实例-最简单的Python爬虫案例,看得懂说明你已入门,附赠教程

    原标题:最简单的Python爬虫案例,看得懂说明你已入门,附赠教程 这是最简单的Python爬虫案例,如果你能看懂,那么请你保持信心,因为你已经入门Python爬虫,只要带着信心和努力,你的技术能力在 ...

  9. python学会了能做什么-学会Python后都能做什么?介绍五种Python的实用场景

    如今,越来越多的人加入到学习Python的队伍当中. 有的学习者是设计师,学习Python可以帮助他们查找更多的海报案例;有的学习者是大学生,学习Python可以帮助他们更好地查阅论文资料;还有的学习 ...

最新文章

  1. 【Spring】新注解
  2. python模块之imghdr检测图片类型
  3. 连接远程mongodb_在centos6.9安装mongodb
  4. 给Ubuntu软件升级命令
  5. mysql1067默认参数错误_MySQL 1067错误解决方法集合
  6. 推荐:两款实用的Jupyter插件~
  7. 无法设置html过渡效果,html – CSS3过渡显示无阻止过度滚动
  8. B - Friends
  9. aes解密流程图_AES加密算法详解
  10. git学习笔记-(4-git对象)
  11. 互联⽹名词⼤全——商业模式篇
  12. streamlit部署到宝塔后域名访问出现Please wait...的解决方法
  13. 读书笔记5.1——《让数字说话:审计,就这么简单》:孙含晖
  14. 基因组时代线粒体基因组拼装策略及软件应用现状
  15. 修改elementui 的datepicker日期选择器自然周从周一至周日
  16. 使用matlab绘制弧线,MATLAB求解叶型中弧线
  17. selenium java自动化测试
  18. C语言课程设计 管理系统
  19. pn532写入手机nfc_STM32f103(mini板)控制NFC模块(PN532)对NFC标签进行读写
  20. 6.堆(动态内存 heap)的初始化和使用

热门文章

  1. cad怎么表示出一个孔_怎么训练出一个NB的Prophet模型
  2. 深度学习知识点全面总结
  3. 动手学习数据分析(二)——数据处理
  4. Django之ORM的增删改查
  5. apache java cache-control,Tomcat: Cache-Control
  6. redis常用命令getex_Redis 常用命令篇(末尾含不常用)
  7. HDFS完全分布式集群搭建
  8. jdbc executebatch 非事务_面试:Mybatis事务请讲解一下?
  9. neo4j︱图数据库基本概念、操作罗列与整理(一)
  10. 多模态+Recorder︱多模态循环网络的图像文本互匹配