微软Custom Vision提供了成熟开源的计算机视觉开发框架,你只需要上传十张训练图片,即可一键训练图像分类模型(比如识别不同的水果、花卉、地标、人脸)。不需要具备任何深度学习算法知识,小学生都能快速上手。Custom Vision提供了API接口,你还可以将模型部署在网站、手机移动端、微信小程序中。

作者:张子豪(同济大学微软学生俱乐部)

微信公众号:人工智能小技巧

本文配套B站视频:用微软Custom Version识别水果—不用写代码,三分钟做一个人工智能小应用

发布于2018-11-8

文章目录

  • 美剧《硅谷》中的热狗识别app
  • 微软开源机器视觉开发平台Custom Vision
  • 第一步:新建模型项目
  • 第二步:上传训练图片并打标签
  • 第三步:训练模型
    • 点击右上角绿色的"Train"按钮
    • 模型评估参数
  • 第四步:测试模型
  • 第五步:扩展开发—使用API编写Python脚本程序
  • 微软开源人工智能工具和深度学习框架
  • 同济大学微软学生俱乐部
  • 参考文献与扩展阅读

美剧《硅谷》中的热狗识别app

在美剧《硅谷》中,程序员Jian-Yang开发了一款识别图片中物体是不是热狗的app,虽然听名字就知道,功能十分鸡肋弱智,但由于搭上了人工智能和虚拟现实的快车,这个app迅速获得了硅谷风投公司的青睐并大捞一笔。这部剧深刻讽刺了人工智能浪潮下的经济泡沫以及硅谷投资人的盲目冲动。难怪十九大报告中提出要将”人工智能与实体经济深度融合“。

其实,你也可以用不到三分钟时间轻松开发一款类似的应用,也许下一个硅谷弄潮儿就是你!

微软开源机器视觉开发平台Custom Vision

微软Custom Vision提供了成熟开源的计算机视觉开发框架,你只需要上传十张训练图片,即可一键生成图像分类app。你不需要具备任何深度学习、图像处理的算法知识,小学生都能快速上手。Custom Vision提供了API接口,你还可以将模型部署在网站、手机移动端、微信小程序中。

本文配套B站视频:用微软Custom Version识别水果—不用写代码,三分钟做一个人工智能小应用

关注微信公众号 人工智能小技巧 回复 苹果 即可看到这个视频。

第一步:新建模型项目

Custom Vision官网

点击进入后免费注册微软账号,即可新建模型项目。

第二步:上传训练图片并打标签

注意事项:

1、不能只上传一个标签的图片,否则模型无法通过交叉验证的方式对照学习。也就是说,不能只上传苹果的图片,而是至少上传苹果和香蕉两种水果的图片并分别打标签。

2、上传的训练图片要包含对象整体,而非局部。

3、上传不同背景、角度、大小的照片。

4、每个标签上传十几张图片就够了。

第三步:训练模型

点击右上角绿色的"Train"按钮

等待几秒钟之后,模型就训练完成了。

模型评估参数

窗口中显示的Precision和Recall是用于评价我们训练的分类模型分类效果的两个参数。

Precision:被预测为苹果的结果中有多少真实就是苹果。

Recall:真实为苹果的样本中有多少被预测正确了。

简单来说,Precision就是宁可放过不可杀错,Recall就是宁可杀错不可放过。

在机器学习领域,通常使用F-measure参数将这两个参数综合起来。

Precision和Recall随着分类阈值的变化而此消彼长(举例说明),使用Precision-recall曲线,来显示出分类器在Precision与Recall之间的权衡。

打个比方,如果有个人号称是地震预测的专家,如果他每天都说第二天不会发生大地震,那么他有相当大的概率能够预测成功,也就是说Precision很大。但我们不能说这就是一个好的模型,因为当地震真来临的时候他能够预测成功的概率是0,也就是Recall很低。综合起来的F-measure也很低,所以这是一个失败的分类器。

再打个比方,医疗诊断用的试剂有假阳性和假阴性,假阳性指的是一个正常人被测出有癌症,假阴性指的是一个癌症病人测出来没有癌症,这和Precision和Recall的道理也是一样的。

第四步:测试模型

点击右上角的Quick Test,进入测试界面,既可以上传图片文件,也可以上传图片的URL地址,模型就能正确识别出图片属于哪一类标签。

第五步:扩展开发—使用API编写Python脚本程序

Custom Vision提供了API接口,你可以将训练模型部署在网站、手机移动端、微信小程序中,从而开发自己的用户界面,并大批量识别图片。

在Performance栏中,选择Prediction URL,打开API界面。

利用Python的requests库,构造post请求,Python脚本代码如下:

将body栏里的Url链接更换成你要识别的图片链接。

# 同济大学张子豪于2018年11月2日编写
# 微信公众号:人工智能小技巧
import requestsdef getHTMLText(url):try:headers = \{"Prediction-Key": "7e1469b8051b45329814ef7f2275a3ff","Content-Type": "application/json",}body = \{"Url": "https://ss0.bdstatic.com/70cFvHSh_Q1YnxGkpoWK1HF6hhy/it/u=684871772,3282663100&fm=27&gp=0.jpg",}# Set Prediction-Key Header to : 7e1469b8051b45329814ef7f2275a3ff# Set Content-Type Header to : application/json# Set Body to : {"Url": "https://example.com/image.png"}r = requests.post(url,timeout=30,headers=headers,json=body)r.raise_for_status()  #如果状态不是200,引发HTTPError异常r.encoding = r.apparent_encodingreturn r.textexcept:return '产生异常'if __name__ == "__main__":url = "https://southcentralus.api.cognitive.microsoft.com/customvision/v2.0/Prediction/7c9b4755-271f-4d32-82c5-3c93ba34df8b/url?iterationId=c4927c90-b28a-4c22-9957-3e0b4f2ce99e"print(getHTMLText(url))

例如,用下列测试图片做测试,运行Python脚本,结果如下:是香蕉的概率为100%。通过这个程序,你可以将这个图像分类模型部署在自己的云服务器上,搭建自己的网站、手机APP、微信小程序,向用户提供图像分类服务。

微软开源人工智能工具和深度学习框架

微软开源人工智能工具和深度学习框架介绍

关注微信公众号 人工智能小技巧 回复 微软 即可看到这篇文章。

本文介绍了微软在人工智能领域的领先成果、产品线,开源人工智能框架和工具。读者可以运用这些工具快速开发机器视觉、语音处理、视频检索等丰富的人工智能应用。

同济大学微软学生俱乐部

参考文献与扩展阅读

Custom Vision

【YOLO学习】召回率(Recall),精确率(Precision),平均正确率(Average_precision(AP) ),交除并(Intersection-over-Union(IoU))

用Microsoft Custom Vision技术识别点东西吧

学堂在线慕课:微软人工智能-深度学习框架和工具

用Microsoft Custom Vision技术识别点东西吧

科普文:大白话讲解卷积神经网络工作原理

B站视频:不用写代码,三分钟做一个人工智能小应用

视频:三分钟走进卷积神经网络

视频:大白话讲解卷积神经网络工作原理

微软亚洲研究院

微软亚洲研究院20年20人

作者介绍:

张子豪,同济大学在读研究生。微信公众号人工智能小技巧运营者。致力于用人类能听懂的语言向大众科普人工智能前沿科技。目前正在制作《说人话的人工智能视频教程》、《零基础入门树莓派趣味编程》等视频教程。西南地区人工智能爱好者高校联盟联合创始人,重庆大学人工智能协会联合创始人。充满好奇的终身学习者、崇尚自由的开源社区贡献者、乐于向零基础分享经验的引路人、口才还不错的程序员。

说人话的零基础深度学习、数据科学视频教程、树莓派趣味开发视频教程等你来看!

微信公众号:人工智能小技巧

Github代码仓库:TommyZihao

个人主页:www.python666.org

同济大学开源软件协会
同济大学微软学生俱乐部
西南人工智能爱好者联盟
重庆大学人工智能协会

用微软Custom Version识别水果:三分钟开发人工智能小应用相关推荐

  1. 三分钟学会PS小清新调色教程-萧蕊冰

    今天的PS小教程教你三分钟学会PS小清新调色教程.夏天到了,夏天的阳光很大,拍出的照片都会有一种暖色的感觉,那么我们怎么把一张照片调成日式小清新呢?今天我们就来学一个PS小清新调色教程,让你体验一下日 ...

  2. 【超直白】三分钟创建一个小程序

    让我们花三分钟创建一个小程序! 注册账号 访问微信公众平台网站:https://mp.weixin.qq.com 鼠标放到小程序上 发现图案变成了,下面这样,点击[查看详情],进入小程序注册页面. 拉 ...

  3. 开了gomod不识别gopath_三分钟掌握Go mod常用与高级操作

    环境 Windows10 GO:1.13 1. 开启Go module 1.11和1.12版本 将下面两个设置添加到系统的环境变量中 GO111MODULE=on GOPROXY=https://go ...

  4. 三分钟搞清人工智能、机器学习与深度学习

    Artificial Intelligence 人工智能(Artificial Intelligence) 机器学习(Machine Learning) 深度学习(Deep Learning) 机器学 ...

  5. 介绍三个开发技术小知识点

    背景 本文将介绍三个开发过程中的小技术点: Vue 组件传递对象时,根据是否会修改原对象内容,决定是直接使用,还是用副本: Spring 容器托管的实体 Bean 名称的基本规则: MyBatis 默 ...

  6. 三分钟总览微软任务并行库TPL

    点击上方蓝字进行关注 有小伙伴问我每天忽悠的TPL是什么? ☹️ 这次站位高一点,严肃讲一讲. 引言 俗话说,不想开飞机的程序员不是一名好爸爸:作为微软技术栈的老鸟,一直将代码整洁之道奉为经典, 优秀 ...

  7. 三分钟学会怎样识别手写文字

    上大学的时候,为了方便记笔记,我购买了平板电脑和电子笔.在熟悉完基本的操作步骤后,我就准备将之前记录在笔记本上的手写笔记导入到平板中.不过之前没有这方面的经验,于是我就上网搜索了一下哪些软件可以识别手 ...

  8. 都2022年你还不会安装系统?看我三分钟完事PE制作并进行Win11系统安装实践

    本章目录: 1.PE启用盘的下载制作 2.Win11镜像的下载 3.进PE安装Windows11(敲黑板) 4.Win11初始化操作 都2022年你还不会安装系统?看我三分钟完事PE制作并进行Win1 ...

  9. 三分钟教会你用U盘装系统,再也不用花钱重装了

    转载自品略图书馆 http://www.pinlue.com/article/2020/05/1207/3110505937546.html 大家随便在搜索引擎上搜索"U盘装系统" ...

最新文章

  1. SpringBoot------集成MyBatis报错
  2. ICCV 2021 | 通过显式寻找物体的extremity区域加快DETR的收敛
  3. half-sync/half-async 和 Leader/Followers 模式的主要区别
  4. 怎么配置 Oracle 侦听器来使用SQL操作ST_Geometry
  5. Java基础学习总结(129)——Arrays.asList得到的List进行add和remove等操作出现异常解析
  6. Unicode 和 UTF-8 的区别
  7. iOS开发之跳转指定的tabbar控制器(二级页面跳转到指定的tabbar页面)
  8. 如果Linux从未出现,我们的生活会变成怎样?
  9. PROXY SERVER 代理服务器
  10. Android C++ OpenGL教程课程总结
  11. 《ANSYS Workbench有限元分析实例详解(静力学)》——第1章 CAE分析步骤1.1 模型简化...
  12. 如何使用Git Pull覆盖本地文件
  13. Ti的C28x系列的DSP(28069)(28377D)使用经验,CMD文件
  14. 简单的魔方复原方法, 魔方还原公式,图解
  15. matlab 中atan2函数的介绍
  16. 常用第三方包汇总(持续更新)
  17. 车路协同-智慧出行(智慧交通解决方案)
  18. 淘宝/天猫API接口数据调用情况
  19. [589]IDM下载器
  20. Linux Shell 实现密码掩码输入

热门文章

  1. 记2017上海谷歌开发者大会:第一天
  2. Edge浏览器出现翻译不了页面,扩展插件无法下载解决办法
  3. 解决运行web项目问题:localhost: 8080 is already in use
  4. Paint the Roads UVALive - 2197
  5. 报错:SyntaxError: Unexpected token u in JSON at position 0 at JSON.parse (<anonymous>)
  6. netty 通道接口定义
  7. Hive 热门数据分析笔试题(干货满满,持续更新中...)
  8. STM32F103C8T6引脚图及引脚功能说明
  9. 招商头条:北京市集中力量补齐5G产业短板;投资50亿元的格力成都产业园开工
  10. java jtable 复选框_java swing如何在JTable一个单元格添加多个复选框