2019-12-13 09:45

机器视觉一直是人工智能热潮中最大的成功案例之一,它可以实现从自动医疗扫描到自动驾驶汽车的所有功能。但是,尽管所有视觉算法的准确性都有了很大的提高,但这些系统仍然可能被人类可以轻松识别的图像所迷惑。

看看下面的2张图片,都没有特别令人困惑的地方吧?您会看到锤子,烤箱手套,尽管中间图片很难辨认,但可以很快地看出来是从上方看去的椅子。同时,最先进的机器视觉算法可能只会识别这些对象中的一两个。对于应该驾驶我们的汽车的系统来说,这是一个巨大的降级。

这些图像属于名为ObjectNet的数据集一部分,该数据集来自MIT的科学家,以测试AI视觉的局限性。研究科学家鲍里斯·卡茨(Boris Katz)告诉《 MIT新闻》:“我们创建了这个数据集来告诉人们对象识别问题仍然是一个难题。我们需要更好,更智能的算法。”

更好的数据可以构建更好的算法,而ObjectNet将在这方面提供帮助。它包含5万张从奇怪角度或在令人惊讶的环境中观看的物体图像(比如沙发上倒着的茶壶或浴室里靠在椅背上的餐椅)。ObjectNet可以用来测试和评估不同算法的能力。

这类图像很难被计算机处理,因为它们没有出现在训练数据中,并且因为这些系统对现实世界中的对象工作方式了解有限。 AI系统无法轻松地从它们以前看过的项目中推断出来,以想象它们在不同角度,在不同灯光下的形象。改善AI视觉系统的性能也不是没有可能。这只需要时间,精力和训练。

令AI费解的图像层出不穷 计算机视觉远未达到完美相关推荐

  1. Clarifai的AI可检测图像和视频中的不合规内容

    文章来源:ATYUN AI平台 在互联网上过滤色情,毒品,血腥和其他令人反感的内容并不容易.Facebook目前在全球拥有7500名内容版主,而2017年5月为4500名.而在4月份,谷歌旗下的You ...

  2. On the Effectiveness of Visible Watermarks 利用AI技术去除图像水印

    我的个人微信公众号: Microstrong 微信公众号ID: MicrostrongAI 微信公众号介绍: Microstrong(小强)同学主要研究机器学习.深度学习.计算机视觉.智能对话系统相关 ...

  3. 海康摄像头 海思AI芯片(Hi35XX): 图像jpg转.bgr

    前言 把一张jpg图片转成bgr(注意顺序是bgr)二进制文件,最近在弄华为Hi3516DV300开发板上的一些深度学习的样例程序,换言之,35xx nnie SDK只支持BGR以及yuv格式的数据输 ...

  4. 京东AI研究院梅涛:计算机视觉助力提升服务体验

    https://www.toutiao.com/a6675869896380776972/ 京东AI研究院副院长.计算机视觉与多媒体实验室主任梅涛 3月21日,己亥年人工智能春季创新大会在北京国宾酒店 ...

  5. 百度AI开放平台图像审核错误216201

    百度AI开放平台图像审核错误216201 课程设计做的图像审核项目突然不正常工作了,上传图片后返回错误码216201,image format error,反复排查后发现是百度不再接受带换行符的Bas ...

  6. AI 如何替换图像,替换元素

    AI 如何替换图像,替换元素 adobe illustrator 如何替换图像,替换元素 https://zhidao.baidu.com/question/393059765.html

  7. 创建好的提示词来让 Stable Diffusion 生成 AI 艺术作品图像

    如何创建好的提示词来让 Stable Diffusion 生成 AI 艺术作品图像? 文章目录 Stable Diffusion 如何使用? 优秀的提示词如何制作? 主题描述 Subject 图片类型 ...

  8. NeurIPS 2020 | 腾讯 AI Lab 解读机器学习及计算机视觉方向入选论文

    本文转载自腾讯AI实验室. 感谢阅读腾讯AI Lab微信号第113篇文章.本文将介绍解读 NeurIPS 2020 中腾讯 AI Lab 的14篇入选论文. 神经信息处理系统大会(NeurIPS)是人 ...

  9. 浅谈微信AI在通用图像搜索领域的探索

    导语 微信识物是一款主打物品识别的AI产品,通过相机拍摄物品,更高效.更智能地获取信息.2020年,微信识物拓展了更多识别场景,上线了微信版的图片搜索.本篇文章将与大家分享微信识物从识物拓展到通用图像 ...

最新文章

  1. java连接mongodb_java连接mongodb源码解读
  2. HTML5元素周期表
  3. c语言for循环语句java,C语言三种类型的循环语句
  4. 【知识星球】每日干货看图猜技术,你都会吗?
  5. 未能找到路径的一部分_车辆路径规划三种MIP模型
  6. 【USACO】奶牛抗议 树状数组+dp
  7. JSP之EL表达式详细介绍
  8. AAAI 2021 | 用于旋转目标检测的动态锚框学习策略
  9. C语言--使用fopen、fgets、fprintf(标准IO)实现注册、登录、功能--(完整代码-分文件)
  10. 【白皮书分享】2021汽车产业数字化转型白皮书-腾讯研究院.pdf(附下载链接)...
  11. elementUI 日期选择控件少一天的问题解决方法
  12. 设置jupyter notebook软件的字体样式
  13. 伪原创文章实操方式。
  14. 谈谈超平面(hyperplane)
  15. 游戏服务器架构的历史、现在以及未来(云游戏)
  16. 备受关注的个税法进行第七次大型结构调整,你受益有多少?
  17. 微信开发者工具调试大法
  18. 盘点那些程序员必备的小众网站,建议收藏!
  19. 1.调查问卷-接口文档
  20. springcloudAlibaba设置allow-bean-definition-overriding=true不生效问题解决

热门文章

  1. Ubuntu安装Ceres库-安装依赖时报错:E:无法定位软件包 libcxsparse3.1.2_朱国鑫的博客-CSDN博客
  2. MinMaxScaler.fit 归一化数据的方法
  3. c语言控制台光标的坐标范围,C语言之实现控制台光标随意移动的实例代码
  4. 程序员在翻车时的30种常见反应
  5. 学习换脸:Switching Eds: Face swapping with Python, dlib, and OpenCV
  6. 《Generative Face Completion》论文笔记
  7. MIT出品2017-2018深度学习最新进展汇总
  8. openSUSE中文输入的安装和设置
  9. 收藏丨机器学习顶级数据资源 Top 8 盘点
  10. 1人15篇入选?华人论文知多少?深度分析ICCV2019论文录取背后的那些事儿!