https://www.toutiao.com/a6646959085440729608/

行业级最先进的 计算机视觉技术

  • 如今,人工智能在工业领域有着蓬勃发展趋势,因为自动化以及优化仍是数字革命的主要焦点。
  • 在本文中,我们将回顾近几年在AI社区中那些令人兴奋的最先进的计算机视觉技术,这些技术被认为是工业就绪的,而且对工业用例产生重大而又实际的影响。
  • 其中一些技术对性能的提升达到了令人难以置信的程度,超越了人类能达到的性能水平,从而超出了大多数行业所期望的精度和可靠性标准。
  • 在基本的计算机视觉任务(例如图像分类)中取得的惊人进步,使得可靠地结合多种技术来创建新的复合技术从而实现之前从未在工业环境中探索过的全新用例成为可能。
  • 话虽如此,这些新技术已经证明其结果可与那些只能通过非常密集的硬件专用系统才能获得的精度和可靠性结果相媲美。虽然在实现这些专用系统和安装与之相关的硬件方面存在实际的困难和限制,但相机是很容易买到的,从而极大地扩大了用例范围。
  • AI赋能的计算机视觉系统使得有可能跨入到一个新的领域,加速了工业4.0,真正数字化和物理现实增强的进程。
  • 在我们深入了解计算机视觉领域的最新进展之前,让我们先介绍一些基本概念以及深度学习和计算机视觉这方面的历史事件。

计算机视觉是什么?

  • 计算机视觉是一门科学,旨在使计算机能够理解并从图形和视频中洞悉信息。计算机视觉,即自动执行视觉任务的能力,例如从图形或视频中提取和分析有用的信息。

机器学习和深度学习的关系!

  • 机器学习是算法和统计模型的科学研究,它依赖于数据驱动的方法来做决策而不是基于规则的方法。给定大量高质量数据并通过改进算法,机器学习系统能够逐步提高其在特定任务上的性能。
  • 深度学习是机器学习的子类,完全侧重于一组可描述为网络的数学算法。它们起初受到人脑中发现的生物神经网络的启发,同样,人工神经网络具有数百万个人工突触,数学上由数百万个简单的线性代数方程表示。

深度学习驱动计算机视觉

  • 自2012年深度学习神经网络一直是计算机视觉的主要关注点是有理由的。由深度学习驱动的计算机视觉系统的优点是它们具有更高准确性,更灵活,且对大量的光线条件变化,视点,尺度,方向,与背景融合,类内差异,变形以及视觉遮挡等情况具有更高容忍度。但最重要的是,它们启发了新的用例。
  • 早期的计算机视觉模型依赖于原始像素数据作为机器学习模型的输入。然而,单独的原始像素数据不足以包含图像中对象的千变万化。
  • 深度学习驱动的计算机视觉基于深度神经网络可在训练阶段自动提取和创建特定任务的特征,然后将其用于执行计算机视觉任务。

下图突出了深度学习和计算机视觉近6年历史中最重要的一些事件。

  1. 2012年引入深度神经网络所带来的突破使得图像分类误差减少了约10%(从2011年的25.8%降至2012年的16.4%)。
  2. 2015年最先进的算法在图像分类方面的表现超过了人类水平(5.1%,Russakovsky et al.),准确率为3.57%。
  3. 总体而言,深度神经网络的引入导致图像分类误差减少10倍(从2011年的25.8%将至2017年的2.3%)。

值得注意的是,上述结果是在ImageNet数据集上实现的,其中20,000个类别具有典型类别,例如“气球”或“草莓”,由数百个低分辨率469x387像素图像组成。计算机视觉系统应用于具有较少类别,较少变化和较多数量的较高分辨率图像的特定任务时,其准确度可以高达99.9%。这使得完全独立自信地运行一个系统成为可能。

详细了解计算机视觉技术

现在我们已经介绍了基础知识,我们可以更详细地了解这些技术了。

图像分类

在本节中,我们将介绍图像分类,这是将一组固定类别中的一个标签分配给图像的任务。这是计算机视觉中的核心问题之一,尽管其简单,但其具有各种各样的实际应用。许多其它看似不同的计算机视觉任务(例如图像 字幕,目标检测,关键点检测和分割)可以简化为图像分类,其它任务利用全新的神经网络架构。以下视频片段说明了一个非常简单的分类事例。

图像关键字和字幕

该技术处于计算机视觉和自然语言处理(NLP)这两AI中最有趣领域的交点。关键字是用于描述照片或图像元素的单词。关键字是对照片添加描述性术语的过程。

图像字幕是指基于图像中的对象和动作从图像或视频生成文本描述的过程。在下图中可以看到这方面的一个例子。

目标检测

目标检测是一种计算机视觉技术,用于识别和定位图像或视频中的对象。这通常通过带边框标记的框包围对象来完成。目标检测是自动驾驶汽车背后的关键技术,使它们能够识别其他汽车或区分行人与灯柱。它还可以用于各种应用,例如工业检测和机器人视觉。由于ImageNet竞赛,仅2010年至2014年间,定位误差(从42.5%降至25.3%)就减少了1.7倍。下面的视频片段显示了该技术的实时实施结果,用于检测城市中发现的与一辆自动驾驶视觉系统相关的车,人以及其他常见物体。

关键点检测和姿态估计

关键点被视为图像有趣或重要部分的特征。它们是图像中的空间位置或点,定义图像中有趣的内容或突出的内容。关键点之所以特殊,是因为它使得跟踪修改后的图像中的相同关键点成为可能,其中图像或图像中的对象会发生旋转、收缩/膨胀或变形。

姿态估计是计算机视觉中的一个普遍问题,其目的是检测物体的位置和方向。这通常意味着检测对象的关键点位置。这种技术可以用来创建一个非常精确的二维/三维模型,描述对象关键点的位置,然后可以用来创建一个数字孪生兄弟。

例如,在姿态估计问题中,可以检测到常见的方形家居对象的角点,从而可以深入了解对象在环境中的三维位置。

同样的方法也可以用于检测人体姿势,人体上的关键点如肩膀、肘部、手、膝盖和脚都会被检测到。

语义分割

下一种技术称为语义分割(也称为对象掩蔽),它解决了计算机视觉领域的一个关键问题:直观地分离图像中的物体。从大的图像上看,语义分割为完全理解场景铺平了道路。这是非常有用的,因为它使计算机能够精确地识别不同物体的边界。场景理解作为一个计算机视觉的核心问题,其重要性在于从语义分割中所获得的知识使得越来越多的应用程序的健壮性得以提升。在下面所示的自动驾驶汽车示例中,它帮助汽车识别道路和其他物体的准确位置。

图像到图像转化

下面提到的技术属于图像到图像转化的范畴。对于下面的技术,网络通过提高质量而不是提取见解或得出结论来增强图像和视频。

超分辨率:

此任务的目标是在同时提高细节级别的同时提高图像的分辨率。一个非常深的神经网络最近在图像超分辨率方面取得了巨大的成功。放大倍数适用于2倍放大,如下图所示。

超分辨率图像残留的密集网络(Zhang等人,2018日三月)

夜视

在弱光下成像是一项挑战。短曝光图像会产生噪声,长曝光时间会导致动态模糊。后者通常也不切实际,尤其是对于手持摄影。人们已经提出了各种去噪、去模糊和增强技术,但它们的效果在极端条件下是有限的,例如夜间高速摄影。为了提高目前的标准,研究人员引入了一种基于深度网络端到端训练的低光图像处理技术。该网络直接利用原始传感器数据,取代了许多传统的图像处理技术。这可以在下面的图像中清楚地看到,暗噪声图像得到了显著的增强。

在黑暗中学会看东西(Chen等人,2018年五月)

Super SloMo

视频插值旨在在两个连续帧之间生成中间帧。这些人工生成的画面与原始图像有着不可区分的视觉特征。这项技术是放大摄像系统性能的理想方法。对多个数据集的实验结果表明,深度学习方法比现有的方法具有更好的一致性。这项技术的结果可以在下面的视频剪辑中看到,在原始帧之间添加7个中间帧来创建平滑的慢动作视频。

Super SloMo:视频插值多中间帧的高质量估计(Jiang等人,2018年7月)

在本文中,我们研究了许多计算机视觉技术,这些技术是由最近几个月开发的深入学习提供动力的,并且已经展示了令人难以置信的结果,并准备在行业中实施。这些技术处于技术的前沿,通过提高速度、准确性、可靠性和灵活性,表现出明显的优于以前的技术。

创新的关键驱动因素是近年来人工智能研究论文的数量激增,特别是在计算机视觉领域,使充分利用技术进步来改善工业运营的最新趋势变得更加重要。

谢谢你的阅读!希望,你学到了一些新的和有用的关于最先进的计算机视觉技术的东西,这些技术已经为工业上的实际应用做好了准备。

如果你想了解更多,请一定要为这篇文章鼓掌,并跟随我。

最先进的计算机视觉|AI和工业4.0之间,还有多远的差距?相关推荐

  1. AI和工业4.0之间,还有多远的差距?

    本文为 AI 研习社编译的技术博客,原标题 : Spanning the reality gap between AI and Industry 4.0 作者 | Philip Montsho 翻译 ...

  2. 5G和AI机器人平台为工业4.0和无人机提供服务

    5G和AI机器人平台为工业4.0和无人机提供服务 Qualcomm 5G and AI robotics platform delivers for Industry 4.0 and drones 高 ...

  3. ai物联网工业_人工智能和物联网将如何改变行业

    ai物联网工业 by Mariya Yao 姚iya(Mariya Yao) 人工智能和物联网将如何改变行业 (How Artificial Intelligence & the Intern ...

  4. 全速前进! AI助力工业制造智能升级

    谈到工业数字化转型,人们首先联想到的就是工业互联网,仿佛工业互联网已经成了工业转型的全部. 实际上,随着数字化进程的加快,智能化才是工业发展的星辰大海,AI与工业的深度交融悄悄成为了业界学界的重要课题 ...

  5. 腾讯杰出科学家写给2029的信:计算机视觉AI技术的爆点在哪里?

    文 |腾讯杰出科学家.腾讯优图实验室负责人 贾佳亚 腾讯优图实验室总监 戴宇荣博士 郑冶枫博士 近年来,计算机视觉AI技术发展迅速,尤其是人工智能的引入大大提升了算法的能力和实用性.在数不清的视觉AI ...

  6. 计算机视觉及其工业中的应用,计算机视觉技术在工业领域中的应用

    卢箭 孙通 刘立峻 摘 要:在科学技术的推动下出现了计算机视觉技术,技术在不断发展中趋于成熟,被有效应用在工业领域中,并且取得了显著成效.发挥出对计算机视觉技术的优势,加强和工业领域的融合,有助于促进 ...

  7. 现在是用AI给工业视觉检测赋能最好的时代

    国家统计局发布:2021年全国人口净增加48万人!48万,这个冰冷的数字很难说明问题,可以看这幅图.从下图可以看出,新增人口的确是暴跌!         2021年,65岁人口占比14.2%,比202 ...

  8. 计算机视觉技术英语论文,【毕业论文】外文翻译--计算机视觉技术在工业中的应用.doc...

    PAGE 华 北 电 力 大 学 毕 业 设 计(论 文)附 件 外 文 文 献 翻 译 学 号: 200904000517 姓 名: 所在院系: 机械工程系 专业班级: 机械0905 指导教师: 原 ...

  9. 诺奖评委、工业 4.0 教父沃夫冈解读AI研究大趋势

    沃夫冈·瓦尔斯特:大家好!欢迎大家来到这次非常重要的会议,今天主要跟大家讲一下我的经历,我在德国的一些经验以及在德国进行的AI方面的研究.我讲的主题是团队机器人,这是现在很热的领域,以及长期自主和大规 ...

最新文章

  1. Seaborn初学指南
  2. QT的QStackedLayout
  3. 一院士给博士生的一封信:每天工作12小时,这仅是一个下限!
  4. 哈哈~我这个月工资涨了1万5!
  5. 统计学习方法-李航(4)
  6. Python 爬虫-进阶开发之路
  7. Spring好处—总结
  8. 短信平台建设方案_五大垂直行业工业互联网平台建设方案
  9. ES6语法实现数据的双向绑定
  10. vue axios ts 封装流文件下载方法
  11. mysql输出九九乘法表_SQL 打印九九乘法表
  12. 12V转5V原理图(LM2596)
  13. VFP全面控制EXCEL(转自十豆三老师)
  14. visio画箭头、画点线,各种连接头
  15. MD5简介与代码实现
  16. Trunk详解(笔记)
  17. 正则表达式去掉回车、换行、空白符号、空格
  18. vb.net 如何文件指定打印机打印文件_大规模使用FDM 3D打印机的三大挑战
  19. FileZilla使用方法
  20. 【ML】KNN 原理 + 实践(基于sklearn)

热门文章

  1. a.cmd 文件里的内容
  2. 亚马逊千人评分4.6分,用小说的方式解锁开发难题!
  3. 「鸡娃」是家长无处安放的「应试」焦虑
  4. 真惨!连各大编程语言都摆起地摊了!
  5. 实用Common Lisp编程——函数
  6. 生成人脸修复模型:同时使用两个鉴别器,直接合成逼真人脸
  7. TensorFlow入门(二)简单前馈网络实现 mnist 分类
  8. 卷积神经网络(cnn) 手写数字识别
  9. 薛澜:人工智能发展要让创新驱动和敏捷治理并驾齐驱
  10. 10篇论文带你入门深度学习图像分类(附下载)