计算机视觉前沿技术探索

摘要:计算机视觉与最前沿技术如何结合?

计算机视觉软件正在改变行业,使用户的生活变得不仅更容易,而且更有趣。作为一个有潜力的领域,计算机视觉已经获得了大量的投资。北美计算机视觉软件市场的总投资额为1.2亿美元,而中国市场则飙升至39亿美元。让我们来看看一些最有前途和更有趣的技术,因为这些技术可以让计算机视觉软件开发市场增长的更快。

一、深度学习的进步

深度学习因其在提供准确结果方面而广受欢迎。

传统的机器学习算法尽管很复杂,但其核心仍然非常简单。他们的训练需要大量的专业领域的知识和数据(这是昂贵的),在训练发生错误时需要进行人为干预,而且,他们只擅长于他们接受过训练的任务。

另一方面,深度学习算法通过将任务映射为概念层次结构的神经元网络了解手头的任务。每个复杂的概念都由一系列更简单的概念组合定义,而所有这些算法都可以自己完成。在计算机视觉的背景下,图像分类需要首先识别亮区和暗区,然后在移向全画面识别之前对线进行分类,然后进行形状分类。

当你为他们提供更多数据时,深度学习算法也会表现得更好,这是典型的机器学习算法做不到的。对于计算机视觉,深度学习是一个好的方向。它不仅允许在深度学习算法的训练中使用更多的图片和视频,而且还减轻了许多与注释和标记数据相关的工作。

零售业一直是实施计算机视觉软件的先驱。2017年,ASOS在为他们的应用添加了一个按照照片搜索的选项,之后许多零售商都跟进了。有些人甚至更进一步,并使用计算机视觉软件将在线和离线体验更紧密地结合在一起。

一家名为Lolli&Pops的美食糖果零售商使用面部识别来识别经常走进商店的购物者。因此,商店的员工可以通过提供个性化的产品推荐和千人千面的折扣来个性化购物体验。

特殊待遇可以提升品牌忠诚度,并将偶尔的购物者转变为经常性购物者。

二、边缘计算的兴起

连接到互联网和云的机器能够从整个网络收集的数据中学习并相应地进行调整,从而优化系统的性能。但是,并不能保证机器能够始终连接到互联网和云,这就是边缘计算的用武之地。

边缘计算是指附接到物理机器的技术,例如燃气轮机,喷气发动机或MRI扫描仪。它允许在收集数据的地方处理和分析数据,而不是在云中或数据中心。

边缘计算不能取代云。它只是允许机器在需要时单独处理新的数据。换句话说,边缘的机器可以根据自己的经验学习和调整,而不依赖于更大的网络。

边缘计算解决了网络可访问性和延迟的问题。在边缘计算的发展下,设备可以放置在网络连接不良或不存在的区域,此外,边缘计算还可以抵消用于数据共享的云计算的使用和维护的一些成本。

对于计算机视觉软件,这意味着可以实时更好地响应,并且只将相关数据发送到云中进行进一步分析,此功能对自动驾驶汽车特别有用。

为了安全运行,车辆将需要收集和分析与其周围环境,方向和天气状况有关的大量数据,更不用说与路上的其他车辆通信,所有这些都没有延迟。如果通过云中心化的解决方案来分析数据可能很危险,因为延迟可能导致事故。

三、点云(point cloud)对象识别

最近在对象识别和对象跟踪中更频繁使用的技术是点云。简而言之,点云是在三维坐标系内定义的数据点的集合。

该技术通常在空间(例如房间或容器)内使用,其中每个对象的位置和形状由坐标列表(X,Y和Z)表示,坐标列表称为“点云”。

该技术准确地表示了物体在空间中的位置,并且可以精确地跟踪任何移动。点云的应用是无止境的。以下是一些行业的例子以及他们从这项技术中获得的好处:

记录:资产监测,跟踪施工现场,故意破坏检测;

分类:城市规划,审计工具,便于分析,绘制必要的公用事业工作

变更检测:资产管理,货物跟踪,自然灾害管理。

预测性维护:持续监控资产和基础设施,以预测何时需要维修。

四、融合现实:VR和AR增强

今天,任何VR或AR系统都会创建一个沉浸式3D环境,但它与用户所处的真实环境几乎没有关系。大多数AR设备可以执行简单的环境扫描(例如,Google ARCore可以检测平面和光线条件的变化),VR系统可以通过头部跟踪,控制器等检测用户的运动,但他们的功能也就这样了。

计算机视觉软件正在推动VR和AR进入下一阶段的开发,有些人称之为Merged Reality(MR)。

借助外部摄像头和传感器映射环境,以及眼动跟踪解决方案和陀螺仪来定位用户,VR和AR系统能够:

感知环境并引导用户远离墙壁,物品或其他用户等障碍物。

检测用户的眼睛和身体运动并相应地采用VR环境。

提供室内环境,公共场所,地下等的指引。

Lowe's五金店已在他们的商店中使用它,每个购物者都可以借用AR设备来制作他们的购物清单,并获得商店中每件商品的指示。AR设备可以实时使用楼层平面图,库存信息和环境映射以给出准确的指示。

我们也可以通过实时3D面部识别功能更新虚拟艺术家应用程序,让客户可以看到不同的化妆产品在他们的脸上和不同光线条件下的外观。

五、语义实例分割

为了理解语义实例分割是什么,让我们首先将这个概念分为两​​部分:语义分割和实例分割。

实例分割在像素级别识别对象轮廓,而语义分割仅将像素分组到特定对象组。让我们使用气球图像来说明与其他技术相比的两种技术:

分类:此图像中有一个气球;

语义分割:这些都是气球像素;

物体检测:此图像中有7个气球,我们开始考虑重叠的对象;

实例分割:这些位置有7个气球,这些是属于每个气球的像素;

如果放在一起,语义实例分割方法将成为一个强大的工具。该工具不仅可以检测属于图片中对象的所有像素,还可以确定哪些像素属于哪个对象以及对象所在的图片中的位置。

语义实例分割是土地覆盖分类的有用工具,具有各种应用。通过卫星图像进行的土地制图可以用于政府机构监测森林砍伐(特别是非法),城市化交通等。

许多建筑师事务所也将这些数据用于城市规划和建筑开发,有些人甚至更进一步将其与AR设备相结合,以了解他们的设计在现实生活中的样子。

作者:城市中迷途小书童
链接:https://www.jianshu.com/p/8efe575c999c
來源:简书
简书著作权归作者所有,任何形式的转载都请联系作者获得授权并注明出处。

计算机视觉前沿技术探索相关推荐

  1. 【深度学习】计算机视觉相关技术探索(一)

    [深度学习]计算机视觉相关技术探索(一) 文章目录 1 计算机视觉概述 2 使用机器学习解决图像分类问题 3 Keras和神经网络简介 4 卷积神经网络(CNN),迁移学习 5 对象检测问题 6 yo ...

  2. 腾讯董志强:基建、研发、安全——云安全前沿技术探索和实践

    产业互联网飞速发展,各行各业加速"上云",相应的云上安全需求也正持续升温. 11月4日,2021腾讯数字生态大会·Techo Day技术峰会在武汉召开.Techo Day上,腾讯安 ...

  3. 基础研究和前沿技术领域校企融合协同创新的国际经验及启示

    来源:中国科学技术发展战略研究院 作者:薛姝.何光喜.张文霞 原载于<全球科技经济瞭望>2021年5月第5期 摘要:促进大学与企业的合作是各个国家科技创新政策和创新体系建设的重点任务,近年 ...

  4. 对话数十位学术合作代表:如何提升前沿技术在商业领域的落地应用?

    从去年火出天际的元宇宙,到今年年初的现象级应用 ChatGPT,科技圈似乎从不缺少热门的技术概念与话题.尤其是在云计算.人工智能.大数据等技术呈爆发式增长的背景下,我们愈发体会到前沿技术对于产业产生的 ...

  5. 蚂蚁金服ATEC技术探索大会造访伦敦,只为讲好一个普惠金融愿景

    小蚂蚁说: 英国当地时间6月11日,一年一度为期一周的伦敦科技周(London Tech Week)正式拉开帷幕.作为伦敦科技周的重要组成部分,蚂蚁金服ATEC技术探索大会在伦敦科技周首日在威斯敏斯特 ...

  6. 聚焦计算机视觉前沿,蚂蚁技术研究院4篇论文入选顶会NeurIPS

    近日,世界顶尖AI学术会议"神经信息处理系统大会"(NeurIPS 2022)公布论文接收结果,成立一年的蚂蚁技术研究院共四篇论文被录用,研究成果聚焦计算机视觉技术的前沿问题. N ...

  7. 会议邀请 | 中国中文信息学会暑期学校《前沿技术讲习班》

    ATT第13期 问答与对话-理论与基础 ATT第14期 问答与对话-技术与系统 会议时间: ATT第13期:2019年7月12~13日,ATT第14期:2019年7月14~15日 报到时间:2019年 ...

  8. Gartner:2018年前沿技术预测

    本文转载自科技中国,作者:孟海华(上海市科学学研究所),首发刊载于<科技中国>杂志2018年3月 第3期 预测. 一.人工智能 全球领先的信息技术研究与顾问公司Gartner认为,2018 ...

  9. 15位科学家预言2018年:前沿技术如何影响世界和社会生活?

    题图来源:视觉中国 钛媒体注:从能够帮助城市疏导交通的城市大脑,到进入千家万户的智能音箱:从可能颠覆现有算力的量子计算,到科幻电影中畅想的无人驾驶汽车--科技的进步与发展总是令人兴奋.近日,阿里巴巴与 ...

  10. 2020北京智源大会|旷视的技术探索、产业实践与可持续发展 AI 的打造

    导语:6月21日-6月24日,2020北京智源大会正以线上直播形式面向全球召开.来自美国.加拿大和法国的 6 位图灵奖得主,10 多位院士.上百位人工智能领袖,近 30000 名参会者,在多达 19 ...

最新文章

  1. html5 css3雪花效果,HTML5 | CSS3水晶皇冠雪花形状
  2. 什么是Promise?前端开发人员会使用Promise简直就是如虎添翼
  3. JBoss Drools –入门
  4. 实例43:python
  5. traceroute命令原理
  6. linux 火狐无法执行二进制文件_Linux无法执行二进制文件
  7. python计算机图形学_图形图像学习随笔:计算机图形学的一些基本概念
  8. 放弃腾讯75W年薪,回老家当公务员,提离职被领导教育,网友:leader嫉妒了
  9. 奥斯卡公布最佳动画长片初选名单 《哪吒》等32部动画入选
  10. 项目管理工具_项目管理工具MS Project使用经验分享
  11. excel查找和替换
  12. 阶段3 2.Spring_09.JdbcTemplate的基本使用_4 JdbcTemplate的CRUD操作
  13. python爬虫心得_Python爬虫入门心得分享
  14. 思科九年(转载自Internet)
  15. python打印列表中指定元素的所有下标(5种方法)
  16. 药片计数器电路设计与实验
  17. prometheus-容器健康状况监控
  18. python中len方法
  19. [java编程题]买苹果
  20. CT图像重构方法详解——傅里叶逆变换法、直接反投影法、滤波反投影法

热门文章

  1. fstab文件详解,mount挂载参数
  2. 一张图告诉你,自学编程和科班程序员的差别在哪!网友:很真实
  3. 【语音识别】日语语音识别系统Julius(v4.4)的基于DNN的识别(5月8号:识别结果更新)
  4. 蚂蜂窝VS穷游最世界-自由行类App分析
  5. 支持向量机SVM、支持向量回归SVR详细推导
  6. 优秀的项目经理应该具备的能力
  7. 需求与商业模式创新-需求考试复习
  8. js 浏览器下载显示进度
  9. pyqt创建窗口没有句柄_Python GUI之tkinter窗口视窗教程大集合(看这篇就够了)
  10. 【c语言数学函数库】