点击上方“视学算法”,选择“星标”

干货第一时间送达

整理:3D视觉工坊 | 来源:知乎

https://www.zhihu.com/question/330153893/answer/1293995463

本文仅作为学术分享,如果有侵权,会删文处理

2020年,计算机视觉领域会有哪些新的研究方向值得提前探索?

作者:罗浩.ZJU
https://www.zhihu.com/question/330153893/answer/721238966


作者:
育心https://www.zhihu.com/question/330153893/answer/740254474

结合计算机视觉、机器人领域5大顶会(CVPR/ICCV/IROS/ICRA/ECCV),以及产业界的需求,总结3个当下热门及前沿的研究领域。

三维视觉

三维视觉是传统的研究领域,但最近5年内得到快速发展。三维视觉主要研究内容有:三维感知(点云获取及处理)、位姿估计(视觉SLAM)、三维重建(大规模场景的三维重建、动态三维重建)、三维理解(三维物体的识别、检测及分割等)。

图 1 3D 视觉的应用场景

3D视觉在CV顶会上的论文比例,也在逐年增加。

图 2  3D视觉在3大视觉顶会的论文比例

视频理解

随着新型网络媒体的出现,以及5G时代的到来,视频呈现爆炸式增长,已成为移动互联网最主要的内容形式。面对于海量的视频信息,仅靠人工处理是无法完成的,因此实现视频的智能化理解则成为了亟待解决的问题。

自2012年,深度学习在图像理解的问题上取得了较大的突破,但视觉理解比图像的目标检测识别要复杂的多。这是因为视频常有许多动作,动作往往是一个复杂概念的集合,可以是简单的行为,但也可能是带有复杂的情绪、意图。举个简单的例子,对一段视频分类,与对一幅图像分类,哪个更容易一些?

从最近几年知名的计算机视觉竞赛,也可以看出,图像层面的竞赛在减少,视频层面的竞赛在增加。

多模态融合

多模态融合的知识获取是指从文本、图片、视频、音频等不同模态数据中交叉融合获取知识的过程。

随着计算机视觉越来越成熟之后,有一些计算机视觉解决不了的问题慢慢就会更多地依赖于多个传感器之间的相互保护和融合。

小结

怕什么真理无穷,进一寸有一寸的欢喜!

作者:oneTaken
https://www.zhihu.com/question/330153893/answer/730187742

个人感觉视觉和语言的联合还是很有前途的,虽然说目前坑比较多,但是万一那一天有了突破就是飞速的发展。

他还举了个例子,一团烟雾的行为可以用公式描述,但是一颗树的生长行为是由温度、光照、水、气候等等许多复杂的因素在很长时间内连续变化所影响的,那么它就是没办法简单地解释的。

举的这个例子并不恰当,反而恰恰说明了神经网络模型解释性的迫切性。一棵树生长的影响因素虽然说是有很多,但是至少我们明确知道控制变量条件下,恰当的温度、恰当的水分等条件可以明确引导树向生长较好的方向生长。

然后对于一个神经网络模型而言,无论是哪个任务,我们都很难说控制只控制某一种因素就可以往预期的方向发展。

2020年,计算机视觉领域会有哪些新的研究方向值得提前探索?相关推荐

  1. 阿里巴巴计算机视觉领域最强阵容集结完毕团体参加CVPR会议

    6月18日~22日,计算机视觉领域最具影响力之一的学术会议 IEEE CVPR-18将在美国盐湖城召开.据 CVPR 官网显示,今年超过 3300 篇论文投稿,其中录取 979 篇:相比去年 783 ...

  2. 阿里巴巴史上最强阵容 参加计算机视觉领域顶级会议CVPR

    6月18日~22日,计算机视觉领域最具影响力之一的学术会议 IEEE CVPR-18 在美国盐湖城召开.据 CVPR 官网显示,今年超过 3300 篇论文投稿,其中录取 979 篇:相比去年 783 ...

  3. NLP 新范式 Transformer 模型在计算机视觉领域的应用如何?

    编者按:Transformer 模型在自然语言处理(NLP)领域已然成为一个新范式,如今越来越多的研究在尝试将 Transformer 模型强大的建模能力应用到计算机视觉(CV)领域.那么未来,Tra ...

  4. a类论文 计算机视觉,【科研新进展】(21)我校教师首次在计算机视觉领域A类会议上发表论文...

    近日,信息学院宁纪锋教授的一篇论文被IEEE Conference on Computer Vision and Pattern Recognition (CVPR)接收并发表,这是我校教师在计算机视 ...

  5. 2020年人工智能领域突破性工作

    总结一下个人认为2020年人工智能领域称得上突破的一些工作,涉及到DETR.ViT.BYOL.NeRF.GPT-3和AlphaFold2六个王炸. DETR DETR是首个将完整的Transforme ...

  6. 【学术相关】2020年AI领域有哪些让人惊艳的研究?

    炼丹笔记干货 时晴,炼丹小仙女 前段时间,Google Brain科学家Barret Zoph表示,他们设计了一个名叫「Switch Transformer」的简化稀疏架构,将语言模型的参数量扩展至 ...

  7. 2020年计算机视觉综述论文汇总!涵盖14个方向:目标检测/图像分割/医学影像/人脸识别等方向

    导读:本文共汇总了从2020年4月至今的计算机视觉领域综述性论文,共54篇,涵盖图像分割. 图像识别.人脸识别/检测.医学影像.目标检测.3D方向(自动驾驶/深度估计).GAN.文本检测与识别.姿态估 ...

  8. 2020年AI领域有哪些让人惊艳的研究?

    作者:时晴,公众号:炼丹笔记 前段时间,Google Brain科学家Barret Zoph表示,他们设计了一个名叫「Switch Transformer」的简化稀疏架构,将语言模型的参数量扩展至 1 ...

  9. Transformer在计算机视觉领域走到哪了?

    本文转载自微软研究院AI头条 编者按:Transformer 模型在自然语言处理(NLP)领域已然成为一个新范式,如今越来越多的研究在尝试将 Transformer 模型强大的建模能力应用到计算机视觉 ...

最新文章

  1. 符号执行:利用Angr进行简单CTF逆向分析
  2. Inversion Sequence(csu 1555)
  3. windbg学习-------.expr和masm表达式
  4. js判断ipad还是安卓_最近iPad做电子笔记很流行?综合分析你知道的所有笔记方式。...
  5. SpringBoot整合Scala构建Web服务
  6. 51单片机课程设计数显简易频率计设计
  7. idea 无法新建工程
  8. OA自动化制造自动化
  9. 公平的席位分配MATLAB编程(Q值法)
  10. JavaPoet 的使用
  11. 自由软件许可证GPL
  12. java 自动论坛评论,Java论坛系统巡云轻论坛
  13. Python ORM之peewee模块
  14. JVM系列五JVM监测工具[整理中(转)
  15. python long类型_python获取当前时间戳Long类型
  16. 如何做到精通GitLab CI/CD?
  17. 安卓期末大作业——Android弹力球小游戏
  18. 关于主流浏览器的内核问题
  19. linux 监控网线拔掉,linux应用层监控网线插拔状态的实现.doc
  20. 爱国者u盘linux驱动,爱国者u盘驱动下载-aigo爱国者u盘驱动下载电脑版-121软件园...

热门文章

  1. 【通俗理解线性代数】 -- 矩阵的等价与相似
  2. LSGO代码小组第16周复盘日志
  3. 创建图像 php,详解php创建图像具体步骤
  4. 网络设置巨形帧_Trunk的概念与设置
  5. 你的编程能力从什么时候开始突飞猛进的?
  6. 雷军的最后一次 重 大 创 业
  7. 腾讯AI开源框架Angel 3.0重磅发布:超50万行代码,支持3种算法,打造全栈机器学习平台...
  8. Facebook开源图嵌入“神器”:无需GPU,高效处理数十亿级实体图形 | 极客头条...
  9. 微软亚研院提出用于语义分割的结构化知识蒸馏 | CVPR 2019
  10. 秘籍 | 机器学习数据集网址大全