5月11日,由中国计算机学会计算机视觉专委(CCF-CV)主办,清华大学自动化系与旷视承办的“智见AI”SpringCamp顺利召开。本次训练营邀请了人工智能领域学术界和产业界的专家、学者们就“物体检测”与“深度神经网络模型设计”两个主题发表了8篇学术分享报告,吸引了300余名相关从业者与研究人员。

人工智能作为最具颠覆性和变革性的技术之一,正以不可阻挡之势席卷全球,不断渗透进社会生产生活的各个方面,推动着时代滚滚向前。但需知,从底层框架的更新迭代到整套解决方案的商业化落地都有赖于基础学术研究的进展与突破,无论新理论的提出抑或旧问题的攻克,都令这股力量更强大——它是AI浪潮涌动的原动力,是预知未来的风向标。

“智见AI”SpringCamp学术训练营由CCF-CV发起,旷视与清华大学承办,旨在打造一个交流分享最前沿人工智能领域思想和技术的平台,通过邀请顶尖大咖分享最新的研究成果,联合产业界与学术界,为各大高校的青年学术人才以及行业相关研究人员提供前沿技术交流与学习的机会,促进AI人才的培养、推动技术的进步及产学研的落地。

学术训练营活动现场

会聚前沿年青骨干 呈现关键研究新进展

出席本次训练营的主要嘉宾有:

  • 微软亚洲研究院、计算机视觉组资深研究员 代季峰博士

  • 中科院自动化所 张士峰博士

  • 旷视研究院Base Model组负责人 张祥雨博士

  • 华中科技大学电信学院教授、副院长 白翔

  • Momenta高级研发工程师 胡杰

  • 旷视研究院Detection组负责人 俞刚博士

  • 清华大学自动化系助理教授 黄高

  • 南开大学教授 程明明

活动吸引到了300余名来自人工智能领域学术界与产业界的研究人员与相关从业者参与,内容涵盖8场权威主题报告,1个开放式圆桌讨论。

旷视首席科学家、研究院院长孙剑首先在开幕致辞中对所有与会嘉宾表示欢迎,并简要阐述了当前计算机视觉技术发展现状与举办本次学术交流会的目的。随着深度学习的引入与应用,业内出现了新的机遇与挑战,如何取得新突破一方面有赖于学术界的努力,另一方面,面对理论困难与应用需求的双重夹击,产业研究中AI技术与行业的深度融合同样能够提供新视角。因此,在这样的背景下,人们需要“分享各种新的方法和新的思想,深入理解问题、深刻弄清每个细节,向前一步步推动计算机视觉理论与应用的发展”。

旷视首席科学家、研究院院长孙剑致开幕辞

随后8位专家先后做出分享,内容涵盖当前在“物体检测”与“深度神经网络模型设计”领域最火热的深度神经网络中的几何形变建模技术、物体检测算法的对比探索及展望、高效轻量级深度模型的研究与实践、面向快速推理的卷积神经网络、不规则文字检测与识别、视觉注意力机制在模式设计中的发展与应用、目标检测领域的新问题及方向、开放环境下的自适应视觉感知等方向。

活动现场精彩报告

       

代季峰
报告题目:卷积神经网络中的几何形变建模

内容大纲:

在视觉识别任务中,一个重要的挑战是如何恰当处理和建模几何形变,包括尺度、姿态、视角以及物体部件的移动等。从特征工程的时代开始,一系列著名的算法就被开发出来以尝试解决这个问题,包括SIFT,DPM等。但受限于它们的特征表达能力和局限的变性建模能力,其性能受到了很多的限制。在深度学习的时代,网络特征的表达能力大大的超出了之前手工设计的特征。但是,现有的网络模块依然难以对几何形变进行有效的处理和建模。本次talk中将会介绍在深度神经网络中的几何形变建模技术,它们能够大幅度的增强深度神经网络的几何建模能力,在各种识别任务中取得巨大的性能提升。
       

张士峰
报告题目:物体检测算法的对比探索以及展望

内容大纲:

目前基于深度学习的物体检测算法大致可以分为两类:一步法检测器和二步法检测器。一步法检测器有较高的检测速度,但检测精度不如二步法检测器。而二步法检测有较高的检测精度,但检测效率不如一步法检测器。为了使得一步法检测器获得二步法检测器的检测精度,同时保持较高的检测效率,我们对一步法和二步法检测器进行了一系列探索,提出了RefineDet、SRN、ISRN、RetinaFace等系列算法。此次分享将先概括地介绍物体检测算法,接着分享我们自己一系列相关的工作,最后对物体检测的发展进行讨论展望。
       

张祥雨
报告题目:高效轻量级深度模型的研究与实践

内容大纲:

深度基础模型在现代深度视觉系统中居于核心地位。在实际应用中,受应用场景、目标任务、硬件平台等的不同,经常会对模型的执行速度、存储大小、运算功耗等进行限制。因此,如何针对各种不同的情景设计“又好又快”的模型,成为深度学习系统实用化的重要课题。

本次讲座主要围绕实用模型设计的两个常用技术:轻量级模型设计和模型裁剪,重点介绍本团队在高效深度模型领域的科研成果和实践经验。分享内容包括ShuffleNet v1/v2系列,以及自动化模型设计、模型搜索等最新研究成果。
       

白翔
报告题目:不规则文字检测与识别

内容大纲:

场景OCR技术是一种通用的文字识别技术,已经在工业界产生了广泛的落地。近年来,学术界开始将注意力转向不规则文本的检测与识别技术研究。本次报告介绍了针对不规则文本检测与识别一些代表性方法,例如ASTER,Mask Textspotter,TextField等机近期成果,这些方法在不规则文字检测与识别任务中取得了显著的性能提升。

胡杰
报告
题目:视觉注意力机制在模式设计中的发展与应用

内容大纲:

机器学习中的注意力模型通过模拟人类视觉的注意力机制,从而在大量信息中筛选和聚焦对任务重要的信息,减少来自不重要信息和噪声的干扰。近年来,注意力机制被引入计算机视觉、自然语言处理等诸多领域,并在不同任务上取得显著的性能提升。本次报告将围绕注意力机制在计算机视觉的应用,概括总结如何在神经网络(尤其是卷积神经网络)中结合注意力机制增强网络表达能力,从而实现有效提升系统性能的目标。

俞刚

报告题目:Beyond RetinaNet and Mask R-CNN

内容大纲:

物体检测是计算机视觉中一个非常重要但同时也是很基础的技术环节。在RetinaNet以及Mask RCNN出现之后,物体检测领域在框架上面已经比较成熟,但是从技术落地角度来考虑,还有很多细节问题需要攻克。本报告将从六个维度分别来展开目标检测领域的一些新的问题以及方向。具体来讲,这六个方向是Backbone, Head, Scale variation, Batch size, Crowd,pretraining。这些技术点的攻破以及成果,会对物体检测领域的实际落地会有很大推动作用。
       

黄高
报告
题目:面向快速推理的卷积神经网络结构设计

内容大纲:

近几年,随着深度学习从实验室走向越来越多的实际应用,人们对模型的关注不仅仅在其精度方面,同时也对计算和存储效率提出了更高的要求。在提升模型效率的诸多手段中,神经网络结构创新始终是最为有效的方式之一。本报告将简单回顾卷积神经网络的几种典型结构,分析有助于提升模型效率的设计技巧与原则。与结构设计密切相关的,还有神经网络的推理方法。报告将从自适应推理的角度,介绍如何通过合理的结构设计,使模型能够针对不同的样本分配相应的计算量,达到降低平均计算开销的目的。
       

程明明
报告题目
:开放环境下的自适应视觉感知

内容大纲:

现有视觉学习技术通常依赖于大规模精确标注的训练数据。在典型实验室环境下设计和训练的人工智能模型,在行业应用场景变换时,容易导致系统性能急剧下降。本报告将从弱监督视觉理解的角度,介绍在降低模型对特定应用场景数据依赖方面所开展的一些研究工作,主要包括如何学习一些通用属性,并利用这些通用属性构建弱监督检测与分割模型。

清华大学自动化系副教授、博士生导师鲁继文(左一)主持Panel环节

结语

作为一个理论与应用实践高度结合的科学研究领域,人工智能的形象从其诞生时代小说家笔下的神秘形象逐渐具象化,渗透进社会生活、生产的方方面面。它早已不囿于实验室的理想环境、拘泥于竞赛的排行榜,而是在为各行各业的先行者们创造实际的商业价值和社会价值,成为创新与变革的助推引擎。本次SpringCamp的顺利举办是旷视对自身产学研体系建设新模式的有益探索,也是作为产业界代表反哺学术界的又一次成功尝试,对推动学术界与产业界的良性交流具有重要意义。

传送门1

下附本次活动完整视频链接(或点击“阅读原文”查看)

https://ai.yanxishe.com/page/openCourse/50?from=megvii

传送门2

欢迎大家关注如下旷视研究院官方微信号????

活动 | 旷视「智见AI」SpringCamp圆满结营 (附回放链接)相关推荐

  1. 报名 | “智见AI”SpringCamp:物体检测与深度神经网络模型设计

    AI未来的路在哪里?有的先行者早已智见!扫描下文中的二维码或点击阅读原文,即可参与本次"智见AI"SpringCamp--计算机视觉之物体检测与深度神经网络模型设计专场,与大咖一同 ...

  2. 中文语言能力评测基准「智源指数」问世:覆盖17种主流任务,19个代表性数据集,更全面、更均衡...

    来源:AI科技评论 作者:琰琰 编辑:青暮 人工智能大模型时代,评测基准成为大模型发展的风向标.从扁平到全面系统,从简化到多重维度,智源指数CUGE旨在尝试为大模型评测设计一张全面评估综合能力的新考卷 ...

  3. 1小时识别100亿张图像,每秒 80 亿亿次!「智算巨头」亮相中国南京

    「智算中心新巨头」露面!近日,南京智能计算中心正式投入运营,其运营系统的 AI 计算能力达每秒 80 亿亿次 (800P OpS),夺魁长三角当前投运的最高算力的智能计算中心. 算力yyds! 不久前 ...

  4. 欧盟发布《人工智能道德准则》:「可信赖 AI」才是 AI 的指路明灯

    https://www.toutiao.com/i6639175203039478286/ 2018-12-26 13:50:35 近日,欧盟委员会发布了由人工智能高级专家组(AI HLEG)编制的& ...

  5. 定位云原生数据中台,「智领云」获数千万元A轮融资

     点击"蓝字"关注我们 来源 | 36氪 作者 | 张丞 编辑 | 咏仪 36氪获悉,「智领云」获金沙江联合资本领投,线性资本跟投的数千万元A轮融资.本轮融资将主要用于市场拓展和产 ...

  6. 「智子倒计时」成真?今年9月全面进入Wi-Fi 6时代

    行 业 要 闻 Industry   News ▲▲▲ 0 1 Win10今年最重磅更新!Win10 2004正式版 Win10 v2004正式版来了!今年首个Windows 10正式版更新于近日上架 ...

  7. 清华「计图」、旷视「天元」纷纷重磅开源,国产深度学习框架迎来高光时刻...

    来源:CSDN 本文约3141字,建议阅读7分钟. 本文介绍清华开源的深度学习框架 Jittor(计图) 引起了广泛关注,支撑旷视诸多业务和战绩的深度学习框架 MegEngine(天元) 也将在近日开 ...

  8. 国产深度学习框架迎来高光时刻,继清华 Jittor开源后,旷视「天元」纷纷重磅开源!...

    关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! 1956年,美国的达特茅斯会议成为人工智能开启的标志性事件.同年,中国第一批自主制 ...

  9. 奥巴马竟被「去马赛克 AI」洗白,CVPR 新研究惹上种族歧视大麻烦,LeCun 也被卷入其中...

    贾浩楠 发自 凹非寺 量子位 报道 | 公众号 QbitAI 还记那只被众网友玩坏的「最强马赛克修复AI」PLUSE吗? 前两天我们报道了杜克大学发布在CVPR 2020的这项成果,还放出了一大波效果 ...

最新文章

  1. easyui php 拖动排序,Easyui 自定义排序_EasyUI 教程
  2. python持久化数据_Python数据持久化-mysql篇
  3. 水往地处流,人往地处走
  4. uni-app开发开发h5,小程序,app,注意事项
  5. 使用 visio 画软件结构图
  6. 手机wps怎么设置打印横竖_wps怎么设置横向打印
  7. iptables中DNAT、SNAT和MASQUERADE的原理
  8. 大学概率论与数理统计知识点详细整理
  9. PDF怎么合并?分享几种非常简单的合并方法
  10. 第十一届Java B组蓝桥杯真题
  11. 很遗憾,这就是现实!35岁之后软件测试工程师靠什么养家?
  12. css table 左右滑动和强制不换行
  13. vpu测试_单独编译IMX6Q的VPU示例程序:mxc_vpu_test.out
  14. 小程序源码:朋友圈集赞万能截图生成器微信小程序源码下载
  15. 层(Overlays)
  16. Homekit智能家居DIY设备一智能灯泡
  17. [Mysql] PERCENT_RANK()函数 | CUME_DIST()函数
  18. socket中的read返回0
  19. ConstrainLayout约束布局
  20. Discuz!教程之从码云下载的Discuz!代码安装后个人资料页面乱码问题修复

热门文章

  1. HTML5期末大作业:旅游网页设计——山东旅游9页(代码质量好) 学生DW网页设计作业源码 web课程设计网页规划与设计
  2. bootstrap引用glyphicon图标无法显示
  3. CSU - 2135 Appositive Body
  4. LoadRunner关联详解
  5. bootstrap-table 添加行保留原数据
  6. Typora的光标状态切换
  7. D-Wave公开演示大规模相干量子退火
  8. [申卡心得] 农行最新最全申请进度代码汇总!
  9. 反编译微信小程序,win电脑解析获取微信小程序源码
  10. 正点原子LCD转接板与最小系统板的连接