直播报名|美团技术沙龙56期:美团计算机视觉与多媒体技术实践--ACM MM2020专场...
【美团技术沙龙】由美团技术团队和美团科协主办,每期沙龙邀请美团及其他互联网公司的技术专家分享来自一线的实践经验,覆盖各主要技术领域。
从2020年9月起,美团技术沙龙还将打造一系列学术活动,包括顶会论文分享、学术热点研讨等,邀请产业界、学术界共同探讨前沿问题。
活动时间:2020年10月31日 14:00 - 17:00
活动地址:线上活动
活动报名:戳我报名
/出品人/
马林|美团研究员
现任美团AI平台部视觉智能中心任研究员,曾任腾讯AI Lab专家研究员、香港诺亚方舟实验室研究员。主要从事深度学习、计算机视觉、视频分析与理解等,尤其是视觉与语言的多模态深度学习方面的研究。在CVPR、ICCV、ECCV、NIPS、ICML、ACL、EMNLP、TPAMI等顶级会议和期刊上发表过多篇论文。
| 活动简介
ACM MM作为多媒体技术领域的国际顶级盛会,是学术界和工业界共同关注的焦点。本场技术沙龙将介绍美团及合作伙伴在ACM MM2020上发表的成果,希望与业界技术同行一起交流学习。
| 日程安排
| 分享介绍
主题一:混合注意力模型在视频摘要任务中的使用
王君岩|悉尼新南威尔士大学博士生
现于悉尼新南威尔士大学博士在读,曾在美团视觉智能中心实习。科研方向是视频理解与医疗影像处理,研究兴趣是图网络与元学习。
内容简介
本工作以自注意力网络为基础结构,通过二次辅助查询特征与混合注意力分布的方式提出混合注意力层,并采用“时间-空间”双通道的特征提取方式,同时使用单视频元学习的训练策略,得到我们最终的双通道混合注意力网络,使其在小数据库下能更好的解决SoftMax瓶颈的问题,并获得更好的摘要提取能力。
主题二:基于堆叠式全局-局部注意力网络的大规模食品识别技术
王致岭|美团科研课题实习生
中国科学院大学计算机技术硕士在读,目前在AI平台视觉智能中心实习,主要研究方向为菜品图像细粒度识别。
内容简介
报告介绍论文提出的菜品数据集ISIA Food500(500个类别和399,726个图像),该数据集在类别数和图片量方面都超过了现有的基准数据集。此外会介绍我们最新的菜品图像识别网络(SGLANet),该网络联合学习菜品图像的整体和局部视觉特征,在多个菜品基准数据集达到领先水平。
主题三:对话任务中的“语言-视觉”信息融合研究
徐子彭| 北京邮电大学硕士研究生
北京邮电大学智能科学与技术专业硕士研究生,研究方向为视觉对话,研究兴趣为对话、视觉-语言。
内容简介
在这篇工作中,我们强调了“回答”在目标导向视觉对话中的作用,提出了一种响应驱动的视觉状态估计器用于融合视觉对话中的对话历史信息和图片信息,其中的聚焦注意力机制有效强化响应信息,条件视觉信息融合机制用于自适应选择全局和差异信息。该估计器不仅可以用于生成问题,还可以用于目标猜测。在视觉对话的国际公开数据集GuessWhat?!上的实验结果表明,该模型在问题生成和目标猜测上都取得了当前的领先水平。
主题四:基于质量注意力生成对抗网络的不成对图像增强
倪张凯|香港城市大学博士生
香港城市大学计算机科学系在读博士,研究方向是生成模型,无监督学习和图像/视频质量评价。在TIP、TCSVT、ACM MM等期刊/会议发表论文十余篇。
内容简介
图像美学质量增强是一项基础并具有很大挑战性的任务。现有基于监督学习的图像质量增强模型还存在一系列局限性,例如获取配对训练数据的成本高、耗时长,更加重要的是获取的高质量图片并不一定被每个用户认可。基于此,我们提出一种基于质量注意力的生成模型可以有效地从非成对数据中学习面向用户的图像美学质量增强模型。
主题五:基于范例句的视频描述生成
袁艺天|清华大学博士生
清华大学在读博士生,研究方向为多媒体分析与理解,视频与文本的联合分析。
内容简介
在本工作中,我们提出了一项具有挑战性的任务,即基于范例句的句法可控制的视频描述生成问题。具体地,给定一段视频和任意一句语法正确的范例句,该任务旨在为视频生成一句自然语言描述,该句子不仅能够描述视频的语义内容,而且还要遵循给定范例句的句法形式。为了解决这种基于范例句的视频描述生成问题,我们提出了一种新颖的基于句法调制的视频描述生成器。该生成器将视频语义表示作为输入,并针对给定范例句的句法信息有条件地调制长短时记忆网络的门控向量,从而控制住用于单词预测的长短时记忆网络的隐层状态更新,最终实现句法定制的视频描述生成。大量的实验结果证明了我们的方法在生成句法可控且语义表达准确的视频描述方面的有效性。通过提供不同的范例句,我们的方法能够产生具有各种句法结构的视频描述句子,从而为增强视频描述的多样性提供了一个新颖而有效的角度。
| 感谢
活动主办方:美团技术团队、美团科学技术协会
宣传合作方:活动行
| 报名方式
《美团技术沙龙第56期:美团计算机视觉与多媒体技术实践--ACM MM 2020专场》报名请戳:报名。
| 重要提醒
添加小助手美美的微信(MTDPtech05),回复:1031,即可加入活动微信群,与讲师、同行零距离交流。
往期活动PPT及视频干货,请扫描下方的二维码,关注美团技术团队公众号(meituantech),然后通过【菜单栏】下的【技术沙龙】进行查看。
直播报名|美团技术沙龙56期:美团计算机视觉与多媒体技术实践--ACM MM2020专场...相关推荐
- 直播预告 | 百度技术沙龙——百度大数据系统探索研究及应用实践
8月25日,数据派THU联合百度技术沙龙将为大家带来"百度大数据系统探索研究及应用实践"的专题分享. 百度多年来积累了非常丰富的大数据系统研究开发.应用实践的经验:为Apache ...
- 报名 | 美团技术沙龙第64期:美团不同业务场景下的系统架构实践
[美团技术沙龙]由美团技术团队和美团科协主办,每期沙龙邀请美团及其他互联网公司的技术专家分享来自一线的实践经验,覆盖各主要技术领域.从2015年7月举办第一期美团技术沙龙至今,已经吸引了三万多名工程师 ...
- 直播报名|美团技术沙龙:美团算法实践——搜索、广告、推荐专场
[美团技术沙龙]由美团技术团队和美团科协主办,每期沙龙邀请美团及其他互联网公司的技术专家分享来自一线的实践经验,覆盖各主要技术领域. 从2020年9月起,美团技术沙龙还将打造一系列学术活动,包括顶会论 ...
- 【美团技术沙龙】前端遇上黑科技,打造全新界面体验与效率
美团技术沙龙由美团技术团队主办,每期沙龙邀请美团及其他互联网公司的技术专家分享来自一线的实践经验,覆盖各主要技术领域. / 出品人 / 冯湧,美团研发总监 现就职于美团金服担任美团支付.保险平台业务研 ...
- 广州技术沙龙第二期活动总结
赖勇浩(http://laiyonghao.com) 总述 2009 年 9 月 19 日,在众多朋友的鼎力支持下,广州技术沙龙第二期开始了!来自包含但不限于新浪.金山.网易.腾讯.梦境.4399.c ...
- 【直播报名】使用mpvue开发微信小程序的最佳实践
美团点评技术沙龙Online:美团点评技术团队推出的线上分享课程,每月2-3期,我们采用视频直播形式,邀请来自美团点评的技术专家,面向互联网技术从业人员,搭建线上技术分享平台,分享一线实战经验.欢迎关 ...
- 【免费报名】技术沙龙第22期:美团点评AI实践
美团点评技术沙龙由美团点评技术团队主办,每期沙龙邀请美团点评及其他互联网公司的技术专家分享来自一线的实践经验,覆盖各主要技术领域. 最近来,随着硬件计算能力的增强,以及大数据的爆破式增长,深度学习技术 ...
- 免费报名OLM技术沙龙:业务与系统综合性能管控实战
随着市场需求的不断更新.变化,企业需要整合处理业务数据和服务优化,这就要通过对整个企业 IT 系统监控平台的统一管理来提升系统核心性能,降低故障发生频率,从而提高故障监控和问题处理效率.那么企业该如何 ...
- 美团技术:设计模式在美团外卖营销业务中的实践
1.前言 随着美团外卖业务的不断迭代与发展,外卖用户数量也在高速地增长.在这个过程中,外卖营销发挥了"中流砥柱"的作用,因为用户的快速增长离不开高效的营销策略.而由于市场环境和业务 ...
最新文章
- mysql metadata lock(一)
- createQuery与createSQLQuery
- 给你安利几个牛逼的公众号~
- buffer和cache怎么让你们解释的那么难理解?
- 【51Nod - 1270】数组的最大代价(dp,思维)
- 决定c++语言中函数的返回值类型的是,全国2009年10月高等教育自学考试C++程序设计试题及部分参考答案...
- Postcard:简单的音乐贺卡制作
- 【HTML5】Web存储、通信、地理位置
- 灰度拉伸python_灰度变换之灰度线性拉伸(算法1)
- 一定要吃透的四个人性真相
- 三种div居中显示方式
- 大数据Hadoop技术的发展历史与未来前景
- 解决戴尔电脑耳机插入后无效,外放正常的问题
- 网络中常用的各种协议名称(中英文)和具体含义
- unity水流效果插件Obi Fluidv4.1
- Excel学习日记:L22-时间格式工龄与工时的计算
- python3 get爬取网页标题、链接和链接的数字ID
- linux xz文件解压
- 分布式架构设计中的CAP原理
- Centos7安装freeswitch-1.10.8(2023)
热门文章
- java clh_CLH lock 原理及JAVA实现
- 《程序员的职业修养》读后感(一):专业主义
- 最新版Eclipse2020创建项目红叉问题(“Failed to init ct.sym ...\jrt-fs.jar )
- CF1385 D. a-Good String (分治+递归)
- [分享]SQl语句学习专题
- Code Craft(编程匠艺)之代码的生命(一)
- mysql 100w 查询耗时4秒_MySql百万数据0秒筛选查询
- 初识 PS CS6(十三)___用快速选择工具择图
- 小米MIUI开发版应用闪退问题 Secure.ANDROID_ID must not be null
- 2021年锅炉作业 (G)工业锅炉司炉 (G1)考试题库