2017-12-22 10:07:03

雷锋网 AI 科技评论按:12 月 18 日,腾讯 AI Lab 宣布,其研发的人脸算法 Face R-FCN 和 Face CNN 分别在人脸检测平台 WIDER FACE 与人脸识别平台 MegaFace 的多项测评中斩获冠军。获悉这一消息后,雷锋网 AI 科技评论与腾讯 AI Lab 计算机视觉中心总监刘威博士进行了交流。

Face R-FCN 算法为针对人脸检测问题而设计,而 Face CNN 则着眼于解决人脸识别问题。据刘威博士介绍,目前 Face R-FCN 的部分技术细节已在 arXiv 上公布,Face CNN 的技术细节解读也将在未来呈现。

Face R-FCN 论文地址:https://arxiv.org/abs/1709.05256

Face R-FCN 在 WIDER FACE 三个测试均获第一

据雷锋网 AI 科技评论了解,Face R-CNN 与Face R-FCN 分别在今年的 6 月与 9 月发布在 arXiv 平台上。据刘威博士介绍,Face R-CNN 是腾讯 AI Lab 的早期研究版本,目前升级的更强版本是 Face R-FCN。

Face R-FCN 主要是基于 R-FCN(基于区域的全卷积网络)框架来解决人脸检测问题。「在 R-FCN 框架的基础上,我们采用 ResNet(残差网络)作为基础网络,结合了多尺度训练和测试、Online Hard Example Mining 等改进,并针对人脸特性设计了位置敏感平均池化的方法,提升了检测准确率。」

WIDER FACE 是由香港中文大学公开的人脸检测基准数据集,包含训练集、验证集和测试集。共包含 3.2 万张图片,39.3 万个手工标注人脸,标注人脸在尺寸、姿态、角度和遮挡等有较大程度的变化。

腾讯 AI Lab 的 Face R-FCN 算法在 WIDER FACE 测试平台中使用官方指定训练集,在简单、中等及困难模式(Easy、Medium、Hard)的全部三个测试子集中均取得第一。

WIDER FACE 人脸图像示例,绿框为腾讯 AI Lab 算法检测结果,红框为官方标注结果。

腾讯 AI Lab 提供

「和同类算法相比,Face R-FCN 在检测难度很大的人脸样本时更有优势。从 WIDER FACE 的测试结果也可看出,随着测试难度的增加, 从 Easy set 到 Medium set 到 Hard set,我们的算法的领先优势在扩大。」刘威博士如是告诉雷锋网 AI 科技评论。

WIDER FACE 验证集结果与测试集结果

via mmlab.ie.cuhk.edu.hk

Face CNN 在 MegaFace MF2 拿下「大满贯」

「针对 Face CNN,腾讯 AI Lab 在网络模型结构、损失函数、训练样本挖掘上都进行了创新性改进;和同类算法相比,Face CNN 的优势在于能比较好地适应不同的人脸应用场景,比如常规识别评测、跨年龄识别评测、1:N 辨识(Face Identification)、1:1 验证(Face Verification)等。」刘威博士向雷锋网 AI 科技评论介绍道。

Face CNN 的技术实力在人脸识别评测平台 MegaFace 的 Challenge 2(MF2)上得到了验证。MegaFace 是由美国华盛顿大学计算机科学与工程实验室发布并维护的一套公开人脸数据集,资料集包含一百万张图片,包含 690,000 个人脸。

MegaFace 包括两个不同的 Challenge,Challenge 1(MF1)与 Challenge 2(MF2)。与 MF1 可采用任何外部不限量的人脸数据来训练参赛算法不同的是,MF2 要求使用官方固定训练集 FaceScrub 和 FGNET 测试集进行训练,在给定数据集的情况下,算法的测试结果更具客观性。

系统需在百万规模人脸数据下,评定两大指标的准确率,包括:

  • 1:N 辨识,即 Face Identification,需要从 N 个人数据库中找到 1 个目标人脸;

  • 1:1 验证,即 Face Verification,比对给定的两张人脸是否为同一个身份。

MF2 分常规识别与跨年龄识别两类任务,又分别进行两大指标准确率的测试,即四项小任务。

从 MegaFace 的官网中,雷锋网 AI 科技评论了解到,在 MF2 常规识别任务的辨识准确率(1:N)、MF2 的常规识别任务的验证准确率(1:1)、MF2 的跨年龄识别任务的辨识准确率(1:N)、MF2 的跨年龄任务的验证准确率(1:1)四项任务中,腾讯 AI Lab 的 Face CNN 均获得了第一名的优秀成绩。

MF2 详细评测结果参阅:http://megaface.cs.washington.edu/results/facescrub_challenge2.html

腾讯 AI Lab 的「基础研究+落地应用」

刘威博士肯定了标准评测数据集在人脸技术发展过程中的地位。「在人脸技术发展过程中,标准评测数据集的重要性不言而喻。参与标准数据集测试时,研究人员可在固定标准下,评估算法性能,并以此为方向推动技术不断发展。」

但在人脸识别与人脸检测平台上斩获冠军,对于腾讯 AI Lab 只是研究工作的一部分。刘威博士告诉雷锋网 AI 科技评论,目前腾讯 AI Lab 计算机视觉中心的工作重点是让机器理解真实的视觉世界,

「我们的研究重点包括图像或视频的编辑、生成、分析和理解,物体或人脸的检测、跟踪和识别,以及文字识别、3D 视觉、SLAM 和基于视觉的强化学习等。」

而在基础和前沿研究方向上,CV 团队聚焦中高层视觉,尤其视频等可视结构数据的深度理解,同时也在重要的交叉领域发力,如视觉+NLP、视觉+信息检索等。刘威博士表示,「腾讯 AI Lab 正在进行或计划中的研究项目兼具了挑战性和趣味性,包括超大规模图像分类、视频编辑与生成、时序数据建模和增强现实,这些项目吸引了哥伦比亚和清华等海内外知名大学的优秀实习生参与。」

而与此同时,刘威博士也向雷锋网 AI 科技评论表示,腾讯秉承「与学界和行业『共享 AI』成果」的发展之路,以迅速将研究成果推进到应用落地阶段,缩短迭代时间。

人脸技术目前已接入包括政务、金融、安防在内的腾讯各类业务场景,据腾讯 AI Lab 介绍,每日技术调用量已超过 6 亿次。人脸技术的典型应用场景在互联网+公众服务领域,用户可以通过人脸验证,完成身份自动鉴别的「刷脸办事」。

刘威博士也向雷锋网 AI 科技评论表示介绍了腾讯 AI Lab 的其它应用内容,「除了人脸技术外,以图像和视频实时滤镜和肢体动作追踪为代表的技术在研究出来后,也马上有了应用场景,是很好的例证。」

在 SIGGRAPH ASIA 2016 的 exhibitor talk 中,腾讯 AI Lab 展示了实时视频风格转换的相关研究成果,即通过训练一个深度前向神经网络学习了如何将视频的每一帧都转换成指定的艺术风格。系统除了学习如何将一帧视频艺术化外,还学会了如何保持艺术化之后的帧间一致性。在应用层面,腾讯 AI Lab 在现场展示了多部不同电影添加视频艺术滤镜的效果。

via ai.tencent

而最近手机 QQ 刚刚上线的「高能舞室」功能,也是腾讯 AI Lab 研发的「肢体动作追踪」在移动端的率先落地。系统通过对人体 22 个关键点的实时和高精度检测,它会将人体动作与预测的动作进行比对,再进行打分。据悉,这也是与高通在AI领域的首次合作。通过高通骁龙神经处理引擎(Snapdragon Neural Processing Engine, SNPE)SDK,让 QQ「高能舞室」应用可以直接在手机上,而不需要在云端运行 QQ 相应的 AI 神经网络,以提升识别效率与运行时间。

via 腾讯

成立于 2016 年 4 月的腾讯 AI Lab 在一年多的时间内,秉承「Make AI Everywhere」的愿景,专注于 AI 基础研究与落地应用的结合,研究方向包括机器学习、计算机视觉、语音识别和自然语言处理四大方向,技术应用聚焦于内容、游戏、社交和平台工具型 AI 四个方向。据腾讯 AI Lab 官方介绍,目前研究工作已落地到微信、QQ、天天快报和 QQ 音乐等上百个腾讯产品。在行业落地上,围棋 AI「绝艺」及 AI+医疗项目「腾讯觅影」等项目取得了突破性进展。

而针对腾讯 AI Lab 的年度系列回顾总结,雷锋网将在春节前后为读者呈现,敬请期待。

腾讯AI Lab两大算法刷新人脸识别与检测纪录,秉承「基础研究+落地应用」之路相关推荐

  1. 腾讯AI Lab刷新人脸识别与检测两大测评国际记录,技术日调用超六亿

    欢迎大家前往云加社区,获取更多腾讯海量技术实践干货哦~ 作者: 腾讯技术工程官方号 2017年12月18日,深圳 - 腾讯AI Lab研发的Face R-FCN和FaceCNN算法分别在国际最大.最难 ...

  2. CVPR 2019 | 腾讯AI Lab 6大前沿方向33篇入选论文解读

    点击我爱计算机视觉标星,更快获取CVML新技术 本文转载自腾讯 AI Lab 公众号(tencent_ailab),分组介绍了CVPR 2019 中腾讯 AI Lab 的6大重点研究方向和入选的33篇 ...

  3. 深度 | 腾讯 AI Lab副主任俞栋:过去两年基于深度学习的声学模型进展

    感谢阅读腾讯AI Lab微信号第七篇文章,这是一篇深度研究的概述,论文全文可在页末下载.今年七月, IEEE/CAA Journal of Automatica Sinica发表了腾讯 AI Lab ...

  4. 腾讯AI Lab副主任俞栋:过去两年基于深度学习的声学模型进展

    本文来自腾讯AI Lab(微信号:tencent_ailab),这是一篇深度研究的概述.今年七月, IEEE/CAA Journal of Automatica Sinica发表了腾讯 AI Lab ...

  5. 腾讯 AI Lab 2021 年度回顾

    感谢阅读腾讯AI Lab微信号第136篇文章.本文将进行2021年度回顾,祝大家新年快乐! 2021年,腾讯 AI Lab 迈入第 5 个年头.作为一个尚属「年轻」的实验室,在未知而广袤的科学世界中, ...

  6. 【ACL 2020】腾讯AI Lab解读三大前沿方向及入选的20篇论文

    点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送达 来源:腾讯AI实验室 自然语言理解是腾讯 AI Lab 的主要研究方向之一,研究能力也 ...

  7. ACL 2020 | 腾讯AI Lab解读三大前沿方向及入选的20篇论文

    点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要20分钟 Follow小博主,每天更新前沿干货 来源:腾讯AI实验室 自然语言处理领域顶级会议 ACL 2020 将于 7 月 5 日至 10 ...

  8. MIT教授Tomaso Poggio演讲与专访:智能背后的科学与工程 | 腾讯AI Lab学术论坛

    来源:腾讯AI实验室 腾讯AI Lab第二届学术论坛在深圳举行,聚焦人工智能在医疗.游戏.多媒体内容.人机交互等四大领域的跨界研究与应用.全球30位顶级AI专家出席,对多项前沿研究成果进行了深入探讨与 ...

  9. 对话张潼 | 腾讯AI Lab周岁:规模飙至370人,要做后来居上的终结者

    安妮 李根 发自 成都街头  量子位 报道 | 公众号 QbitAI 14点开始的分论坛,13点就排起入场长龙,这就是腾讯AI Lab受到的关注度. 这个成立刚满一年的腾讯人工智能研发机构,是BAT中 ...

最新文章

  1. ADAS辅助驾驶_自动驾驶_技术点列表
  2. Java的表白程序_java表白程序
  3. Undefined symbols for architecture i386问题解决方法
  4. Android SDK+Eclipse+ADT+CDT+NDK 开发环境在windows 7下的搭建
  5. 云智慧悄然“变身”业务运维,到底发生了什么?
  6. 众多优质资源限时看,24小时删!
  7. CPU的使用率和负载的区别
  8. cad插入块_怎么才能将两张CAD图纸合并为一张?
  9. A股股票交易如何计算
  10. 【C语言】求1*2*3*4*5
  11. 常见游戏外挂分类及原理概述
  12. 树莓派ONVIF推流做网络摄像头
  13. 全新版大学英语综合教程第二册学习笔记(原文及全文翻译)——5A - True Height(真正的高度)
  14. 《Gartner2016年度新兴技术成熟度曲线》全解读
  15. 英特尔i5 1240H
  16. violate关键字的用法
  17. [BZOJ4430][Nwerc2015]Guessing Camels赌骆驼
  18. 2021virtualbox中Ubuntu16.04:开发环境配置,更换源
  19. Word插入希腊字母及特殊符号 分类整
  20. DAO(DBUtils实现)

热门文章

  1. 证明矩阵添加一列(行),则其秩或不变,或增加1
  2. pandas 字符串数据类型转换成数字型
  3. shell脚本调试技术
  4. linux xz 解压initrd.img,2016-8-28 linux基础学习——压缩解压缩及归档 while脚本
  5. 与大佬零距离交流,在行业报告留名,智源社区招募兼职编辑!
  6. 读样章、写评语,即有机会获赠《编程大师访谈录》!
  7. Adobe公司Flex首席产品经理作序推荐
  8. Yann LeCun:未来几十年AI研究的最大挑战是「预测世界模型」
  9. 如何造出逼真图像?南洋理工Zheng博士论文《基于深度生成学习的逼真图像合成》197页pdf阐述视觉合成工作...
  10. 【Manning新书】Kafka实战