腾讯优图一年记:贾佳亚的专访笔记

  • 关于规模
  • 关于服务
  • 业务成熟的原因
  • 我们选择任务时考虑的因素有三点(目标:尽量高效利用资源)
  • 关于技术与需求之间的gap
  • 学术的人才来工业界的优势
  • 学术界与工业界的gap的例子
  • 关于模型优化方法
  • 服务体系搭建
  • 方向
  • AI+零售
  • AI+工业生产检测
  • AI+社交娱乐
  • AI+办公
  • AI+医疗

在2018年9月的腾讯优图计算机视觉峰会上,腾讯将优图实验室升级为腾讯计算机视觉研发中心,而后者第一次发布了其成立一年以来最新研究成果及战略布局。

本文是个人对机器之心的贾佳亚专访以及发布会上贾佳亚演讲的压缩整理。

原文链接:专访 | 腾讯优图实验室贾佳亚:加入优图第一年
原文作者:邱陆陆

贾佳亚是 2017 年 5 月加入优图实验室,担任总经理一职的。1 年 3 个月之后,他以「可以看到、可以感受到、可以用到」为标准,精选了优图实验室的一众技术,在上海完成了实验室的第一次对外公开亮相。


关于规模

最开始我一个人到今天管理着有几十位的博士和相当数量的开发人员团队。
我们在深圳和香港大约有一百多名研究人员,在上海和合肥也有一百多人。除此之外还有全球高校在读的很多硕士、博士生,愿意加入我们短期或者中期一起做科研。

关于服务

我们把很多视觉领域重要的算法变成了服务提供给其他团队。我们的服务调用起来非常简单:我们有整套的

  • 数据理解
  • 清洗
  • 模型构建
  • 以及在生产环节快速的服务器端和移动端调用。

业务成熟的原因

以前腾讯有不少团队都有少量的研发人员在做同方向的开发工作,后来和我们合作慢慢发现,优图的服务确实在准确度,稳定性和执行效率上都非常高,所以逐渐主动地、信赖地把业务交给我们完成,改为直接调用我们的服务。这是一个很大的变化。

我们选择任务时考虑的因素有三点(目标:尽量高效利用资源)

  • 第一是必须要可交付,以及交付后应用范围有多大;
  • 第二是关联性,这个任务和之前做过的任务是否有关联,如果有,那我们可以高效率地快速完成;
  • 第三是匹配性,项目的要求和内部的科研人的能力是否匹配。

关于技术与需求之间的gap

  • 视觉技术方面我们已经很少有优图完全没有涉猎的部分了。从自动驾驶感知的核心技术到医疗影像分割,我们把技术补充得很全面了。我们不止有一个「锤子」,而是有一个「工具箱」。(简而言之就是技术团队很强)
  • 腾讯的业务涉猎非常广泛,需求很多,钉子很多

学术的人才来工业界的优势

  • 学术界的资深学者知识储备是全面的。虽然我的最强研究成果只是计算机视觉中的一部分,但是我对整个领域都有比较清楚的认识。我知道图像识别现在最高的准确率是多少、图像分割经历了语义分割、个体分割、全景分割之后是否有新概念提出来。这种对新概念和方向的把握确保我们可以把一个不专业的需求分解,转化成技术语言和模块,然后清楚怎么找每一个问题的解决方案。
  • 我的团队没有遇到过「不知道怎么做」的问题,我们唯一的问题是「如何比业界其他团队做得更好」或者「如何创新地解决这个问题」。

学术界与工业界的gap的例子

  • 对于一些比较成熟的领域,学界产生了一些非常基础的、有效的、可以合理利用的模型,但它们并不适合在工业界直接采用。比如 ResNet 是做图像分类的常用模型。但是 ResNet 没有考虑执行效率,没有考虑类别间的距离问题。比如在缺陷检查方面,我们要考虑一些看起来非常相似,但是实际上是两类缺陷的情况,这时候这个问题就变成「细颗粒度分类」,就变成一个不适合用 ResNet 解决的问题。缺陷检测模型还需要考虑光照情况、遮挡情况,直接用开源模型改一改,不可能产生好的效果,这时就需要能力非常强的研发人员,去针对特定问题设计新的模块和环节,例如增加一些新的模块、跳转、循环方式或者特征,这是一个没有做过特定方向的深度学习研发人员所不可能设计出来的。
  • 这也是为什么市场上有很多公司说自己在做人工智能,但是独角兽只有寥寥几家。大公司里的实力一流的团队也很少。因为想要把全部前沿 AI 问题做深做透,接触各种业务,就需要非常强的人才储备和管理。

关于模型优化方法

  • 人脑的例子:5000 年以来,人类的智商是平稳,甚至稍微下降的。但是即使现在我们要学很多知识、掌握很多新工具的用法才能应付日常生活,人们也没有觉得是很大的智力负担。这是因为人脑是一个自适应的网络系统:它的基本组成构件搭成以后,整个通路的构成、参数的设置都是自适应的。5000 年前的知识,在这个框架生成了一个结果,使我们祖先在野蛮的大自然里活了下来。5000 年以后的文明环境需要的学习语文,数学,科技也可以在同样的框架下生成一个新的回路,把这些知识存储运用起来。

  • 类似地,将来不会每个领域都由各自的模型「统治」的局面,而是形成一种通用智能,把所有的框架优化到最好,合而为一。现在优化方法还处于 AI「初级阶段」,主要靠科研人员的专业知识积累。

服务体系搭建

  • 我们总计超过二百人的团队和腾讯内部的构架部门、腾讯云一起搭建了集群环境,让深度学习的网络能够在大规模并行系统上开展起来,而在此基础上,辅以精心设计的管理人员层级架构,研究人员得以专注于算法和技术,以及算法在各个端的部署,研发出了种种看得见摸得着的算法。

方向

  • 娱乐、OCR、工业检测已经有一定成果
  • 四大方向十个领域:社交娱乐(脸部操作、人体姿态理解、图像增强)、工业生产(OCR, 办公、质量检测)、社会进步(零售,文化,社会公益)、前沿探索(自动驾驶,医疗影像分析)

AI+零售

  • 智能货柜依托于商品识别,能让用户迅速完成商品购买,让商家完成供应链的管理。

AI+工业生产检测

  • 与华星光电进行合作,做面板智能检测,减少人力需求。现在我们辅助华星光电完成超过 100 道工序的检测,减少超过 60% 的质检人员。而且当新的员工进来的时候,企业可以节省一大笔培训成本,让需要用人力完成部分的人员迅速上岗。
  • 高压电线的工业检测:利用算法协同无人机,能够同时做 9 项缺陷的检查。在关键元件绝缘子的检测上面,我们在一期达到 95% 的准确率,后期我们会继续推进不同缺陷的检测。

AI+社交娱乐

  • 优图的长处是在 3D 人脸关键点、人脸分析和人脸编辑方面.
  • 新的探索方面,我们做了三维人体重建。很多游戏需要大量的动作捕捉进行 3D 建模,这是一个非常昂贵的过程。优图在思考,能否通过一个视频就实现 3D 建模的匹配和完成。这包括几个重要的方面:一个是人体重建算法,第二个是动作捕捉算法。在人体重建上,我们可以达到 53 毫米的精度,在动作捕捉上是 74 毫米的精度。我们相信这会在游戏的设计和研发过程中,产生非常大的作用。
  • 我们刚刚研发的 FaceKit,希望摆脱手机端对于三维摄像头的依赖,希望通过传统的单目摄像头,完成脸部追踪和三维重建。用一个 iPhone6 可以实现与 iPhoneX 类似的结果。我们相信这样的算法可以在非深度摄像头手机上完成娱乐场景的普及化。

AI+办公

  • OCR,是十几、二十年前很多的公司就在做的事情。对于手写体、数字、各种图标的识别都要有一个调试的阶段。优图的 OCR 一直以来是我们的强项,今年我们就加大了对于标准化数据的识别的投入。依托于第三方,我们与整个市面上现有最好的技术做了比较,在证件照、增值税发票等方面,优图所开发出来的这套 OCR 软件,能实现 95% 以及 99% 的准确率,这在行业里面是非常领先的。

AI+医疗

  • 医疗部分优图希望投入到三个主要方面: 在肺结节、宫颈癌、乳腺癌方面,通过视觉算法加上海量的医疗影像数据,通过腾讯觅影接入超过 60 多家医院提供的数据,提供全面和高效的癌症早筛的方案。我们的理念不是取代医生,而是用AI 的技术提高医生本身的确诊率。在灵敏度和特异度上,我们发现我们的结果能够产生很大的作用。在过往盲测的检测过程中,医生得到结果后,会根据我们的算法改善结果,这个操作会让癌症的识别率大大提高。
  • 这是我们与硬件厂商开始所合作的集成超声设备在做实时监测。在医生做超声的检测时,以每秒 25 帧的速度发现可疑的地方,然后把图像上传到云端,通过腾讯觅影做更精确的判断和检查,然后把结果反馈给医生。

腾讯优图一年记:贾佳亚的专访笔记相关推荐

  1. 计算机视觉已超越人类眼睛?腾讯优图与《科学》杂志全面解读

    来源:  腾讯研究院 摘要:视觉是人类认知世界的重要组成部分,而计算机视觉作为人工智能的核心技术之一,近几年的发展现状如何? 视觉是人类认知世界的重要组成部分,而计算机视觉作为人工智能的核心技术之一, ...

  2. 离开腾讯首创业,贾佳亚谈人工智能 2.0 革命,技术究竟该如何变革?

    关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! 一周前,原腾讯杰出科学家.优图实验室 X-Lab 负责人贾佳亚离职并创立了一家新的 ...

  3. 腾讯优图实验室贾佳亚:加入优图第一年 | 专访

    机器之心原创,作者:邱陆陆. 贾佳亚是 2017 年 5 月加入优图实验室,担任总经理一职的.1 年 3 个月之后,他以「可以看到.可以感受到.可以用到」为标准,精选了优图实验室的一众技术,在上海完成 ...

  4. 腾讯优图贾佳亚:人工智能的多模态发展

    https://www.toutiao.com/i6714210231108239876/ "人工智能的终极应用距离我们到底还有多久?" 贾佳亚的答案是:可能还需要50-100年. ...

  5. 尘埃落定!AI 大牛贾佳亚离开腾讯优图,创立思谋科技,投身差异化 AI 创业

    2020-02-28 01:05 导语:祝福!!! 雷锋网AI 科技评论消息,原腾讯杰出科学家.优图实验室X-Lab负责人.香港中文大学计算机科学工程系终身教授贾佳亚近日创立一家新的 AI 公司- 思 ...

  6. 腾讯优图贾佳亚:当AI进入产业应用时代时,计算机视觉技术更应该服务于人才对!...

    作者 | 刘晶晶 出品 | CSDN云计算(ID:CSDNcloud) 从移动支付的自动贩卖机到刷脸支付的智能货柜: 从亲自到柜台验证到人脸核身远程开卡: 从排队买票.排队进门的糟糕旅游体验到提前预约 ...

  7. 腾讯优图13篇论文入选ICCV2019,涉及2D图像多视图生成等研究

    允中 发自 凹非寺  量子位 报道 | 公众号 QbitAI 两年一度AI顶会ICCV已经召开,今年在韩国首尔举办. 随着论文收录名单揭晓,大会也进入放榜收获时刻. 腾讯旗下顶级视觉研发平台腾讯优图, ...

  8. 腾讯优图升级为计算机视觉研发中心,与《科学》宣布战略合作

    9月6日,在腾讯优图计算机视觉峰会上,腾讯高级执行副总裁汤道生宣布,腾讯优图实验室升级为腾讯计算机视觉研发中心,并首次公开该实验室最全面的应用落地案例:与此同时,腾讯优图实验室也正式宣布和<科学 ...

  9. 腾讯优图CVPR中标论文:不靠硬件靠算法,暗光拍照也清晰

    雷刚 发自 凹非寺  量子位 报道 | 公众号 QbitAI 暗光拍照也清晰,这是手机厂商目前激烈竞争的新拍照目标. 但除了堆摄像头和硬件,AI科学家带来算法方面的新突破. 他们提出基于深度学习优化光 ...

最新文章

  1. 5W 字的 Linux 知识总结
  2. Authorization object where used list in tcode SUIM
  3. tableau地图城市数据_Tableau 地图 | 无法识别的城市
  4. supervisor监控php进程程序,详解Supervisor进程守护监控(转)
  5. JAVA Druid 查询语句Json构造
  6. oracle如何恢复被误误删除的pdb
  7. 三国志·魏书·牵招传
  8. ADC噪声全面分析 -01- ADC噪声的类型以及ADC特性
  9. 《东周列国志》第八十四回 智伯决水灌晋阳 豫让击衣报襄子
  10. 单片机8位共阴极数码管0~99自增
  11. 【考研英语语法】形容词练习题
  12. 基站定位经纬度查询免费api接口-LBS数据仓库
  13. OOM和JVM最详细介绍
  14. 5G承载网络技术发展趋势
  15. 【181018】基于MFC文档方式制作的飞碟射击游戏
  16. fastJson 转Map 或 List
  17. U盘 PE系统制作教程(附pe启动教程+获取方式)
  18. Java获取IP地址和VUE获取IP地址。
  19. CAD20042010添加用户菜单
  20. C++与线性代数(一)实现行列式的计算

热门文章

  1. 怎么去除视频上的文字?一篇教你:视频上的文字水印怎么去除
  2. [图像去雨]--Arixv-Gradual Network for Single Image De-raining
  3. 项目经历 - 卷积网络识别古日文
  4. python 语音识别培训使用Python和Keras创建简单语音识别引擎
  5. Graph Convolutional Neural Network - Spatial Convolution 图卷积神经网络 — 空域卷积详解
  6. RAID(独立磁盘冗余阵列)
  7. java 这么获取农历_用JAVA查询中国农历年
  8. 在Sever 2012中应用iSCSI目标程序
  9. 手把手学习Vue3.0:CSS样式基础和HTML5基础收藏
  10. 【Linux】详解linux中 Nginx 常见502错误问题解决办法