孙剑博士,前微软亚研院首席研究员,现任旷视科技首席科学家。在计算机视觉方向做出了很多经典的研究工作,例如:物体检测算法(Faster-RCNN 系列),深度残差网络 (Residual Network),经典去雾算法( Single Image Haze Removal using Dark Channel Prior)等。2016年6月底,孙剑博士加入AI领域初创Face++(旷视科技)担任首席科学家,在当时的AI圈引起了不小骚动。下面旷视科技(Face++)和孙剑博士近期一些研究工作总结,以期从中管中窥豹,略见一斑。

1. https://arxiv.org/pdf/1612.00603,“A Point Set Generation Network for 3D Object Reconstruction from a Single Image”
这篇文章研究是如何从单幅照片重构照片中物体三维形状。文中提出利用三维点云来表示物体三维形状的方法。与传统的基于三维网格的方法相比,三维点云的表示更灵活。文中利用C-GAN (Conditional Generative Adversarial Network)的想法,将点云的生成看成一个采用过程,利用深度神经网络建模概率密度函数。得到了优于其他方法的效果。

2. https://arxiv.org/abs/1612.08843, “FastMask: Segment Multi-scale Object Candidates in One Shot”
这篇文章研究的物体分割问题(Segmentation),文中提出一种One-Shot的方式处理图像中物体的多尺度问题。多尺度(物体在图像中的尺度)问题是物体检测,分割任务的基本问题之一。多尺度的传统的处理是使用图像金字塔的方法来处理(即所谓的Multi-Shot)。传统方法的主要问题是计算复杂度高,很好时。本文提出一种新的One-Shot的物体分割算法框架,该框架有三个功能模块Body-Neck-Head:Body模块对输入图像进行处理,得到图像的特征图(feature map);Neck模块递归地缩小特征图,处理物体的多尺度问题;Head模块利用滑动窗口的方法重构出物体的分割图。该方法在 MS-COCO基准测试上取得了目前最好的效果,并且比传统方法块2-5倍。在略微损失精度的情况下,速度可以达到13fps (800*600清晰度图片)。

3. https://arxiv.org/abs/1704.03155, "EAST: An Efficient and Accurate Scene Text Detector"
这篇文章研究的是现实场景中文字识别问题。文中提出了一种端到端的场景文字识别算法框架。其想法是利用深度神经网络直接从图像中预测文本框的几何位置(四边形位置,文本方向),其中处理多尺度的方法是U-Net(or FPN)想法。本文的方法在ICDAR 2015, COCO-Text 和MSRA-TD500数据集上取得了目前最好的精度和效率。

4. https://arxiv.org/abs/1703.02719, "Large Kernel Matters-Improve Semantic Segmentation by Global Convolutional Network"
这篇文章研究的是图像分割问题。文中提出了一个GCN(Global Convolutional Network)来处理物体的分类和位置预测。利用了类似U-Net的想法在特征图上处理多尺度问题,将k*k卷积核拆分k*1 + 1*k两个卷积核达到既增加Receptive Field又不增加模型复杂度的目的,在PASCAL VOC 2012和Cityscapes数据集合上取得了优于以前算法的效果。

5. https://arxiv.org/abs/1702.00953, "Deep Learning with Low Precision by Half-wave Gaussian Quantization"
这篇研究的神经网络加速问题。文中考虑的网络激活(特征层)的量化问题。本文的主要想法是基于网络中每一层的激活值的分布(例如Guassian分布)量化激活。特别文中考虑如何逼近ReLU激活,文中给出了ReLU激活量化方法(Forward形式和Backward形式)。对AlexNet, ResNet, GoogLeNet 和 VGG-Net取得了超过以前的1-bit权重,2-bit激活网络的效果。

旷视科技(Face++)和孙剑博士近期一些研究工作总结相关推荐

  1. 对话旷视科技孙剑:iPhone X之外 人脸识别到底安不安全? | AI英雄

    本文系网易新闻-智能工作室出品 聚焦AI,读懂下一个大时代! <2017 网易AI英雄风云榜>旨在表彰,近年在人工智能领域的技术算法的研究和创新实践之中作出突出贡献的科学家和学者,以及将人 ...

  2. 年仅46岁,西交大人工智能学院首任院长、孙剑博士突发疾病去世

    本文来源:西安交通大学人工智能学院官网.新智元.量子位.旷视MEGVII 6月14日凌晨,旷视首席科学家.西安交通大学人工智能学院首任院长孙剑博士突发疾病去世,享年46岁. 西安交通大学人工智能学院官 ...

  3. 旷视首席科学家、知名AI学者孙剑博士去世

    点击上方"码农突围",马上关注 这里是码农充电第一站,回复"666",获取一份专属大礼包 真爱,请设置"星标"或点个"在看&quo ...

  4. 悼念!孙剑博士凌晨逝世,AI痛失大牛,旷视痛失技术领路人

    编辑部 发自 凹非寺 量子位 | 公众号 QbitAI 旷视首席科学家.旷视研究院院长孙剑博士,今日凌晨因病不幸离世. 孙剑博士1976年10月出生,今年45岁.他曾任微软亚研院首席研究员,此前两次获 ...

  5. CVPR2021|ACNet再进化,清华大学旷视科技提出Inception类型的DBB

    编辑:Happy 首发:AIWalker 原创文章,未经授权,禁止二次转载 paper: https://arxiv.org/pdf/2103.13425.pdf code: https://gith ...

  6. 旷视科技完成4.6亿美元C轮融资,打破商汤4.1亿美元单轮融资记录

    来源:亿欧 概要:本轮融资很可能会被用于加快在城市综合大脑及手机智能领域的技术落地,打造智慧城市. 2017年10月31日消息,人工智能公司旷视科技(Face++)已于近期完成C轮融资,本轮融资金额约 ...

  7. R Talk | 旷视科技孙剑博士:云、端、芯上的视觉计算

    「R Talk 」是一个深度学习专栏,将通过不定期的推送展示旷视科技的学术分享及阶段性技术成果.「R」是 Research 的缩写,也是旷视研究院的内部代号:而所有「Talk」都是来自旷视 Resea ...

  8. 旷视孙剑博士提出LGD,训练速度提升51%,适用于目标检测的知识蒸馏

    来源:新智元 [导读]知识蒸馏已经成了目前常用的模型压缩方法,但相关研究还局限在图像分类任务上.最近旷视孙剑博士联手西安交大发表了一篇论文,提出新模型LGD,无需一个强力的teacher模型也能在目标 ...

  9. 旷视科技成立 6 周年,我们和孙剑聊了聊

    2011 年旷视(Face++)成立,成为国内最早一批在计算机视觉领域的创业公司,此后三年间,旷视科技一直致力于打造自己的人工智能开放云平台,提供人脸识别.图像识别的开放服务. 期间,它开始聚焦在两个 ...

最新文章

  1. setuptools的package_data问题
  2. 速卖通物流发货怎么操作?“解读”重点国家市场物流状况
  3. ubuntu16.04下安装ibus拼音
  4. 面试题:ConcurrentHashMap 和 Hashtable 的区别
  5. java集合的扩容研究
  6. sql查询初学者指南_面向初学者SQL Server查询执行计划–类型和选项
  7. VS2015 自动代码补全
  8. python turtle库详解_Python turtle库详解
  9. Mushroom Classification(蘑菇分类数据集)
  10. PHP图片尺寸调整(全填充,没有黑底)
  11. 使用JS判定PC浏览器和IE浏览器
  12. linux系统scsi硬盘,Linux系统SCSI磁盘管理全攻略(一)
  13. git--基本知识点--1--工作区/暂存区/版本库
  14. XXE漏洞的详解与利用
  15. 矢量线的一种栅格化算法
  16. 测量学—数字测图原理与方法
  17. java wssocket close_javax.websocket.Session的一个close异常记录
  18. 多个ai文件合并成pdf_设计作品集整理必看——在PS与AI中如何快速导出PDF文档
  19. Distcp结合HDFS Fastcopy的性能改造提升
  20. 机器学习——英文特征提取,中文特征提取

热门文章

  1. 《C++标准库》学习笔记 — STL —流
  2. #4508. Triples I
  3. containerd 拉取k8s.gcr.io/pause镜像i/o timeout
  4. Mac电脑如何安装win7系统
  5. JAVA音程_下列选项中哪个音程是减三和弦?
  6. 弦理论三先驱获2020年狄拉克奖
  7. [bzoj3998]弦论
  8. Eclipse执行junit测试时出现Errors occurred during the build. Errors running builder 'Integrated External Too
  9. 测试学习--云测试平台
  10. 【Datawhale组队学习】机器学习数学基础 - 一元函数微分学的几何应用【Task 04】