本文系网易新闻-智能工作室出品

聚焦AI,读懂下一个大时代!

《2017 网易AI英雄风云榜》旨在表彰,近年在人工智能领域的技术算法的研究和创新实践之中作出突出贡献的科学家和学者,以及将人工智能技术转化为社会价值和商业价值的企业家和创业者。本次奖项设置分为技术创新人物TOP 10和商业创新人物TOP 10。

评委阵容分别是来自中国的十大资深媒体人、十大AI投资人、三大AI专业机构等,即日起,大奖组委会将开启评委提名收集工作,我们将随时公布奖项评选最新进展,欢迎关注网易智能(公众号smartman163),查看更多消息和内容。

本期对话嘉宾为旷视科技首席科学家孙剑,他阐述了公司的技术发展,分析了人脸识别技术的一些应用原理,并对计算机视觉等新技术的发展提出了自己的看法。

文 | 小羿

iPhone X的推出,不仅引爆了手机行业全面屏+人脸解锁的革新浪潮,也加速了图像识别尤其是人脸识别技术在各行各业的应用落地。

而这些应用浪潮背后,隐藏着多家计算机视觉技术公司,旷视科技是其中最显眼的一家。

旷视科技成立于2011年,是国内最早一批成立的计算机视觉技术创业公司。支付宝刷脸登录以及刷脸取款而被大众熟知,而Face++开放云平台成为其明星产品。

近日,网易智能采访了旷视科技首席科学家孙剑博士,与他聊了聊计算机视觉技术的发展以及给行业带来的不断的变革。

作为计算机视觉领域的年轻大牛,孙剑拥有40余项国际或美国专利,曾是微软亚研院首席研究员,主要研究方向是计算摄影学、人脸识别和基于深度学习的图像理解。

不断丰富开放平台,助推手机厂商普及人脸解锁

最初的Face++云平台主要是给企业客户提供相应的人脸识别解决方案,但随着人脸识别等视觉技术的应用越来越多,场景越来越丰富,Face++云平台升级为Face++人工智能开放平台。升级后的开放平台以API或SDK的形式为开发者提供人脸识别、文字识别、图像识别、物体识别、场景识别及其他人工智能能力。

据孙剑介绍,Face++人工智能开放平台提供的人脸识别应用技术已经趋于成熟,包括人脸检测、比对、搜索、属性、情绪识别、颜值评分、肤质检测等。除此之外,这个平台还上线了人体识别、文字识别以及通用图像识别,包括银行卡、驾照在内的图像都能得以实现。据悉,加入旷视一年多以来,孙剑领导旷视研究院主要研究图像分类、物体检测、语义分割和序列学习四个视觉理解核心问题。

除此之外,旷视科技针对多个热门行业推出了Face ID在线身份验证服务,包括金融、出行、直播,甚至是目前手机人脸识别的应用。

据悉,在三星和苹果手机引入人脸解锁之后,国内厂商也快速跟进,其中小米和vivo两家厂商在手机上使用的人脸识别技术就是由旷视科技提供的。

vivo最新手机X20支持人脸解锁技术

不过,与苹果iPhone X使用3D传感器和红外传感器不同,小米和vivo用的是普通的RGB前置摄像头来进行解锁,用户甚至通过软件升级就可以使用。孙剑坦言,iPhone X的人脸识别方案确实比RGB的方案要好,可以在黑暗中解锁,而且安全性更高,但缺点是iPhone X的方案成本太高,产能上有很大的不确定性,目前还很难在手机中普及。

iPhone X人脸解锁演示

据孙剑透露,截止目前,旷视的Face++人工智能开放平台已经有大约10万注册开发者,被调用60多亿次。身份认证平台去年为2.1亿多人提供了刷脸服务。孙剑称,旷视科技的Face++开放平台,更侧重于底层设计,运行速度快而且足够简洁,让开发者能够非常容易的修改或者添加定制化功能,帮助开发者节省时间,提高效率。

人脸识别不安全?取决于你的接纳程度

iPhone X推出以后,大众一方面对于人脸识别的加速普及热情高涨,一方面又为这一技术的安全性感到担忧,认为人脸识别不够安全,很容易泄露隐私,一时间各种人脸识别被破解的段子散播网络。

孙剑认为,任何技术没有绝对地安全,就手机产品来说,指纹识别也有不安全的地方。“这个取决于安全和应用性之间的平衡,”孙剑说,我们目前的人脸识别,在一定的应用环境中时候安全的,而并不是说所有的情况。

“这其实也取决于人们的接纳程度,指纹识别刚出来的时候,很多人也担心其不安全性,但后来人们还是慢慢接纳了这个应用。”孙剑解释到,“像人脸取款,有些银行已经开展了这个业务,但是有些银行还没有开展,也就是说人脸识别在各行各业的应用是伴随着人们逐步接纳的一个过程,并不是一蹴而就的。”

其实,目前的人脸识别技术距离成熟还有一段距离,比如说在人脸感知方面还有待提升等等。在孙剑看来,接下来的人脸识别需要从以下两方面取得突破:

一方面是硬件上的突破,要努力研发人脸识别新的传感器,它们不仅能够在光下感知,而且还能用深度摄像头和红外感知,这就突破了光照的影响。

另一方面是软件的突破,当你有一个巨大的数据库的时候,就可以不断的把性能提高。比如在非正常光照、侧脸/局部脸的数据上多做数据训练等等。

打造自有AI引擎,研发自有AI芯片

除了软件方面的开放平台、验证服务、解决方案之外,旷视科技还在秘密的开发者自己的硬件产品。

针对于目前很多企业开始做AI芯片的事情,孙剑在采访中透露,旷视科技也正在开发自由的FPGA芯片,它是一种可编程的芯片,可以将自家的神经网络算法放上去。“是否会做定制芯片,取决于这个应用的量是否能达到百万级。”孙剑补充到。

另外,旷视科技还开发了一款FPGA智能相机,叫做MegEye-C3S。据孙剑介绍,这是一款智能人像抓拍机,1080P全画幅,可以做到每秒30帧抓取。

据悉,旷视科技还自建了一个深度学习框架,孙剑称,这个框架内部叫Brain++,除了深度学习核心训练引擎之外,还有数据流入、GPU管理、模型发布等整套流水线过程,“Brain++是我们做计算机视觉的核心发动机。”孙剑说。

孙剑认为,对技术公司来说,行业的泡沫还没有来到。他的理由是,市场上80%的变革其实用的是现有的技术,一些新兴公司向利用AI等新技术会推翻传统公司,但是除了技术创新之外,还有很多其他方面需要跟进。(完)

注:《AI英雄》专访隶属网易智能工作室,每周围绕人工智能领域讲述一个人物故事。如需转载本文需经作者同意,违者必究!

点击阅读原文查看《AI英雄》专题

扫描二维码,观看更多精彩内容

对话旷视科技孙剑:iPhone X之外 人脸识别到底安不安全? | AI英雄相关推荐

  1. R Talk | 旷视科技孙剑博士:云、端、芯上的视觉计算

    「R Talk 」是一个深度学习专栏,将通过不定期的推送展示旷视科技的学术分享及阶段性技术成果.「R」是 Research 的缩写,也是旷视研究院的内部代号:而所有「Talk」都是来自旷视 Resea ...

  2. Dynamic Routing-中科院西交旷视(孙剑团队)提出用于语义分割的动态路由网络,精确感知多尺度目标,代码已开源!...

    关注公众号,发现CV技术之美 ▊ 写在前面 近年来,大量手工设计和基于搜索的网络被用于语义分割.然而,以前的工作(如FCN.U-Net和DeepLab系列)希望在预定义的静态网络结构中处理不同规模的输 ...

  3. AI监测分析课堂背后的旷视科技:清华学霸创立,半年亏损52亿

    近日,一张在课堂中利用人工智能对学生行为进行监测分析的图片引发网友热议.图片上的两个学生正身处教室,而教室里的人工智能系统可以监测他们听讲.睡觉.举手.趴桌子.玩手机和阅读次数.开发这一监测系统的是A ...

  4. 旷视科技IPO过会,AI技术“立业”难言轻松

    9月10日消息,旷视科技科创板上市已迈过关键节点.上交所科创板上市委员会已审议通过了旷视科技的首发申请,旷视科技的上市长跑终于迎来曙光. 2019年8月,旷视科技就向香港联交所提交了IPO申请,然而就 ...

  5. 旷视科技成立 6 周年,我们和孙剑聊了聊

    2011 年旷视(Face++)成立,成为国内最早一批在计算机视觉领域的创业公司,此后三年间,旷视科技一直致力于打造自己的人工智能开放云平台,提供人脸识别.图像识别的开放服务. 期间,它开始聚焦在两个 ...

  6. 对话旷视孙剑:比 TensorFlow 还早半年,旷视 Brain++ 的进化法则

    质疑与荣耀,技术与商业,所有疑问,或许通过这样一个国产自主的AI框架,至少可以回答一半. 打榜.噱头.争议.烧钱 创新.天才.明星.思辨 -- 评价 AI 企业,有人说他们是烧钱的机器.科技行业的共享 ...

  7. 旷视科技(Face++)和孙剑博士近期一些研究工作总结

    孙剑博士,前微软亚研院首席研究员,现任旷视科技首席科学家.在计算机视觉方向做出了很多经典的研究工作,例如:物体检测算法(Faster-RCNN 系列),深度残差网络 (Residual Network ...

  8. 【2020年高被引学者】 孙剑 旷视科技

    [2020年高被引学者]孙剑,旷视科技首席科学家,旷视研究院院长.从事计算机视觉和计算机图形学领域的研究,尤其对解决基础研究问题和建立真实的研究感兴趣.主要研究兴趣是计算摄影和基于图像的深度学习. 2 ...

  9. 干货 | 旷视科技俞刚:我在旷视研究院做检测

    https://www.toutiao.com/i6678643562231366147/ 作者俞刚,AI 科技评论获其授权转载.以下为原文: 入职旷视研究院已经四年多,一转眼已经从单兵作战,到现在有 ...

最新文章

  1. SLAM Scan-Matching/Registration
  2. iOS添加测试设备与调试
  3. python管理系统项目首选公司_Python 项目的部署,目前互联网公司有哪些成熟的方案?...
  4. 更改putty字体颜色
  5. 屌丝逆袭,通过相亲实现阶层跃迁的秘诀
  6. ssas 层次结构_分析服务(SSAS)多维设计技巧–关系和层次结构
  7. careercup-位操作5.1
  8. 力扣-33 搜索旋转排序数组
  9. Facebook团队关于网页缓存的再实践
  10. 为ui中的面板添加枚举类型脚本与json来保存信息
  11. 2021年南京大学软件工程专硕考研初试410分(数学满分)总成绩第二上岸经验贴
  12. 数据库基础(常见面试题)
  13. 已解决(MongoDB安装报错)Service ‘MongoDB Server (MongoDB)’ (MongoDB) failed tostart. Verify that you have su
  14. NRDP要比NSCA更好使用
  15. 如何在Windows和centOS系统之间实现复制粘贴?步骤如下
  16. NBA常规赛总得分排行榜(数据截止至11年4月14日)
  17. PSCC-Net: Progressive Spatio-Channel Correlation Network for Image Manipulation Detection and Locali
  18. 随性而为_2015/08/21 周五 晴
  19. Typora如何打出小黑点,空心圆,小方框
  20. 8点揭示模具爆裂的具体原因

热门文章

  1. [精品教程,新老鸟必读]:极限装机、优化全攻略(新手优化教程)
  2. 人脸识别之insightface开源代码使用——自定义数据集制作
  3. Error:A fatal exception has occurred.Program will exit
  4. 峡谷之巅显示服务器更新,峡谷之巅更新最新资讯
  5. IE和win10自带edge浏览器无法上网,其他浏览器可以(3个步骤图解)
  6. 高级语言编译的六个过程,解释程序和编译程序的区别
  7. SpringBoot (八)日志配置
  8. Go 学习笔记 Go 第三方库之 viper(解析配置文件、热更新配置文件)
  9. FrankMocap:A Monocular 3D Whole-Body Pose Estimation System via Regression and Integration 2021阅读理解
  10. 看懂Azure DevOps燃尽图(Burndown Chart)