版权说明:本文为原创文章,未经作者允许不得转载。

1 前言

想必很多知友都知道OpenAI这家初创公司。OpenAI是2015年底刚成立的人工智能公司,由Elon Musk领投,号称有10亿美金的投资额,由几位人工智能的顶尖好手组成。这基本上意味着一个新的DeepMind公司诞生,只不过这次OpenAI是一个非营利性的研究机构,不属于任何大公司。

为什么要了解OpenAI?

因为OpenAI的研究内容很大程度上代表着人工智能的研究方向,由于Elon Musk的影响力,公司非盈利的性质以及地处加州硅谷这种黄金地段,未来聚集更多顶尖人才的可能性很大,成为一个和DeepMind公司抗衡的可能性非常大。OpenAI的出现将使顶级人工智能的研究不至于被Google,Microsoft,Facebook,Baidu,IBM,Nvidia等等行业巨头垄断。

OpenAI 网址:www.openai.com
OpenAI AMA: AMA网址

OpenAI的很多成员恐怕大家都比较熟悉,有Hinton的学生 Ilya Sutskever,有李飞飞的学生 Andrej Karpathy,有Yann Lecun的学生Wojciech Zaremba,有Pieter Abbeel的学生John Schulman,也就是Andrew Ng的徒孙了。最近Ian Goodfellow大牛也加入了,Deep Learning那本书就是他主笔的。而最新的消息 Pieter Abbeel,深度增强学习的大牛,也加入了OpenAI。

OpenAI的核心目标和DeepMind公司一样,就是Solve Intelligence。解决智能,然后服务全人类,并且通过公开的方式来防止人工智能威胁。对于防止人工智能威胁的方法这里我们就不讨论了,我们更关心的是:

  • OpenAI具体在研究什么?
  • 为什么研究这些问题?
  • 这些问题是解决人工智能最关键的问题吗?

本文尝试分析以上的问题。

2 OpenAI的研究方向

从OpenAI AMA中可以看到OpenAI提了三点研究方向:

  • Training Generative Models
  • algorithms for inferring algorithms from data
  • new approaches to reinforcement learning

这基本代表了以下三个研究主题:

  • Deep Generative Model 深度生成模型
  • Neural Turing Machine 神经图灵机
  • Deep Reinforcement Learning 深度增强学习

那么这三个方向的研究的意义在哪里呢?

3 Deep Generative Model 深度生成模型

深度生成模型的研究目标是通过学习现有的数据生成新的数据,即包含监督学习,也包含无监督学习。比如下图的例子来自otoro.net,通过学习文字,然后自动生成新的文字,而这些文字人类几乎看不出区别。

比较有名的例子就是在艺术上的应用,比如Deep Dream,Neural Art,这些方法能够提取绘画艺术风格的特征,然后将特征应用在新的图片上从而产生新的图像。

除了上面的例子,还有Sequence to Sequence Learning,从序列到序列的学习。翻译:输入英文,输出中文。聊天:输入A对话,输出B对话。 输入文字,输出手写字体。另一个比较重要的工作就是Deep Generative Adversarial Networks深度生成对抗网络,以及据此发展的DCGAN深度卷积生成对抗网络:

除了以上,深度生成模型也包含one shot learning的研究,也就是看一眼图像,就衍生出其变种,最新的进展是DeepMind的 One-Shot Generalization in Deep Generative Models :

那么这方面的研究意义在哪呢?我的观点是探索人工智能的感知理解能力。一方面是不同类型数据的感知,一方面是快速感知与学习。对于不同类型数据的感知。以前只是图像识别,现在开始识别艺术特征,也可以识别文字信息的特征用于翻译对话等等。然后我们发现RNN简直无敌,什么信息都能自动提取。对于同一个seq2seq网络,用在翻译,聊天,理解炉石传说的卡片。。。 RNN可以理解任意形式的内容。另一方面我们希望能够想人类一样快速感知,而不需要巨量的训练数据,也就是看一眼就认得。

4 Neural Turing Machine 神经图灵机

理论上基于RNN计算机可以学习任何东西,那么当然也包括算法和程序了。所以Neural Turing Machine是目的是让计算机能够学习程序,从而具备推理能力。举个栗子:让计算机看很多加法运算,然后学会加法,这大概是最简单的例子。但基本是这个意思。那么Neural Turing Machine需要具备外部记忆,不过RNN,LSTM本身就具备记忆功能。想象一下未来的电脑真的变成一个“脑”:一个巨大的神经网络来实现输入输出。。

上一类研究问题是实现AI更强的感知能力,那么这一类问题可以说更变态了,直接要实现AI不仅能理解还能推导。当然本质上和第一类问题是一样的。感知也是一种理解。归根到底都是提取某种特征或者说知识信息,并且具备生成能力。依然是用RNN,目前最新的是基于增强学习的NTM。也就是说也通过自学习来增强理解。而ICLR 2016的最佳论文则通过神经网络实现程序的解释器:

  • NEURAL PROGRAMMER-INTERPRETERS

这一部分的研究还面向公式的证明,但这次是使用神经网络来证明公式。
其实只要能通过RNN使计算机具备理解能力,那么做什么事都一样。

5 Deep Reinforcement Learning 深度增强学习

上面两类问题主要依赖于现有知识,目的是使AI具备牛逼的学习能力。但是要使AI超越人类,就需要自我学习。大家知道AlphaGo能够自我学习,关键就是利用增强学习Reinforcement Learning.
因此,这部分Deep Reinforcement Learning,重点在于使用增强学习实现自学习能力。有很多任务并不是提供很多的样本,特别在机器人控制领域。这类问题严重需要自学习能力。也就是类比为人类的运动能力。大家知道我们要打篮球打得好需要长期的练习,并不是看一眼就会的。因此,Deep Reinforcement Learning,通往AGI的终极武器,要使AI具备自我学习的能力,只要给定一个目标。

OpenAI发布的第一项工作就是OpenAI Gym,增强学习研究平台,一个类似于ImageNet的平台,大家提交结果进行增强学习任务的比较。

6 小结

从以上的分析可以看出,人工智能的发展已经超出了很多人的想象,顶级人工智能学者的研究方向已经触及了强人工智能的实现核心了。OpenAI的研究方向的进展将使人工智能具备更强的学习能力,也可以说是智能水平!三种类型的研究方向其实都相互依赖,只是各有侧重,都非常酷。知友们,你们更感兴趣哪一个研究方向呢?

从OpenAI看深度学习研究前沿相关推荐

  1. 三维点云的深度学习研究综述

    作者丨aaa 来源丨https://zhuanlan.zhihu.com/p/455210291 编辑丨3D视觉工坊 摘要 点云学习由于在计算机视觉.自动驾驶.机器人等领域的广泛应用,近年来受到越来越 ...

  2. 诺亚面向语音语义的深度学习研究进展

    本文来自华为诺亚方舟实验室资深专家刘晓华在携程技术中心主办的深度学习Meetup中的主题演讲,介绍了华为诺亚面向语音语义的深度学习进展. 本次演讲简要回顾了深度学习近十年进展,重点介绍华为诺亚方舟实验 ...

  3. 德国THI大学,招聘移动视觉和深度学习研究助理和研究员

    Technische Hochschule Ingolstadt 大学(简称THI,中文译名:英戈尔施塔特工业技术大学)是位于德国南部巴伐利亚州的一所技术大学,目前正在招聘移动视觉和深度学习研究助理/ ...

  4. lstm keras 权重 理解_Keras 作者:TF 2.0+Keras 深度学习研究你需要了解的 12 件事...

    [新智元导读]Keras 作者 François Chollet 今天发表了一系列推文,如果你使用 TensorFlow 2.0 + Keras 做深度学习研究,这里有你需要知道的一切. Tensor ...

  5. 利用MONAI加速医学影像学的深度学习研究

    利用MONAI加速医学影像学的深度学习研究 Accelerating Deep Learning Research in Medical Imaging Using MONAI 医学开放式人工智能网络 ...

  6. 未能加载程序集或它的一个依赖项_英伟达发布kaolin:一个用于加速3D深度学习研究的PyTorch库...

    由于大多数现实环境是三维的,因此理想情况下,应针对3D数据训练旨在分析视频或现实环境中的完整任务的深度学习模型.诸如机器人,自动驾驶汽车,智能手机和其他设备之类的技术工具目前正在产生越来越多的3-D数 ...

  7. cvpr 深度估计_干货 | 2019 到目前为止的深度学习研究进展汇总

    本文为 AI 研习社编译的技术博客,原标题 : Best Deep Learning Research of 2019 So Far 作者 | ODSC - Open Data Science 翻译 ...

  8. 苹果叶片病害识别中的深度学习研究

    苹果叶片病害识别中的深度学习研究 1.研究内容 基于DenseNet-121深度卷积网络,提出了回归.多标签分类和聚焦损失函数3种苹果叶片病害识别方法. 2.数据集介绍 用于识别的图像数据集来源于Ai ...

  9. 斯坦福大学面向Tensorflow深度学习研究课程(2018)

    注:本博客内容摘抄自微博:爱可可-爱生活,链接:https://weibo.com/fly51fly?profile_ftype=1&is_all=1#_rnd1515898914049 [斯 ...

最新文章

  1. 基于LSTM电商评论情感分析-多评价指标可视化版(内附源码)【自然语言处理NLP-100例】
  2. 突然感到很无聊当没有看书时
  3. 前端性能优化 -- 从 10 多秒到 1.05 秒
  4. 【Boost】boost库中thread多线程详解12——线程的分离与非分离
  5. vue模板html,VueJS模板
  6. 网络交换机的作用有哪些?
  7. 从零开始用python处理excel视频_书榜 | 计算机书籍(6.29-7.5)销售排行榜
  8. netty冲突 play sbt_尝试添加MySQL / slick后,Strange Play Framework 2.2异常
  9. LOG. Supervisor基本使用
  10. sm缩写代表什么意思_PE给水管常见的字母缩写都代表什么?
  11. 了解IHttpModule接口事件执行顺便 获取Session
  12. Photoshop7.0安装步骤
  13. HanLP Demo(学习笔记)
  14. 电工学的MATLAB实践,基于Matlab/Simulink的电工学电路仿真
  15. 技术点:使用vue和element实现地图选点功能
  16. 网吧组网产品升级方案
  17. 社招两年半10个公司28轮面试面经
  18. 智慧交通:地铁站 3D 可视化,车路协同赋能科学出行
  19. Axure RP9教程 内部框架
  20. eclipse java注释乱码_Eclipse中文注释乱码解决

热门文章

  1. python爬取新闻并归数据库_Python爬取数据并写入MySQL数据库操作示例
  2. qq邮箱mx服务器,电子邮箱如何设置域名MX记录
  3. 为什么安装的是gpu版本训练时还是用的cpu?_免费GPU哪家强?谷歌Kaggle vs. Colab | 硬核评测...
  4. 创建一个简单的存储过程(RroGetA_Z),要求输出A到Z之间的26个大写字母
  5. 【c语言】蓝桥杯算法提高 三角形面积
  6. python swapcase用法_Python swapcase函数有什么用
  7. Linux设置开机自动联网
  8. 在Android中使用Android Ksoap2调用WebService
  9. Docker实践(6)—CentOS7上部署Kubernetes
  10. lucene 索引流程整理笔记