目录

深度学习的应用
一、计算机视觉
二、自然语言处理
三、强化学习
主流框架

深度学习的应用

一、计算机视觉

1、图片识别(Image Classification) 是常见的分类问题。神经网络的输入为图片数据,输出值为当前样本属于每个类别的概率,通常选取概率值最大的类别作为样本的预测类别。图片识别是最早成功应用深度学习的任务之一,经典的网络模型有 VGG 系列、Inception 系列、ResNet 系列等。
2、目标检测(Object Detection) 是指通过算法自动检测出图片中常见物体的大致位置,通常用边界框(Bounding box)表示,并分类出边界框中物体的类别信息,如图 下图所示。常见的目标检测算法有 RCNN,Fast RCNN,Faster RCNN,Mask RCNN,SSD,YOLO 系列等。

3、语义分割(Semantic Segmentation) 是通过算法自动分割并识别出图片中的内容,可以将语义分割理解为每个像素点的分类问题,分析每个像素点属于物体的类别,如图 下图 所 示。常见的语义分割模型有 FCN,U-net,SegNet,DeepLab 系列等。

4、视频理解(Video Understanding) 随着深度学习在 2D 图片的相关任务上取得较好的效果,具有时间维度信息的 3D 视频理解任务受到越来越多的关注。常见的视频理解任务有视频分类,行为检测,视频主体抽取等。常用的模型有 C3D,TSN,DOVF,TS_LSTM等。
5、图片生成(Image Generation) 通过学习真实图片的分布,并从学习到的分布中采样而获 得逼真度较高的生成图片。目前主要的生成模型有 VAE 系列,GAN 系列等。其中 GAN 系 列算法近年来取得了巨大的进展,最新 GAN 模型产生的图片样本达到了肉眼难辨真伪的效果,如下图为 GAN 模型的生成图片。

二、自然语言处理

1、机器翻译(Machine Translation) 过去的机器翻译算法通常是基于统计机器翻译模型,这也是 2016 年前 Google 翻译系统采用的技术。2016 年 11 月,Google 基于 Seq2Seq 模型上线了 Google 神经机器翻译系统(GNMT),首次实现了源语言到目标语言的直译技术,在多项任务上实现了 50~90%的效果提升。常用的机器翻译模型有 Seq2Seq,BERT,GPT,GPT-2 等,其中 OpenAI 提出的 GPT-2 模型参数量高达 15 亿个,甚至发布之初以技术安全考虑为由拒绝开源 GPT-2 模型。
2、聊天机器人(Chatbot) 聊天机器人也是自然语言处理的一项主流任务,通过机器自动与人类对话,对于人类的简单诉求提供满意的自动回复,提高客户的服务效率和服务质量。常应用在咨询系统、娱乐系统,智能家居等中。

三、强化学习

1、虚拟游戏相对于真实环境,虚拟游戏平台既可以训练、测试强化学习算法,有可以避免无关干扰,同时也能将实验代价降到最低。目前常用的虚拟游戏平台有 OpenAI Gym,OpenAI Universe,OpenAIRoboschool,DeepMind OpenSpiel,MuJoCo 等,常用的强化学习算法有 DQN,A3C,A2C,PPO等。在围棋领域,DeepMind AlaphGo 程序已经超越人类围棋专家;在 Dota2 和星际争霸游戏上,OpenAI 和 DeepMind 开发的智能程序也在限制规则下战胜了职业队伍。
2、机器人(Robotics) 在真实环境中,机器人的控制也取得了一定的进展。如 UC Berkeley在机器人的 Imitation Learning,Meta Learning,Few-shot Learning 等方向取得了不少进展。美国波士顿动力公司在人工智能应用中取得喜人的成就,其制造的机器人在复杂地形行走,多智能体协作等任务上表现良好(如图)。

3、自动驾驶(Autonomous Driving) 被认为是强化学习短期内能技术落地的一个应用方向,很多公司投入大量资源在自动驾驶上,如百度、Uber,Google 无人车等,其中百度的无人巴士“阿波龙”已经在北京、雄安、武汉等地展开试运营,下图为百度的自动驾驶汽车。

主流框架

1、PyTorch:PyTorch 是 Facebook 基于原有的 Torch 框架推出的采用 Python 作为主要开发语言的深度学习框架。PyTorch 借鉴了 Chainer 的设计风格,采用命令式编程,使得搭建网络和调试网络非常方便。尽管PyTorch 在 2017 年才发布,但是由于精良紧凑的接口设计,PyTorch 在学术界获得了广泛好评。在 PyTorch 1.0 版本后,原来的 PyTorch 与 Caffe2进行了合并,弥补了 PyTorch 在工业部署方面的不足。总的来说,PyTorch 是一个非常优秀的深度学习框架。
2、TensorFlow:TensorFlow 是 Google 于 2015 年发布的深度学习框架,最初版本只支持符号式编程。得益于发布时间较早,以及 Google 在深度学习领域的影响力,TensorFlow 很快成为最流行的深度学习框架。但是由于 TensorFlow 接口设计频繁变动,功能设计重复冗余,符号式编程开发和调试非常困难等问题,TensorFlow 1.x 版本一度被业界诟病。2019年,Google 推出 TensorFlow 2 正式版本,将以动态图优先模式运行,从而能够避免TensorFlow 1.x 版本的诸多缺陷,已获得业界的广泛认可。

小结:目前来看,TensorFlow 和 PyTorch 框架是业界使用最为广泛的两个深度学习框架,TensorFlow 在工业界拥有完备的解决方案和用户基础,PyTorch 得益于其精简灵活的接口设计,可以快速设计调试网络模型,在学术界获得好评如潮。TensorFlow 2 发布后,弥补了 TensorFlow 在上手难度方面的不足,使得用户可以既能轻松上手 TensorFlow 框架,又能无缝部署网络模型至工业系统。本书以 TensorFlow 2.0 版本作为主要框架,实战各种深度学习算法。

深度学习的应用及主流框架相关推荐

  1. DL:听着歌曲《成都》三分钟看遍主流的深度学习的神经网络的发展框架(1950~2018)

    DL:听着歌曲<成都>三分钟看遍主流的深度学习的神经网络的发展框架(1950~2018) 视频链接:听着歌曲<成都>三分钟看遍主流的深度神经网络的发展框架(1950~2018) ...

  2. 系统学习深度学习(七)--主流深度学习开源框架对比

    转自:http://blog.csdn.net/u010167269/article/details/51810613,本文做了相关修改. 参考论文:<Comparative Study of ...

  3. 腾讯 AI Lab 正式开源PocketFlow自动化深度学习模型压缩与加速框架

    11月1日,腾讯AI Lab在南京举办的腾讯全球合作伙伴论坛上宣布正式开源"PocketFlow"项目, 该项目是一个自动化深度学习模型压缩与加速框架,整合多种模型压缩与加速算法并 ...

  4. 支持移动端深度学习的几种开源框架

    原文:http://blog.csdn.net/zchang81/article/details/74280019 支持移动端深度学习的几种开源框架 1.Caffe的移动端项目 caffe项目连接如下 ...

  5. 【深度学习】Keras和Tensorflow框架使用区别辨析

    [深度学习]Keras和Tensorflow框架使用区别辨析 文章目录 1 概述 2 Keras简介 3 Tensorflow简介 4 使用tensorflow的几个小例子 5 Keras搭建CNN ...

  6. 【深度学习】利用神网框架分割病理切片中的癌组织(胃)

    [深度学习]利用神网框架分割病理切片中的癌组织(胃) 文章目录 1 数据描述 2 思路 3 准备数据 4 构建模型 5 模型优化 6 程序执行 7 观察结果 1 数据描述 初赛选取癌病理切片,为常规 ...

  7. 基于深度学习的中文语音识别系统框架搭建

    基于深度学习的中文语音识别系统框架 转自@https://blog.csdn.net/chinatelecom08/article/details/82557715 本文搭建一个完整的中文语音识别系统 ...

  8. 基于主动视觉机制的深度学习--一个综合池化框架

    卷积神经网络(CNN)是深度学习的代表算法之一,长期以来被广泛应用于图像识别领域.它是受到了生物处理过程的启发,通过模仿人类视觉系统(HVS)的工作机制,完成各种视觉任务等.但与HVS相比,CNN不能 ...

  9. 深度学习概述_深度感测框架概述

    深度学习概述 I have found the DeepSense framework as one of the promising deep learning architectures for ...

最新文章

  1. libcurl下载限速编程调研
  2. Mongodb集群 - 副本集内部选举机制
  3. leetcode算法题--最长快乐字符串★
  4. 【Linux系统编程】可重入函数和不可重入函数
  5. JAVAWEB入门之Sevlet的执行原理
  6. PHP 读取 QQ ip纯真数据库 详解
  7. C++动态空间申请、动态对象(new与delete运算)
  8. python能和java一起编程吗_C如何能和Python一起编程,那么它们已经无敌了!Java靠边站!...
  9. 第八届“图灵杯”NEUQ-ACM程序设计竞赛个人赛——C题 上进的凡凡
  10. Java语言的基础知识6
  11. MVC公司架构介绍-工具类(一)
  12. 从 C10K 到 DPDK
  13. Extendsim 系统仿真的强大工具,多方法论模拟--介绍和试用
  14. adb ps shell 查看进程_adb shell查看进程方法
  15. 史上最全软件测试Web测试要点,吐血整理。
  16. 2018至2021年新春挡电影票房分析
  17. Metric Learning详解(附带NCA算法)
  18. 多少个程序员能出一个架构师_每个程序员或架构师都应该知道的9 + 7件事
  19. Windows10与Ubuntu双系统安装记录
  20. 量子计算到底是个什么鬼?

热门文章

  1. 同步现象 心理学_男生是不是更容易从失恋中走出来?心理学:失恋后悲伤,男女不同...
  2. 图像处理(MATLAB及FPGA)实现基础原理(持续更新)
  3. 基于FPGA实现uart串口模块(Verilog)--------接收模块及思路总结
  4. Oracle DataBase单实例使用ASM案例(2)--Oracle 11g之环境准备
  5. [JS3] 立即执行JS
  6. String通过“+”号拼接字符串的底层实现
  7. 更改一个主键的列的类型的步骤
  8. mysql 5.6 主主复制_Percona MySQL 5.6 主主复制环境报错Got fatal error 1236 from master.....
  9. mybatisplus page排序_PostgreSQL使用WITH xxx AS()查询,使用Page中的OrderItem排序,会把WITH xxx AS()这段SQL忽略导致报错...
  10. 原始套接字与抓包过滤规则setsockopt(fd, SOL_SOCKET, SO_ATTACH_FILTER, ...)