深度学习和机器学习研究方向与框架介绍

一、人工智能研究方向

1. 计算机视觉(Computer Vision, CV)——纯粹的深度学习方向的研究

计算机视觉,是指计算机从图像中识别出物体、场景和活动的能力。计算机视觉技术运用由图像处理操作,及其他技术所组成的序列来将图像分析任务分解为便于管理的小块任务。

深度学习是机器学习研究中的一个新的领域,其动机在于建立可以模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如,图像、声音和文本。深度学习的目的是形成复杂算法和优势算法,属于无监督(Unsupervised)学习的一种。无监督学习的意思就是不需要通过人工方式进行样本类别的标注来完成学习。因此,深度学习是一种可以自动地学习特征的方法。

深度学习是利用多层感知器结构对非线性信息进行处理的一种学习方法。Hinton
等首先提出了深度置信网络和相应的高效学习算法,该算法具有无监督学习的能力,降低了对人工的依赖,可以较为高效地进行训练,之后深度学习发展都是在此基础上进行改进的。目前深度学习方法在对自然语言处理方面的基本方向是通过对文档上下文进行学习训练,对于中文文档,还需要先进行中文分词处理,然后将文档中的词语、句子分别用连续实值向量进行表示,形成的向量称为嵌入向量,这样做是为了方便处理文本语义特征,将词语、句子用向量表示,在处理文本语义特征时,对词向量、句向量直接进行向量上的计算即可表征它们之间的文本语义关系。

  • 人脸相关(人脸识别转正关键点检测)
  • 图像复原(去噪去雨去雾去模糊、超分、暗光增强)
  • 图像补绘(Inpainting)
  • 图像语义分割(Segmentation)
  • 三维重建(即深度估计)
  • 6D姿态估计
  • 点云绘制
  • 风格转换
  • OCR文本识别

2. 综合理论

  • 神经网络安全与对抗
  • 多任务学习
  • 多理论学习
  • 联邦学习
  • 分布式机器学习
  • 域迁移(Domain Transfer)
  • 无监督学习(即自监督学习)的深度生成模型Generative Adversarial Networks
  • 损失函数研究
  • 激活函数研究

3. 自然语言处理(Natural Language Processing, NLP)——深度学习与机器学习

自然语言处理,是指计算机拥有的人类般文本处理的能力。

机器学习,指的是计算机系统无需遵照显式的程序指令,而只是依靠暴露在数据中来提升自身性能的能力。其核心在于,机器学习是从数据中自动发现模式,模式一旦被发现便可用于做预测。

  • 机器翻译
  • 自然语言理解
  • 语音识别
  • 聊天机器人
  • 摘要生成
  • 情感识别(经典方法是TF-IDF)
  • 超大型语言模型研究(典型的是GTP-2、GTP-3等)

4.语音识别技术

语音识别技术,主要是关注自动且准确的转录人类的语音。该技术必须面对一些与自然语言处理类似的问题,在不同口音的处理、背景噪音、区分同音异形异义词(“buy”和“by”听起来是一样的)方面存在一些困难,同时还需要具有跟上正常语速的工作速度。

5.其他 侧重于训练技术、网络架构等

  • 引入外部知识(如知识图谱,WordNet)

    • Knowledge-Based Semantic Embedding for Machine Translation
    • A Neural Knowledge Language Model
  • 深度学习与传统方法的结合。
    • 人工规则与神经网络的结合
      Harnessing Deep Neural Networks with Logic Rules
    • 贝叶斯与神经网络的结合
      Human-level concept learning through probabilistic program induction(论文讲的是用贝叶斯让机器模仿人写字的,但是对深度学习有非常大的启发价值)
    • 迁移学习与神经网络的结合
    • 强化学习与神经网络的结合
      Mastering the game of Go with deep neural networks and tree search
    • 图模型与神经网络的结合
      Bidirectional LSTM-CRF Models for Sequence Tagging
      A Hierarchical Latent Variable Encoder-Decoder Model for Generating Dialogues
  • 新的网络结构
    • Highway Networks
    • Neural Turing Machines
    • End-To-End Memory Networks
    • Deep Residual Learning for Image Recognition
    • Mollifying Networks
  • 新的训练方法
    Batch Normalization Accelerating Deep Network Training by Reducing Internal Covariate Shift

二、人工智能自学框架

  • 机器学习与深度学习理论

    • 浅表认知:李宏毅网课+吴恩达网课+西瓜书
    • 了解原理:PRML+DeepLearning(花书)
    • 深刻理解:ConvexOptimization+矩阵论
  • 数字图像理论
    • 数字图像处理课程和课本、基础网课
  • 上机实操
    • 初级工具:Keras(不灵活) + 李宏毅网课
    • 正规工具:Pytorch
    • 高级工具:TensorFlow/Caffe

深度学习和机器学习研究方向与框架介绍相关推荐

  1. 深度学习与机器学习到底什么关系?

    最近广州的天气老是变幻无常,前脚还冻得瑟瑟发抖,后脚又开始夏天模式(如下图),让小天甚是怀念每天艳阳高照的夏天,虽然热了点但好歹不用担心猝不及防地收到寒风暴雨黄色预警. 说到夏天,不得不提一下1956 ...

  2. [2022]李宏毅深度学习与机器学习课程内容总结

    [2022]李宏毅深度学习与机器学习课程内容总结 课程感受 第一讲必修 ML的三个步骤 第一讲选修 深度学习发展趋势 反向传播 从线性模型到神经网络 为什么要用正则化技术 为什么分类是用交叉熵损失函数 ...

  3. 深度学习 vs 机器学习 vs 模式识别

    http://www.csdn.net/article/2015-03-24/2824301 [编者按]本文来自CMU的博士,MIT的博士后,vision.ai的联合创始人Tomasz Malisie ...

  4. 深度学习与机器学习的思考

    需要一些传统图像处理知识为佳. "end-to-end"(端到端)说的是,输入的是原始数据(始端),然后输出的直接就是最终目标(末端),中间过程不可知,因此也难以知. 就此,有人批 ...

  5. 支持移动端深度学习的几种开源框架

    原文:http://blog.csdn.net/zchang81/article/details/74280019 支持移动端深度学习的几种开源框架 1.Caffe的移动端项目 caffe项目连接如下 ...

  6. 整理:深度学习 vs 机器学习 vs 模式识别

    摘要:本文我们来关注下三个非常相关的概念(深度学习.机器学习和模式识别),以及他们与2015年最热门的科技主题(机器人和人工智能)的联系,让你更好的理解计算机视觉,同时直观认识机器学习的缓慢发展过程. ...

  7. 深度学习、机器学习与NLP的前世今生

    一.为什么做文本挖掘 二.为什么要用深度学习? 三.深度学习的具体应用        深度学习优点        深度学习缺点 随着深度学习的发展,自然语言处理领域的难题也得到了不断突破. Alpha ...

  8. [深度学习] 自然语言处理 --- Self-Attention(一) 基本介绍

    [深度学习] 自然语言处理 --- Self-Attention(一) 基本介绍_小墨鱼的专栏-CSDN博客https://zengwenqi.blog.csdn.net/article/detail ...

  9. 基于深度学习的中文语音识别系统框架搭建

    基于深度学习的中文语音识别系统框架 转自@https://blog.csdn.net/chinatelecom08/article/details/82557715 本文搭建一个完整的中文语音识别系统 ...

  10. AMD将推出7纳米GPU Vega,专为深度学习和机器学习打造

    内容来源:ATYUN AI平台 AMD今天在Computex上为其下一代7纳米GPU Vega草拟了高级的数据中心计划.综合了AMD在个人电脑上花费一个半小时的展示,显然7纳米Vega终于瞄准了高性能 ...

最新文章

  1. java_oop_接口
  2. excel多个工作表求和案例
  3. Docbook之一:概念 DOM schema xsl xsl-xslt xsl-fo
  4. CRM How to configure text type to allow html editor
  5. html字符串转换jsx,javascript – 将React.element转换为JSX字符串
  6. sql跨表查询_白话django之ORM的查询语句
  7. android 模块混淆配置,使用android studio混淆多个模块
  8. JQui---------Button心得
  9. 计算机中丢失msvcr71.dll 问题解决
  10. Linux中阶—域名解析服务DNS(十)
  11. FPGA协同验证方法-资料整理
  12. word中一个表格拆分成两个单独的表格
  13. 【整理】Makefile编写规则
  14. 云呼HTML自适应官网源码
  15. Mac删东西显示 不能完成此操作,因为发生意外错误(错误代码-50)怎么解决?
  16. 人工智能如何实现两难抉择?
  17. 速度翻倍 SAS 6Gb/s接口性能全揭秘
  18. Dell g7 设置电源计划对 cpu 降频
  19. Elasticsearch+Kibana集群部署(3节点)
  20. Java根据年龄数值输出年龄段

热门文章

  1. 拉格朗日插值法总结模板(1~n)
  2. #NOIP模拟赛#捕鼠器mousetrap(树)
  3. 十大必知开源WebRTC服务器
  4. 红蜘蛛多媒体网络教室安装步骤:
  5. Unity3D游戏开发之路:一月工作总结
  6. 数学分析(3): 函数极限
  7. 机器学习入门——线性回归预测广告投入数据集
  8. WT588D语音芯片 语音模块组
  9. Vscode tab键使用
  10. 用户画像第四章(企业级360°用户画像_标签开发_挖掘标签_ 客户价值模型-RFM)