文章目录

  • 人工智能的发展史
  • 机器学习
    • 5个要点
    • 分类
    • 感知机
      • 激活函数
      • 损失函数
      • 梯度下降
    • 多层感知机
      • 前向传播
      • 反向传播
    • 卷积神经网络CNN
    • 循环神经网络RNN
      • 梯度爆炸和梯度消失
      • 解决梯度爆炸和消失:LSTM
    • 注意力机制
    • 机器学习小方法
  • 总结

人工智能的发展史

自然语言处理–反向传播算法–硬件和算力问题–贝叶斯网络,马尔科夫链–深度学习(2007至今)

机器学习

有一个任务,基于一个评价的指标,学习一个经验。希望训练的模型能处理未知的数据

5个要点

任务task,模型model,目标函数objective(loss )function,优化器optimizer(SGD),评价指标evaluation metric

注:loss function是objective function的一种,都是衡量预测函数和实际函数的差值

分类

1,有监督学习(分类,回归)

2,无监督学习(KNN,KMeans)

3,强化学习(接受反馈不断调整)

感知机

模型

f是激活函数,使原来的线性函数产生非线性变化

线性回归,逻辑回归(加了激活函数),机器学习(神经网络)

激活函数

1,sigmoid (缺点:梯度爆炸,梯度消失)

2,Tanh

3,Relu

4,Softmax(每一个值除以所有值的和)


损失函数

J = 1/N *∑(y真实值-y预测值)

1,L1 loss
2,L2 loss (误差均方MSE)(常用)

监督学习分为:回归(y是负无穷到正无穷),分类(y是离散的点)
极大似然估计:

梯度下降

优化的是θ

方法:1,批量梯度下降 2,随机梯度下降 3,小批量梯度下降

多层感知机

前向传播
反向传播

从后往前,优化各层的权重w

卷积神经网络CNN

卷积(对应相乘求和)–padding(解决边界不够的问题)–stride(每次跳跃的步幅可以是1,也可以是2)–通道channel(获得更多的特征)–池化pooling(通过取小矩阵最大值、平均值等将大矩阵压缩)


循环神经网络RNN


当前信息xt,融合上一步信息x(t-1)乘以权重得到的h(t-1),把这俩各自乘以本步的权重加一起用tanh函数激活,得到ht


优化模型:GRU,只有两道门

梯度爆炸和梯度消失

原因是连乘造成的
小于1的数连续乘以100次导致结果=0 eg.(0.99)^100
大于1的数连续乘以100次导致结果无穷大

解决梯度爆炸和消失:LSTM

引入了forget门,相当于在连乘中加入了筛选机制

注意力机制

有限的注意力集中在重要的信息上,从而节省资源,快速获得最有效的信息

可以嵌入CNN和RNN使用

机器学习小方法

解决过拟合和欠拟合问题:
L1正则,L2正则 等

Dropout
Weight Decay
Batch Normalization
Layer Normalization
Early stopping

总结

机器学习的五个要素

感知机

多层感知机

卷积和循环

注意力机制

机器学习中小解决方案

学科前沿讲座 神经网络,机器学习,深度学习相关推荐

  1. 毕业设计 : 车牌识别系统实现【全网最详细】 - opencv 卷积神经网络 机器学习 深度学习

    文章目录 0 简介 1 车牌识别原理和流程 1.1 车牌定位 1.2 基于图形图像学的定位方法. 1.3 基于机器学习的定位方法. 1.4 字符分割 1.5 字符识别 2 基于机器学习的车牌识别 2. ...

  2. 剖析大数据、人工智能、机器学习、神经网络、深度学习五者之区别与联系

    1 引言 当下时代,无论你是否专业于CS,想必都应当听过大数据.人工智能.机器学习.神经网络与深度学习这几个热词.他们区别明显却又联系紧密,有些互有交集,有些又是另一部分的子集.基于上述原因,现作文一 ...

  3. 机器学习——深度学习之卷积神经网络(CNN)——AlexNet卷积神经网络结构

    目录 一.AlexNet卷积神经网络结构模型 1.数据库ImageNet 2.AlexNet第一层卷积层 二.AlexNet卷积神经网络的改进 1.非线性变化函数的改变--ReLU 2.最大池化(Ma ...

  4. 机器学习——深度学习之卷积神经网络(CNN)——LeNet卷积神经网络结构

    目录 一.卷积神经网络 1.卷积神经的作用 2.LeNet 1)数据库准备--minst 2)模型· 二.关于卷积神经网络结构的一些术语定义 1.特征图(Feature map) 2.height(长 ...

  5. 机器学习笔记——神经网络与深度学习

    机器学习笔记--神经网络与深度学习 一.神经网络引言 二.神经元模型与激活函数 2.1 神经元模型 2.2 激活函数 2.2.1 sigmoid & tanh 2.2.2 ReLU激活函数 2 ...

  6. 神经网络与深度学习(一)——机器学习基础

    神经网络与深度学习 (一)--机器学习基础 1.人工智能基础概念 2. 机器学习 2.1 基本概念 2.2 机器学习的三个基本要素 2.2.1 模型 2.2.2 学习准则 2.2.2.1 损失函数 L ...

  7. 读懂人工智能、机器学习、神经网络和深度学习的关系

    最近很长的一段时间,人工智能的热度都维持在一定的高度.但是大家在关注或研究人工智能领域的时候,总是会遇到这样的几个关键词:深度学习.机器学习.神经网络.那他们之间到底是什么样的关系呢? 先说人工智能, ...

  8. 人工智能、神经网络、深度学习、机器学习傻傻分不清?来看看AI奠基人的解答!...

    文章发布于公号[数智物语] (ID:decision_engine),关注公号不错过每一篇干货. 数智物语(公众号ID:decision_engine)出品 策划.编写:卷毛雅各布 数智物语本期推荐书 ...

  9. 人工智能、神经网络、深度学习、机器学习傻傻分不清?来看看AI奠基人的解答!

    文章发布于公号[数智物语] (ID:decision_engine),关注公号不错过每一篇干货. 数智物语(公众号ID:decision_engine)出品 策划.编写:卷毛雅各布 数智物语本期推荐书 ...

  10. 写给人类的机器学习 四、神经网络和深度学习

    四.神经网络和深度学习 原文:Machine Learning for Humans, Part 4: Neural Networks & Deep Learning 作者:Vishal Ma ...

最新文章

  1. 客快物流大数据项目(七):Docker总结
  2. python-ubuntu
  3. python mysql library popular_【过时】MySQLdb:Python 操作 MySQL 数据库
  4. android开发之 SQLite(数据库)
  5. python文字处理dummy_python中multiprocessing、multiprocessing.dummy和threading用法笔记
  6. mysql优化教程_Mysql优化一
  7. 共建信创生态,助力组织国产化进程
  8. 网易云api普通评论爬取的反馈
  9. smart700iev3 程序下载设置_smart 700ie v3下载程序时提示OS更新-工业支持中心-西门子中国...
  10. tcpclient java_[Java] 网络-01 TCPClient / TCPServer
  11. 二项分布的极大似然估计
  12. SV 接口(interface)
  13. [精彩泄漏截图] 2006最值得期待的游戏
  14. 我的理想高中作文理想是计算机,我的理想高中优秀作文范文
  15. 读懂 互联网巨头 【中台之战】 以及 中台 发展思维
  16. HTML网页黑白滤镜
  17. 项目笔记——简易RPC框架(待升级)
  18. 打开桌面计算机投屏到扩展屏,电脑投屏到电视显示不完全解决办法
  19. 记一次简单的白加黑测试
  20. 林辉高考机器人_“高考机器人”虽败犹荣 国产AI未来迈向何方?

热门文章

  1. 红贝应用架构配置式应用开发示例
  2. 企业邮箱的反垃圾邮件功能是怎么实现的?
  3. 安装CARLA Simulator错误 安装失败 0x80070005 - 访问被拒绝 Error Setup Failed 0x80070005 - Access is denied
  4. WebLogic 性能监控
  5. 论能逼疯一个人的nvidia显卡驱动在ubuntu16.04上的安装
  6. 鸡年年终总结汇报PPT模板
  7. Python 自动化办公之自动识别并点击按钮
  8. python PIL生成gif帧率问题
  9. oracle siebel crm 8.0,Solix实现Oracle Siebel CRM 8.1整合
  10. 贸易相关术语[C-E]