什么是深度学习?kears简介,深度学习常用的三大模型,MLP(多层感知机),CNN(卷积神经网络),RNN(循环神经网络)
什么是深度学习?
简单理解深度学习就是人类容易做的事情,机器不容易完成的事情。(实例:人脸识别,这个例子很好的证明了这句话。假如你识别一个人 ,今天这个人长这个样子,明天脸上有一块伤口,我们人是不是还可以一眼就可以识别,而机器却不好识别)。
深度学习模型
自然语言处理是人工智能皇冠上的明珠。
深度学习的模型
1.深度学习模型的四大部分:
数据集、模型、学习准则、优化方法
2.深度学习模型:
3.深度学习模型学习方法
基础模型:MLP,CNN,RNN
主流模型:transformer,GPT,Bert
4.深度学习模型的学习导师:keras
Keras是一个流行的深度学习库。2017年就有250000名研发人员共同研发。
Google的tansorflow选择kears作为其库的高级API
Keras是一个致力于加速深度学习模型实施的库
Keras快速图形化模型
keras模型流程图:
如何构建kears构建模型:
kears模型总结:
Layer(type) |
Output Shape |
Param # |
dense_1 (Dense) |
256 |
200960(784X256+256) |
activation_1 (Activation) |
256 |
0 |
dropout_1 (Dropout) |
256 |
0 |
dense_2 (Dense) |
256 |
65792(256X256+256) |
activation_2 (Activation) |
256 |
0 |
dropout_2 (Dropout) |
256 |
0 |
dense_3 (Dense) |
10 |
2570(256X10+10) |
activation_3 (Activation) |
10 |
0 |
深度学习三大模型
MLP:多层感知机(Multilayer Perceptron)
CNN:卷积神经网络(Convolutional Neural Networks)
RNN:循环神经网络(Recurrent Neural Networks)
首先介绍MLP:
MLP是多层感知机,多层感知机是一个全连接的网络,也被称为深度前馈网络和前馈神经网络。
MLP的流程图:(拿数字手写体识别举例)
CNN:卷积神经网络
CNN模型总结:
Layer(type) |
Output Shape |
Param # |
conv2d_1 (Conv2D) |
(None, 26, 26, 64) |
640 |
max_pooling2d_1 (MaxPooling2D) |
(None, 13, 13, 64) |
0 |
conv2d_2 (Conv2D) |
(None, 11, 11, 64) |
36928 |
max_pooling2d_2 (MaxPooling2D) |
(None, 5, 5, 64) |
0 |
conv2d_3 (Conv2D) |
(None, 3, 3, 64) |
36928 |
flatten_1(Flatten) |
(None, 576) |
0 |
dropout_1 (Dropout) |
(None, 576) |
0 |
dense_1(Dense) |
(None, 10) |
5770 |
activation_1 (Activation) |
(None, 10) |
0 |
RNN:循环神经网络:
模型参数总结:
MLP:参数大约27万
CNN:参数大约8万
RNN:参数大约7.5万
什么是深度学习?kears简介,深度学习常用的三大模型,MLP(多层感知机),CNN(卷积神经网络),RNN(循环神经网络)相关推荐
- July深度学习之RNN循环神经网络
RNN循环神经网络 一.简介 首先,为什么有BP神经网络和CNN,还要提出RNN? 因为传统的神经网络,包括CNN,它的输入和输出是互相独立的.但有些时候,后续的输出和前面的内容是相关的.比如,我是中 ...
- 深度神经网络和循环神经网络,深层循环神经网络
深度学习和有效学习的区别 深度学习和有效学习的区别分别是:1.深度学习是:Deep Learning,是一种机器学习的技术,由于深度学习在现代机器学习中的比重和价值非常巨大,因此常常将深度学习单独拿出 ...
- CNN(卷积神经网络)、RNN(循环神经网络)、DNN(深度神经网络)的内部网络结构有什么区别?...
2019独角兽企业重金招聘Python工程师标准>>> 科言君 每周六提供一份高质量回答. 首先,我感觉不必像 @李Shawn 同学一样认为DNN.CNN.RNN完全不能相提并论.从 ...
- MLP多层感知机 学习笔记
cvpr2022的 mobileformer中用到了mlp多层感知机,就来学习一下 其实就是3个全连接层,前面两个加了bn,最后一层没有加bn. import timeimport torch fro ...
- CV:人工智能之计算机视觉方向的简介(CV发展史+常用数据集+CV职位)、传统方法对比CNN类算法、计算机视觉十大应用(知识导图+经典案例)之详细攻略
CV:人工智能之计算机视觉方向的简介(CV发展史+常用数据集+CV职位).传统方法对比CNN类算法.计算机视觉十大应用(知识导图+经典案例)之详细攻略 目录 计算机视觉的简介 1.计算机视觉的研究方向 ...
- 深度学习代码实战演示_Tensorflow_卷积神经网络CNN_循环神经网络RNN_长短时记忆网络LSTM_对抗生成网络GAN
前言 经过大半年断断续续的学习和实践,终于将深度学习的基础知识看完了,虽然还有很多比较深入的内容没有涉及到,但也是感觉收获满满.因为是断断续续的学习做笔记写代码跑实验,所以笔记也零零散散的散落在每个角 ...
- CNN(卷积神经网络)、RNN(循环神经网络)、DNN(深度神经网络)的内部网络结构区别...
神经网络技术起源于上世纪五.六十年代,当时叫感知机(perceptron),拥有输入层.输出层和一个隐含层.输入的特征向量通过隐含层变换达到输出层,在输出层得到分类结果.早期感知机的推动者是Rosen ...
- DeepLearning tutorial(3)MLP多层感知机原理简介+代码详解
FROM:http://blog.csdn.net/u012162613/article/details/43221829 @author:wepon @blog:http://blog.csdn.n ...
- 《动手学深度学习》戴口罩的胡萝卜组 - 户建坤 第一次打卡 (线性, Softmax, 多层感知机, 文本预处理, 语言模型, RNN)
线性回归 1. 数据集名词 training set sample label feature 2. 均方差损失函数 均值差的平方损失 (a-b)**2 / 2 在 batch 中求平均, 即 sum ...
最新文章
- Bitcoin Unlimited客户端发布新版本,删除了BSV协议功能
- 开发日记-20190621 关键词 读书笔记《鸟哥的Linux私房菜-基础学习篇》
- Xamarin中国技术社区及BXUG官网上线啦
- 创建对象并且使用对象的属性和方法
- csgo 机器人模式_分享一个休闲模式机器人Bug
- 解读Tom介绍的Oracle Database 12c的12个新特性
- BZOJ4868: [Shoi2017]期末考试
- Halcon OCR识别
- Bzoj3894文理分科
- 609. 在系统中查找重复文件
- 微信小程序 好用的UI组件库推荐
- android 6.0 讯飞TTS
- C++按键模拟/刷屏器
- nrm详解,nrm是什么,nrm源管理器,nrm 与npm 的区别
- 【死磕 Spring】----- IOC 之深入理解 Spring IoC
- sap税码配置_SAP税务管辖码Tax Jurisditcion code功能(1)
- 我国影视行业的痛点——影视链的目标
- 著者四角号码查询_著者姓名汉语拼音与四角号码数字混编书次号的研究
- 【HSI】高光谱的数据集分类深度学习实战及代码理解
- 知名IT企业待遇一览表
热门文章
- PHP的一些常用算法
- soul网关-4-sign插件签名认证
- Apollo决策技术分享
- 跨链安全隐患大,区块链下一代的互操作性该如何应对
- 6.process.nextTick()
- Unity ADB调试和一些常用命令
- Hadoop No FileSystem for scheme “hdfs“ 客户端环境变量配置
- python打开文件切片_收藏 | 从Python安装到语法基础,小白都能懂的爬虫教程!(附代码)...
- oppo reno4se和vivos7 哪个好
- 血污夜之仪式秘密巫师实验室收集策略