人工智能基础入门——神经网络讲解
1、人工神经元
人类神经元中抽象出来的数学模型
树突:input
细胞核:处理操作+激活函数
轴突末梢:输出
f(∑i=1NIi⋅Wi\sum_{i=1}^{N} I_{i}\cdot W_{i}∑i=1NIi⋅Wi)=y
人工神经网络:大量的神经元以某种连接方式构成的机器学习模型。
第一个神经网络:1958年,计算机科学家Rosenblatt提出的Perceptron(感知机)
o=σ\sigmaσ((<w,x>+b)) b是指偏执项
if x>0 σ\sigmaσ=1 else σ\sigmaσ=0
感知机致命缺点:Minsky在1969年证明Perceptron无法解决异或问题。
σ\sigmaσ(X0{X}_{0}X0W0{W}_{0}W0+X1{X}_{1}X1W1{W}_{1}W1+b)=0
X1{X}_{1}X1=-W0{W}_{0}W0/W1{W}_{1}W1+o/W1{W}_{1}W1-b/W1{W}_{1}W1
所以是一个直线,不能解决异或问题,导致了第一次人工智能发展衰落。
2、多层感知机
多层感知机(Multi Layer Perceptron,MLP):单层神经网络基础上引入一个或多个隐藏层,使神经网络有多个网络层,因而得名多层感知机。
输入就是W4×5{W}_{4×5}W4×5
隐藏层输出W5×3{W}_{5×3}W5×3
前向传播:
σ(X1×4⋅Wh)=H1×5\sigma({X}_{1×4}\cdot{W}_h)={H}_{1×5}σ(X1×4⋅Wh)=H1×5
σ(H1×5⋅Wo5×3)=O1×3\sigma({H}_{1×5}\cdot{W}_{o5×3})={O}_{1×3}σ(H1×5⋅Wo5×3)=O1×3
如果没有激活函数就会导致多层感知机变成单层感知机
3、激活函数
(1)让多层感知机成为真正的多层,否则等价于一层
(2)引入非线性,使网络可以逼近任意非线性函数(万能逼近定理universal approximator )
激活函数需要具备以下几点性质:
1.连续并可导(允许少数点上不可导),便于利用数值优化的方法来学习网络参数
2.激活函数及其导函数要尽可能的简单,有利于提高网络计算效率
3. 激活函数的导函数的值域要在合适区间内,不能太大也不能太小,否则会影响训练的效率和稳定性
4、反向传播
前向传播︰输入层数据从前向后,数据逐步传递至输出层
反向传播:损失函数开始从后向前,梯度逐步传递至第一层
反向传播作用:用于权重更新,使网络输出更接近标签
损失函数:衡量模型输出与真实标签的差异,Loss = f(y^, y)
反向传播原理:微积分中的链式求导法则 y=f(u),u=g(x),∂y∂x=∂y∂u∂u∂x\frac{\partial y}{\partial x}=\frac{\partial y}{\partial u}\frac{\partial u}{\partial x}∂x∂y=∂u∂y∂x∂u
梯度下降法
(Gradient Decent) :权值沿梯度负方向更新,使函数值减小导数。函数在指定坐标轴上的变化率方向
导数︰指定方向上的变化率
梯度:一个向量,方向为方向导数取得最大值的方向
学习率
5、损失函数
损失函数:衡量模型输出与真实的标签之间的差距
损失函数(Loss Function): //指单样本
Loss = f (y ^,y)
代价函数(Cost Function): //指总体样本
cost=1/N ∑iNf(yi^,yi)\sum_{i}^{N}f({y}_i^{\hat{}},y_i)∑iNf(yi^,yi)
目标函数(objective Function): //正则项
0bj = Cost + Regularization Term
CE (Cross Entropy,交叉嫡)
交叉嫡:衡量两个概率分布的差异
概率有两个性质:
1.概率值是非负的
2.概率之和等于1
交叉嫡的好伙伴―—Softmax函数:将数据变换到符合概率分布的形式
6初始化
Regularization:减小方差的策略,通俗理解为减轻过拟合的策略
误差可分解为:偏差,方差与噪声之和。即误差=偏差+方差+噪声之和
偏差度量了学习算法的期望预测与真实结果的偏离程度,即刻画了学习算法本身的拟合能力
方差度量了同样大小的训练集的变动所导致的学习性能的变化,即刻画了数据扰动所造成的影响
噪声则表达了在当前任务上任何学习算法所能达到的期望泛化误差的下界
目的:减少L1或L2的值,
L1=∑iN∣Wi∣\sum_i^N |W_i|∑iN∣Wi∣
可能有权值的吸收性(当WiW_iWi)
L2=∑iNWi2\sum_i^N W_i^2∑iNWi2
减少过拟合的方法:
通过对比两个公式,发现正则化是Wi(1−λ)W_i(1-\lambda)Wi(1−λ),而正则化是WiW_iWi,会发现正则化导致了权值变小,过拟合现象也变小了。
人工智能基础入门——神经网络讲解相关推荐
- 跟着王进老师学开发Python篇:基础入门案例讲解-王进-专题视频课程
跟着王进老师学开发Python篇:基础入门案例讲解-166人已学习 课程介绍 共计45个项目案例+项目源码,跟着王进老师尽情玩转Python解释器! 本课程涉及Python的基础语法, ...
- 视频教程-跟着王进老师学开发Python篇:基础入门案例讲解-Python
跟着王进老师学开发Python篇:基础入门案例讲解 教学风格独特,以学员视角出发设计课程,难易适度,重点突出,架构清晰,将实战经验融合到教学中.讲授技术同时传递方法.得到广大学员的高度认可. 王进 ¥ ...
- 视频教程-JSON基础入门实战讲解-JavaScript
JSON基础入门实战讲解 04年进入计算机行业.拥有6年net和php项目开发经验,8年java项目开发经验. 现前端全栈工程师,主攻产品设计,微信开发等. 黄菊华 ¥39.00 立即订阅 扫码下载「 ...
- JSON基础入门实战讲解在线视频课程-JSON 使用 JavaScript 语法
因为 JSON 使用 JavaScript 语法,所以无需额外的软件就能处理 JavaScript 中的 JSON. 微信小程序交流群:111733917 | 微信小程序从0基础到就业的课程:http ...
- JSON基础入门实战讲解在线视频课程-JSON语法规则,json对象,json数组的定义和使用
JSON 语法 微信小程序交流群:111733917 | 微信小程序从0基础到就业的课程:https://edu.csdn.net/topic/huangjuhua JSON 语法是 JavaScri ...
- Linux基础入门,简单讲解
Linux基础入门,简单讲解 涵盖内容:计算机组成与Linux操作系统概论 任务要求:大概了解计算机的主要组成部件,明白计算机磁盘分区方式,常用的计算单元换算以及LINUX是什么.有什么特点即可. 文 ...
- 人工智能基础入门清单(计算机视觉、强化学习方向/领域)
一.通识基础部分 1. 基础理论部分(可选) 书籍 <人工智能:一种现代的方法> Stuart J.Russell.Peter Norvig 书籍 <人工智能> 马少平 2. ...
- 零基础入门神经网络:从原理、主要类型到行业应用
原作 Jay Shah Root 编译自 Jay Shah寄几的博客 量子位 出品 | 公众号 QbitAI 最近,神经网络这个词特别火,吸引不少眼球.但是神经网络是个啥?有啥用? 这篇文章和大家唠唠 ...
- android基础入门布局讲解(2)
一.LinearLayout(线性布局): LinearLayout是一行或列只能放置一个控件的先行布局,现在看一个实例: activity_main.xml : <LinearLayout x ...
- 【神经网络】零基础入门神经网络:从原理、主要类型到行业应用
原作 Jay Shah Root 编译自 Jay Shah寄几的博客 量子位 出品 | 公众号 QbitAI 最近,神经网络这个词特别火,吸引不少眼球.但是神经网络是个啥?有啥用? 这篇文章和大家唠唠 ...
最新文章
- 干货回顾丨TensorFlow四种Cross Entropy算法的实现和应用
- git设置master权限_git怎么控制成员的权限?
- 前端学习(173):格式化文本二
- 队列与栈结构的相同点与不同点
- jqurey ajax 的动态添加二级联动下拉菜单
- mysql varchar,bigint,char三种类型性能的比较
- Non-Local Image Dehazing 复现
- atitit. 深入理解Cohesion)原理ad attilax大总结
- 机器人机电液控制一体化联合仿真
- 矩阵论比较好的书 和 相关资源
- JavaScript【狂神笔记】
- HW算法题:判断字符串子序列
- 简述使用混合传递参数时的基本原则_过程控制系统与仪表习题答案 -
- 团队管理之亮剑精神(转)
- 读书:每天做一个情绪稳定的成年人!
- Windows 7安装ATI驱动
- CortexM3与CortexM0的bus matrix
- srec_cat 常用参数的使用
- ESSENTIAL C++ 读书笔记
- HDU 6333 Problem B. Harvest of Apples(莫队离线)
热门文章
- 抖音小程序的私域运营
- 创建计算机桌面快捷方式图标异常,桌面快捷方式图标显示异常,win7无法正常显示桌面图标怎么办?...
- 最新emoji表情代码大全_抖音不用考虑我我没感受铁打的图片,最新表情包高清大全[多图]-软件教程...
- 流量造假:“蔡徐坤微博转发过亿”幕后推手一审获刑五年
- 电阻式传感器原理与应用
- 计算机操作系统|汤小丹|第四版|习题答案(六)
- 离子交换树脂工艺解决电脑印刷线路板废水镍超标
- cydia未能连接服务器超时,cydia添加源验证超时
- 002-周立功USBCAN-II+CAN接口卡使用笔记
- php获取qq头像地址,使用PHP语言通过邮箱获取全球公认的Gravatar头像地址