目录

BP神经网络需要注意的地方。

数值型字段的预处理方式

类别型字段的预处理方式:

目标字段的数据预处理:

实际案例

BP神经网络与逻辑回归、线性回归及非线性回归间的关系。

BP神经网络的优缺点:


我的主页:晴天qt01的博客_CSDN博客-数据分析师领域博主

目前进度:第四部分【机器学习算法】

BP神经网络需要注意的地方。

今天我们主要和大家说一下BP神经网络需要注意的地方

数值型字段的预处理方式

因为我们BP神经网络输入字段一般只接受0-1之间的数值,所以我们要对数值型字段进行处理,比较通用的有极值标准化,

极值标准化,就是将某值减去最小值除以最大值和最小值的差。

数值型或者顺序型的数值,都可以用该值无论原来的值有多大,都会被处理为0~1之间

类别型字段的预处理方式:

比如类别型字段里有男女,或者很多个种类的字段。 一般有3种编码处理方法,按情况而定

第一种distributed(binary)coding scheme

这个叫分散编码技巧,比如4个种类,我们采用2个神经元进行输入,种类1是0,1,种类2是1,0,种类3是1,1,种类4是0,0

这种编码技巧不好,虽然神经元比较少,但是效果通常比较差。为什么呢:因为系统会自动认为01,10,这两个的距离比较近,而11,00,的距离比较远。事实是4个值互相独立,没有距离的关系。

第二种1-of-N coding scheme

这个编码方式使用的人比较多。这个其实就是我们的one hot encoding独热编码的模式。比如4个种类的类别字段,我们就采取4个神经元进行输入,1000代表种类1,0100代表种类2,0010代表种类3,0001代表种类4

第三种1-of-N-1 coding scheme

这个编码方式使用的人也比较多,就是之前我们说独热模型,可能会导致神经元间共线性极强,就会采取少一个输入层神经元。比如4个种类。种类1是100,种类2是010,种类3是001,种类4是000。它和上面的方法差不多。

目标字段的数据预处理:

因为我们神经网络使用的是sigmoid function 所以就会导致结果数值,

比如目前我需要预测某人的年收入,1万,2万,还是3万,我们就不能使用这种数值,必须要标准化,让他介于0-1之间,

就可以把它设为1个神经元节点,分为高收入(high loyalty)和第收入(low loyalty)越接近1就收入就越高,越接近0收入就越低。或者用两个节点,10代表高收入(high loyalty)01代表低收入(low loyalty)也可以。两个节点就必须用softmax function 因为不能同时高收入或者低收入

如果输出的是n个值比如杂志喜好也要用独热模型,1-of-N的编码模式来编码。比如4个种类,我们采用4个神经元进行输出,种类1是0,1,0,0种类2是1,0,0,0种类3是0,0,0,1,种类4是0,0,1,0,

数据预处理实际案例:

案例一,客户好坏预测

这是一个分两类的问题。B代表坏客户,G代表好客户。输入字段都是数值型字段。education一般是类别型

这里的数值型字段我们都采用了极值标准化的方法,教育字段我们采用了独热模型的编码方式 目标字段有两种情况,第一种就是把坏客户当成1,好客户当成0,或者采用2个字段,好客户为10,坏客户为01。

两种方法的区别就在于激活函数,一个用的是smoid function和softmax function

案例二数字预测:

输入字段1是促销花费,area是电面面积,position是店面位置,0是市区,1是郊区。刚好。目标字段是来电客户人数千人为单位。

前两个字段我们就直接采用极值标准化。Position改变一下字段类型就好。然后目标字段也是进行极值标准化,但是因为我们要预测的话肯定要把结果还原为原来的数值。预测之后,这时我们直接把它乘以最大值与最小值的差,在加上最小值,就会变回原来的数值。

所以目标字段是数值型字段还是类别型字段的唯一区别就在于前者介于0-1之间,后者要么是1要么是0(狗头)

BP神经网络总结:

我们做一个BP神经网络的总结,

BP神经网络有输入层,隐藏层,输出层

输入层将数据给隐藏层,隐藏层用组合函数组合之后,过激活函数,这边最经常使用的是sigmoid function,

输出层就看你是回归问题还是二分类还是,多分类问题。第一个用线性函数,第二个就sigmoid,第三个就softmax函数。

刚开始我们使用从左往右的处理方式feedforward 然后结果不理想,在使用backward pass 来修正权重值和bias。利用节点误差来调整。先利用输出层的节点误差,然后隐藏层的节点误差,一步一步由后往前传导过去。得到优化的BP神经网络模型。

BP神经网络与逻辑回归、线性回归及非线性回归间的关系。

这边如果我们采用的是只有输入输出层,激活函数用的线性函数,这种两层式的BP模型,就会退化为线性回归模型。

我们会发现得到的模型就是就是I1*w1+I2*w2+bias=O1

还是一样,我们只有输出层和输出层,其中激活函数用的是sigmoid function。那么你就会发现。这样两层的神经网络,就会退化为逻辑回归。基本是就是在做2分类的问题。左图也被我们称为二元逻辑回归。在统计里把sigmoid函数叫做逻辑函数。是同一个函数,一模一样。输出层改为多神经元,那就会变成多元逻辑回归。

右图是增加了一个异常层的逻辑回归问题,那么能解决的就可以是非常复杂的非线性的逻辑回归模型。所以其实BP神经网络是一个集大成的神经网络,它可以同设定网络架构的方式来变为不同的模型。

BP神经网络的优缺点:

BP神经网络的优点:

1:预测的准确度很高

2:能很快的预测出结果(不用像决策树一样考虑要走左边还是右边,它直接一条路计算走到黑。)

缺点:

训练时间非常长,尤其是到深度学习的时候,它可能要训练好几天。

很难了解其中的权重值代表什么含义。(使用我们经常叫它黑箱子,因为没有可读性,但是输入的值有很准确。)

【机器学习算法】神经网络和深度学习-4 重要的BP网络使用总结,了解BP神经网络的魅力相关推荐

  1. 【神经网络与深度学习摘要】第1章 绪论

    [神经网络与深度学习摘要]第1章 绪论 文章目录 [神经网络与深度学习摘要]第1章 绪论 1.人工智能 1.1 图灵测试 1.2 人工智能的主要领域 1.3人工智能的发展历史 1.4 人工智能的流派 ...

  2. 深度学习与自然语言处理教程(8) - NLP中的卷积神经网络(NLP通关指南·完结)

    作者:韩信子@ShowMeAI 教程地址:https://www.showmeai.tech/tutorials/36 本文地址:https://www.showmeai.tech/article-d ...

  3. 吴恩达深度学习笔记——神经网络与深度学习(Neural Networks and Deep Learning)

    文章目录 前言 传送门 神经网络与深度学习(Neural Networks and Deep Learning) 绪论 梯度下降法与二分逻辑回归(Gradient Descend and Logist ...

  4. 撒花!《神经网络与深度学习》中文教程正式开源!全书 pdf、ppt 和代码一同放出...

    点击上方"AI有道",选择"置顶"公众号 重磅干货,第一时间送达 红色石头之前在某乎上回答"机器学习该怎么入门"这个问题的时候,曾经给入门学 ...

  5. 深度学习与自然语言处理教程(9) - 句法分析与树形递归神经网络(NLP通关指南·完结)

    作者:韩信子@ShowMeAI 教程地址:https://www.showmeai.tech/tutorials/36 本文地址:https://www.showmeai.tech/article-d ...

  6. 吴恩达神经网络和深度学习

    [前言] 在学习了深度学习和神经网络之后,为什么我要以博客的形式来做笔记?这CSDN有那么多的优秀文章,我自己写的都比不上 别人的我写的真的有意义吗,为什么我要浪费大量的时间去做这项工作?我相信一句话 ...

  7. 机器学习笔记——神经网络与深度学习

    机器学习笔记--神经网络与深度学习 一.神经网络引言 二.神经元模型与激活函数 2.1 神经元模型 2.2 激活函数 2.2.1 sigmoid & tanh 2.2.2 ReLU激活函数 2 ...

  8. 神经网络与深度学习(一)——机器学习基础

    神经网络与深度学习 (一)--机器学习基础 1.人工智能基础概念 2. 机器学习 2.1 基本概念 2.2 机器学习的三个基本要素 2.2.1 模型 2.2.2 学习准则 2.2.2.1 损失函数 L ...

  9. 剖析大数据、人工智能、机器学习、神经网络、深度学习五者之区别与联系

    1 引言 当下时代,无论你是否专业于CS,想必都应当听过大数据.人工智能.机器学习.神经网络与深度学习这几个热词.他们区别明显却又联系紧密,有些互有交集,有些又是另一部分的子集.基于上述原因,现作文一 ...

  10. 读懂人工智能、机器学习、神经网络和深度学习的关系

    最近很长的一段时间,人工智能的热度都维持在一定的高度.但是大家在关注或研究人工智能领域的时候,总是会遇到这样的几个关键词:深度学习.机器学习.神经网络.那他们之间到底是什么样的关系呢? 先说人工智能, ...

最新文章

  1. 简单快捷方法:CAJ 文件转 成PDF文件
  2. rest-framework 响应器(渲染器)
  3. Windowsw核心编程 第13章 Windows内存结构
  4. LeetCode Algorithm 811. 子域名访问计数
  5. 每天一道LeetCode-----删除链表倒数第n个节点
  6. VMware桥接模式无法连网
  7. c++ signal 信号退出
  8. python输入二维数组_python 二维数组键盘输入
  9. Error: Could not open connection to jdbc:hive2://master:10000: java.net.ConnectException: Connection
  10. 计算机博弈 六子棋 人机/人人对弈系统开发
  11. 我眼中的嵌入式是这样的!
  12. 一文详解AndroidX,再也不会傻傻分不清了
  13. lr背景虚化_【教程】人像后期LR+PS超详细流程+思路分析
  14. Andriod studio manifast中添加权限却还无效日历api设置定时闹钟却不生效
  15. Android制作圆形背景
  16. ECMAScript 2015 ES6
  17. linux--redis(redis在lnmp中做加速器2)
  18. java cloud五大神兽_SpringCloud五大神兽之Eureka
  19. 使用Kafka 0.9.0版本的一个大坑-不要使用didi_manager
  20. swf to html5 movie maker,SWF to Video Converter Pro(Flash转换视频格式)

热门文章

  1. Power Plug Categories A to Categories O
  2. 漫谈递归——递归需要满足的两个条件
  3. 大端和小端的区别和判断
  4. Got permission denied while trying to connect to the Docker报错排障
  5. 解决Chrome和Chrome内核edge浏览器在启用硬件加速后颜色异常的问题
  6. Matlab中左除(\)与右除(/)的区别
  7. Android入门之把窗口信息传递给InputDispatcher
  8. Linux系统部署apk配置nginx
  9. git(一)不同情景下的git用法
  10. padStart与padEnd方法