在《深度学习入门:基于Python的理论与实现》书中,看到讲解矩阵的章节,加深了我对矩阵的理解。

脱离应用理解数学是很难的。将矩阵放在深度学习的环境里可以较好的理解矩阵的含义。

这里假设你已经学过矩阵。

1.三层神经网络

对于神经网络,我更倾向于理解为:因素(输入层)、影响因子(权重),结果(输出层),这更贴近实际中的因果关系。

先假设有如下矩阵:

根据矩阵的计算规则,画出模型图,如下:

输入层是 x1 与 x2,可理解为因素,对于每个因素,都有3个权重,组合起来会导致 3个结果。

2.理解权重矩阵

权重矩阵的第一行(1,2,3),从图中可以看出是 从 x1 伸出的三条黑线,是 作用于 x1 的所有权重,分别会影响R1、R2、R3。

权重矩阵的第一列(1,4),从图中可以看出是指向 结果R1 的两条输入线,是仅影响 R1 的全部权重。

总结一下,权重矩阵也可以这么理解:

权重矩阵的每行对应一个因素。每行的数字是作用于某个因素的所有权重。

权重矩阵的每列对应一个结果。每列的数字是影响某个结果的全部权重。

知道这个,就很容易理解权重矩阵与输入层和输出层元素个数的关系了。

若输入层有2个元素,输出需要有3个元素,那么权重矩阵就必须是 2行3列。2行对应2个输入因素,3列对应3个结果。

3.多维输入层

前面讲的矩阵运算,左矩阵是一维矩阵,如果是二维、三维,如何理解呢?

输入层怎么会出现二维呢?会的,如果我们进行批量处理,即处理完(x1,x2)这对因素,我们还要处理(y1,y2)等因素,就可以组合成二维或多维矩阵形式。每一行就代表一个要处理的二元因素。每行因素之间没有任何联系,也互不影响,只是纯粹的计算方便,而摞在一起。

从上面一段话可以看出来,其实每行的数据,是没有任何关联的。上式可理解为下面二式的简略写法。

所以,我们可以像前面的结论一样,这么理解多维的输入层矩阵运算:

输入矩阵的每行对应一次运算,各行互不关联、互不影响。

每次只考虑一行,最后将结果摞在一起。

最后,个人理解,矩阵纯粹就是人为定义的数据的排列方式而已,矩阵的乘法就是人为定义的计算规则。矩阵就只是个数学大师们发明的趁手的工具,没有任何的自然意义,有点像计算机领域的语法糖。

以上仅为个人理解,欢迎指正。

【神经网络】神经网络中的矩阵的理解相关推荐

  1. 卷积神经网络CNN中1×1卷积作用理解

    0.引言 研究 GoogLeNet 和 VGG 神经网络结构的时候,都看见了它们在某些层有采取 1x1 作为卷积核,在最开始看到的AlexNet中都是出现了卷积核是 3x3和5×5的.那么,1x1 的 ...

  2. 图形学中4x4矩阵的理解

    计算机图形学中矩阵往往是4x4的: 如何理解4x4矩阵呢,不妨拆开这个矩阵: 可以看见,只有左上角的3x3的矩阵参与了线性变换,如果,想要将平移放到这个矩阵当中,并且添加的一列不参与线性变换,则需要添 ...

  3. 关于深度学习中三维矩阵的理解(RGB图像的输入)

    #! /usr/bin/env python # -*- coding: utf-8 -*-""" =================================== ...

  4. 神经网络中Batch Size的理解

    神经网络中Batch Size的理解 直观的理解: Batch Size定义:一次训练所选取的样本数. Batch Size的大小影响模型的优化程度和速度.同时其直接影响到GPU内存的使用情况,假如你 ...

  5. 神经网络训练中batch的作用(从更高角度理解)

    1.什么是batch batch,翻译成汉语为批(一批一批的批).在神经网络模型训练时,比如有1000个样本,把这些样本分为10批,就是10个batch.每个批(batch)的大小为100,就是bat ...

  6. 图神经网络(一)图信号处理与图卷积神经网络(1)矩阵乘法的三种方式

    图神经网络(一)图信号处理与图卷积神经网络(1)矩阵乘法的三种方式 1.1 矩阵乘法的三种方式 参考文献   图信号处理(Graph Signal Processing,GSP) 1是离散信号处理(D ...

  7. 神经网络训练中的Tricks之高效BP(反向传播算法)

    神经网络训练中的Tricks之高效BP(反向传播算法) zouxy09@qq.com http://blog.csdn.net/zouxy09 Tricks!这是一个让人听了充满神秘和好奇的词.对于我 ...

  8. 神经网络阈值是什么意思,神经网络的权值矩阵

    BP神经网络中初始权值和阈值的设定 1.首先需要了解BP神经网络是一种多层前馈网络.2.以看一下在matlab中BP神经网络的训练函数,有梯度下降法traingd,弹性梯度下降法trainrp,自适应 ...

  9. 图神经网络设计中的算子融合策略

    ©作者 | 刘曜齐 单位 | 北京邮电大学硕士生 来源 | 北邮GAMMA Lab 本文主要的描述基于消息传递机制的图神经网络设计中应用的算子融合策略,带领读者了解有关算子融合的相关问题以及方法. 引 ...

最新文章

  1. 医工结合之路:草木蔓发,春山可望 | 专访清华统计中心俞声
  2. Unity3D学习笔记(十九):UGUI、Image、Text、Button
  3. jQuery中append、insertBefore、after与insertAfter方法注意事项
  4. [视频教程] ubuntu系统下安装最新版PHP7.3.X环境
  5. leetcode 1222 python
  6. 鸿星尔克与钉钉签署专属音视频合作 全国5千家门店均可接入
  7. 寻路的几种算法_Godot游戏开发实践之二:AI之寻路新方式
  8. JDK8新特性LocalDate、LocalTime和LocalDateTime
  9. 独家 | 微软披露拓扑量子计算机计划!
  10. java中ajax的使用jar包_AJAX Java示例
  11. VS2017社区版离线下载办法
  12. 服务器全息显示修改,全息显示
  13. 基于SSM的高校后勤管理系统Java项目
  14. [Python人工智能] 四.神经网络和深度学习入门知识
  15. 软件专业面试心理测试题,面试心理测试题目,据说很准
  16. TCP套接口丢失与重传报文线索
  17. 内网环境下的横向移动总结
  18. html美食网站源码
  19. 在mac上通过Homebrew安装redis
  20. 计算机能力用英语介绍自己的家庭,介绍我的家庭英语作文(精选10篇)

热门文章

  1. 南邮四年来的学校主页
  2. 硬件工程师入门基础知识(一)基础元器件认识(一)
  3. 什么是HSS?HSS有什么主要功能?HSS与HLR的区别是什么?
  4. 【愚公系列】2021年12月 网络工程-进制转换
  5. Bootstrap框架个人总结
  6. Computer Graphics Through OpenGL From Theory to Experiments - 学习笔记2 Tricks of the Trade opengl基础
  7. 腾讯 WXG 后台开发工程师对 MySQL 索引知识点总结
  8. ECharts关于y轴刻度调整
  9. PMP有没有必要续证?
  10. OGRE的安装与配置