转载链接:https://www.zhihu.com/question/51325408/answer/125426642
来源:知乎

这个问题无外乎有三个难点:

  1. 什么是sum
  2. 什么是reduce
  3. 什么是维度(indices, 现在均改为了axis和numpy等包一致)

sum很简单,就是求和,那么问题就是2和3,让我们慢慢来讲。其实彻底讲清楚了这个问题,很多关于reduce,维度的问题都会恍然大悟。

0. 到底操作哪个维度??

sum这个操作完全可以泛化为任意函数,我们就以sum为例,来看看各种情况。

首先是1维(按照tensorflow的说法其实是0维,后面会说)就是这样:

a = 1
sum(a) => 1

那么看看2维的情况,为了看的更清楚,特意写成了矩阵的形式:

a = [[1,2],[3,4]]
sum(a) => ???

仔细观察,那么问题来了,sum(a)到底应该是多少?有人说,当然是[3, 7](“横着加”[[1+2],[3+4]]),有人说 不应该是[4, 6](“竖着加”[[1+3],[2+4]]) 吗?还有人或说,不应该是10(全加在一起)吗?

谁是对的?

都是对的。

所以,对于多维数组元素的相加,如果不指定“如何加”,结果是未定义的,之所以有些时候没有指定也可以得到结果,是因为不同的软件或框架有默认的行为。对于tensorflow,默认行为是最后一种,也就是全加在一起。

1. 什么是维度?什么是轴(axis)?如何索引轴(axis)?

注:对Axis比较熟悉的读者可跳过这部分解释,只看加粗字体。

这是一个很大的问题,到底什么是维度呢?维基百科说:

维度,又称维数,是数学中独立参数的数目。在物理学和哲学的领域内,指独立的时空坐标的数目。
0维是一点,没有长度。1维是线,只有长度。2维是一个平面,是由长度和宽度(或曲线)形成面积。3维是2维加上高度形成“体积面”。虽然在一般人中习惯了整数维,但在分形中维度不一定是整数,可能会是一个非整的有理数或者无理数。

妈呀,好复杂,我只是想写个tensorflow代码呀。

那么,编程时,你就可以简单的认为:

维度是用来索引一个多维数组中某个具体数所需要最少的坐标数量。

把这句话多读几遍,我想你肯定会有所顿悟。这里之所以说第一个1维的例子时0维,是因为,一个数字根本不需要索引,因为就只有一个呀。所有不同维度的形式如下:

0维,又称0维张量,数字,标量:1

1维,又称1维张量,数组,vector:[1, 2, 3]

2维,又称2维张量,矩阵,二维数组:[[1,2], [3,4]]

3维,又称3维张量,立方(cube),三维数组:[ [[1,2], [3,4]], [[5,6], [7,8]] ]

n维:你应该get到点了吧~

再多的维只不过是是把上一个维度当作自己的元素

1维的元素是标量,2维的元素是数组,3维的元素是矩阵。

从0维到3维,边看边念咒语“维度是用来索引一个多维数组中某个具体数所需要最少的坐标。”

在纸上写写看,想要精确定位一个数字,需要几个数字呢?比如上面例子中的3维数组,我们想要3这个数字,至少要3个数字定位,它的坐标是(0为索引起点):[0, 1, 0]

好了,现在就能说了,什么是轴(axis),如何索引axis(代码中常用的变量名,后文就用axis代表轴)。

什么是axis,编程时,你就可以简单的认为:

axis是多维数组每个维度的坐标。

同样,把这句话多读几遍,我想你一定有体悟。

还拿3维来说,数字3的坐标是[0, 1, 0],那么第一个数字0的axis是0,第二个数字1的axis是1,第三个数字0的axis是2。

让我们再看看我们是如何得到3这个数字的:

  1. 找到3所在的2维矩阵在这个3维立方的索引:0
  2. 找到3所在的1维数组在这个2维矩阵的索引:1
  3. 找到3这个数这个1维数组的索引:0

(这里最好写在纸上看一看,括号比较多。)

也就是说,对于[ [[1,2], [3,4]], [[5,6], [7,8]] ]这个3维情况,[[1,2],[[5,6]], [[3,4], [7,8]]这两个矩阵(还记得吗,高维的元素低一个维度,因此三维立方的元素是二维矩阵)的axis是0,[1,2],[3,4],[5,6],[7,8]这4个数组(二维矩阵的元素是一维数组)的axis是1,而1,2,3,4,5,6,7,8这8个数的axis是2。

越往里axis就越大,依次加1。

那么,对于3维的情况,令a = [ [[1,2], [3,4]], [[5,6], [7,8]] ],tf.reduce_sum(a, axis=1)应该输出[[ 4, 6], [12, 14]],这就是处在axis=1的4个数组相加的结果,并reduce掉了一个维度。

这里需要注意的是,axis可以为负数,此时表示倒数第axis个维度,这和Python中列表切片的用法类似。

那么什么是reduce呢?

2. 什么是reduce

reduce这个词字面上来讲,大多称作“归约”,但这个词太专业了,以至于第一眼看不出来意思。我更倾向于解释为“塌缩”,这样就形象多了。对一个n维的情况进行reduce,就是将执行操作的这个维度“塌缩”。还是上面tf.reduce_sum(a, axis=1)的例子,输出[[ 4, 6], [12, 14]]是二维,显然是被“塌缩”了,塌缩的哪个维度呢?就是被操作的维度,第2个维度,也就是axis=1(0开始索引)。tf.reduce_sum(a, axis=1)具体执行步骤如下:

  1. 找到a中axis=1的元素,也就是[1,2],[3,4],[5,6],[7,8]这4个数组(两两一组,因为前两个和后两个的地位相同)
  2. 在axis=1的维度进行相加也就是[1,2]+[3,4]=[4,6],[5,6]+[7,8]=[12, 14]
  3. “塌缩”这一维度,也就是说“掉一层方括号”,得出[[ 4, 6], [12, 14]]

接下来是一个附加问题:

3. 什么是keepdims

上面的reduce已经解释了,“塌缩”的是被操作的维度,那么keepdims也就是保持维度,直观来看就是“不掉一层方括号”,不掉哪层方括号呢?就是本来应该被塌缩的那一层(详细解释见评论)。tf.reduce_sum(a, axis=1, keepdims=True)得出[[[ 4, 6]], [[12, 14]]],可以看到还是3维。这种尤其适合reduce完了要和别的同维元素相加的情况。

[转载]Tensorflow 的reduce_sum()函数的axis,keep_dim这些参数到底是什么意思?相关推荐

  1. numpy的sum函数的axis和keepdim参数详解

    一.axis axis就是指定轴. 三维数组可看作元素是二维数组的一维数组,二维数组可看作元素是一维数组的一维数组 .(这么理解就舒服了!) 例: axis=2就是三维数组对最里面那一层即每个一维数组 ...

  2. TensorFlow、Numpy中的axis的理解

    TensorFlow中有很多函数涉及到axis,比如tf.reduce_mean(),其函数原型如下: def reduce_mean(input_tensor,axis=None,keepdims= ...

  3. java string()函数_转载java String.split()函数的用法详解

    转载java String.split()函数的用法详解 如果您发现本文排版有问题,可以先点击下面的链接切换至老版进行查看!!!在java.lang包中有String.split()方法的原型是: p ...

  4. [转载]Linux下getopt()函数的简单使用

    转载源地址:https://www.cnblogs.com/qingergege/p/5914218.html 1.getopt()函数的出处就是unistd.h头文件(哈哈),写代码的时候千万不要忘 ...

  5. tensorflow之constant()函数

    tensorflow之constant()函数 tf.constant()用于声明一个常量 语法格式如下: import tensorflow as tf tf.constant(value,dtyp ...

  6. Atitit main函数的ast分析  数组参数调用的ast astview解析

    Atitit main函数的ast分析  数组参数调用的ast astview解析 1.1. Xxcls.main(new String[]{"","bb"}) ...

  7. 函数传参字典_Python 函数中的 4 种参数类型

    作者:小小程序员 链接:https://zhuanlan.zhihu.com/p/89538123 来源:知乎 著作权归作者所有.商业转载请联系作者获得授权,非商业转载请注明出处. 在调用函数时,通常 ...

  8. python调用函数_Python 函数中的 4 种参数类型

    作者:小小程序员 链接:https://zhuanlan.zhihu.com/p/89538123 来源:知乎 著作权归作者所有.商业转载请联系作者获得授权,非商业转载请注明出处. 在调用函数时,通常 ...

  9. 给函数传递不定关键字的参数 和

    转载:http://blog.csdn.net/u012102306/article/details/52250050 收藏一下 在上一篇文章『[Python]给函数传递不定个数的参数』中,我们主要讲 ...

最新文章

  1. jquery插件-表单验证插件-提示信息中文化与定制提示信息
  2. 请求Get和Post对于utf-8字符的处理的考虑
  3. c++,当const char*为0时,不能将其直接赋给string
  4. CTFshow 命令执行 web49
  5. 9 个技巧,解决 K8s 中的日志输出问题
  6. 编写DLL所学所思(1)——导出函数
  7. eclipse中在类saolei.Test 中找不到main方法
  8. google i/o_Google I / O 2017最有希望的突破
  9. nginx和tomcat搭配使用,让nginx可以访问tomcat下面的静态资源
  10. 面向对象的理解及相关概念(封装,继承,多态)
  11. mysql 高可用架构 proxysql 之一 yum安装
  12. 后端类型/状态/标识校验限定法
  13. 【定位仿真】基于matlab RSSI三边定位仿真【含Matlab源码 1690期】
  14. 英语不好,学编程太困难?或许用文言文来编程你就更加容易上手了!
  15. Pycharm安装chardet模块
  16. 21年11月第二周 力扣每日一题记录
  17. 历年(2015-2018)英语六级翻译真题及参考答案
  18. 非诚勿扰:比舒淇更孤单的是谁?
  19. 特征锦囊:特征无量纲化的常见操作方法
  20. 模型评价指标—F1值

热门文章

  1. springboot整合swagger2之最佳实践
  2. 关于C语言中的数组指针、指针数组以及二级指针
  3. 排列组合中分组(分堆)与分配问题
  4. 吉利蔚来造手机,小米造车
  5. 自动调试用于移动GPU的卷积网络
  6. 如何使用Nsight System?
  7. Python分析离散心率信号(下)
  8. 如何为嵌入式应用选择适当的SSD
  9. CVPR2020:点云弱监督三维语义分割的多路径区域挖掘
  10. 结构感知图像修复:ICCV2019论文解析