深入理解Python生成器(Generator)
我们可以通过列表生成式简单直接地创建一个列表,但是受到内存限制,列表容量肯定是有限的。而且,创建一个包含100万个元素的列表,不仅占用很大的存储空间,而且如果我们仅仅需要访问前面几个元素,那后面绝大多数元素占用的空间都白白浪费了。
所以,如果列表元素可以按照某种算法推算出来,那我们是否可以在循环的过程中不断推算出后续的元素呢?这样就不必创建完整的list,从而节省大量的空间。在Python中,这种一边循环一边计算的机制,称为生成器(Generator)。
要创建一个generator,有很多种方法。第一种方法很简单,只要把一个列表生成式的[]改成(),就创建了一个generator:
>>> mylist = [ x for x in range(1, 10)]
>>> mylist
[1, 2, 3, 4, 5, 6, 7, 8, 9]
>>> gen = (x for x in range(1,10))
>>> gen
<generator object <genexpr> at 0x7f1d7fd0f5a0>
创建mylist和gen的区别仅在于最外层的[]和(),mylist是一个list,而gen是一个generator(生成器)。
我们可以直接打印出list的每一个元素,但我们怎么打印出generator的每一个元素呢?
如果要一个一个打印出来,可以通过generator的next()方法:
>>> gen.next()
1
>>> gen.next()
2
>>> gen.next()
3
...
>>> gen.next()
9
>>> gen.next()
Traceback (most recent call last):File "<stdin>", line 1, in <module>
StopIteration
我们讲过,generator保存的是算法,每次调用next(),就计算出下一个元素的值,直到计算到最后一个元素,没有更多的元素时,抛出StopIteration的错误。
其实我们可以使用for循环来代替next()方式, 这样才更符合高效的编程思路:
>>> gen = ( x for x in range(1, 10))
>>> for num in gen:
... print num
...
1
2
3
4
5
6
7
8
9
generator非常强大。如果推算的算法比较复杂,用类似列表生成式的for循环无法实现的时候,还可以用函数来实现。
比如,著名的斐波拉契数列(Fibonacci),除第一个和第二个数外,任意一个数都可由前两个数相加得到:
1, 1, 2, 3, 5, 8, 13, 21, 34, ...
斐波拉契数列用列表生成式写不出来,但是,用函数把它打印出来却很容易:
def fib(max):n = 0 a, b = 0, 1while n < max:print ba, b = b, a + bn = n + 1
上面的函数可以输出斐波那契数列的前N个数:
>>> fib(6)
1
1
2
3
5
8
仔细观察,可以看出,fib函数实际上是定义了斐波拉契数列的推算规则,可以从第一个元素开始,推算出后续任意的元素,这种逻辑其实非常类似generator。
也就是说,上面的函数和generator仅一步之遥。要把fib函数变成generator,只需要把print b改为yield b就可以了:
def fib(max):n = 0 a, b = 0, 1while n < max:yield ba, b = b, a + bn = n + 1
这就是定义generator的另一种方法。如果一个函数定义中包含yield关键字,那么这个函数就不再是一个普通函数,而是一个generator:
>>> fib(6)
<generator object fib at 0x104feaaa0>
这里,最难理解的就是generator和函数的执行流程不一样。函数是顺序执行,遇到return语句或者最后一行函数语句就返回。而变成generator的函数,在每次调用next()的时候执行,遇到yield语句返回,再次执行时从上次返回的yield语句处继续执行。
举个简单的例子,定义一个generator,依次返回数字1,3,5:
>>> def odd():
... print 'step 1'
... yield 1
... print 'step 2'
... yield 3
... print 'step 3'
... yield 5
...
>>> o = odd()
>>> o.next()
step 1
1
>>> o.next()
step 2
3
>>> o.next()
step 3
5
>>> o.next()
Traceback (most recent call last):File "<stdin>", line 1, in <module>
StopIteration
可以看到,odd不是普通函数,而是generator,在执行过程中,遇到yield就中断,下次又继续执行。执行3次yield后,已经没有yield可以执行了,所以,第4次调用next()就报错。
回到fib的例子,我们在循环过程中不断调用yield,就会不断中断。当然要给循环设置一个条件来退出循环,不然就会产生一个无限数列出来。
同样的,把函数改成generator后,我们基本上从来不会用next()来调用它,而是直接使用for循环来迭代:
>>> for n in fib(6):
... print n
...
1
1
2
3
5
8
generator是非常强大的工具,在Python中,可以简单地把列表生成式改成generator,也可以通过函数实现复杂逻辑的generator。
要理解generator的工作原理,它是在for循环的过程中不断计算出下一个元素,并在适当的条件结束for循环。对于函数改成的generator来说,遇到return语句或者执行到函数体最后一行语句,就是结束generator的指令,for循环随之结束。
深入理解Python生成器(Generator)相关推荐
- python数据采集仪_数据采集卡支持python么深入理解Python生成器(Generator)
我们可以通过列表生成式简单直接地创建一个列表,但是受到内存限制,列表容量肯定是有限的.而且,创建一个包含100万个元素的列表,不仅占用很大的存储空间,而且如果我们仅仅需要访问前面几个元素,那后面绝大多 ...
- 彻底理解 Python 生成器
原文链接:https://www.cnblogs.com/liangmingshen/p/9706181.html 1. 生成器定义 在Python中,一边循环一边计算的机制,称为生成器:genera ...
- python生成器generator:深度学习读取batch图片
在深度学习中训练模型的过程中读取图片数据,如果将图片数据全部读入内存是不现实的,所以有必要使用生成器来读取数据. 通过列表生成式,我们可以直接创建一个列表.但是,受到内存限制,列表容量肯定是有限的.而 ...
- 彻底理解Python生成器和迭代器
目录 1.列表生成式 2.生成器 3.迭代器 4.对yield的总结 5.补充:itertools库学习 1.列表生成式 首先举个例子 现在有个需求,看列表 [0,1,2,3,4,5,6,7,8,9] ...
- python生成器generator和迭代器Iterator测试
为什么需要使用生成器? ''' generator生成器 通过列表推导式,我们可以创建一个新的列表,但是,受内存限制,列表的容量是有限的. 而且,创建一个包含100万个元素的列表,不仅占用很大存储空间 ...
- python 生成器 generator
生成器就是不把一个列表一下全部导入到内存中,而是一个一个生成 创建生成器 推导式创建生成器 []生成的是列表 ()生成的是生成器 In [1]: [x for x in range(5)] Out[1 ...
- Python生成器generator之next和send运行流程
对于普通的生成器,第一个next调用,相当于启动生成器,会从生成器函数的第一行代码开始执行,直到第一次执行完yield语句(第4行)后,跳出生成器函数. 然后第二个next调用,进入生成器函数后,从y ...
- 理解Python生成器的send函数
- python生成器yield原理_Python generator生成器和yield表达式详解
前言 Python生成器(generator)并不是一个晦涩难懂的概念.相比于MetaClass和Closure等概念,其较为容易理解和掌握.但相对于程序结构:顺序.循环和分支而言其又不是特别的直观. ...
最新文章
- php-fpm开启报错-ERROR: An another FPM instance seems to already listen on /tmp/php-cgi.sock
- PAT(甲级)2018年冬季考试 7-4 Heap Paths(非递归与递归解法)
- asp.net 开源
- 64位系统上使用*** Client端
- 通过×××路由器实现跨网段访问
- Linux文件系统十问
- 网页设计 html鼠标悬停,利用css3实现的简单的鼠标悬停按钮
- web自动化测试 Selenium2 Java自动化测试实战9_3
- 获取SD卡上 未安装 APK文件信息
- C# Parse和Convert的区别分析
- 【matlab选题推荐三】基于MATLAB的答题卡自动阅卷记分系统
- 构建嵌入式系统软件开发环境-为开发板安装linux系统
- 第八章:Junit——selenium IED 的版本和 火狐浏览器的版本 相对应
- 主板装机测试软件,主板检测工具:PSPident v0.74.1版发布
- IOS 开发 手势使用
- PDF转Word免费的软件有哪些?教给你三种转换方法
- ppt制作:加总页数首页不显示页码
- Flex一些总结以及遇到的一些面试题
- app获取缓存、清理缓存
- 3DMAX渲染高分辨率图像教程
热门文章
- JAVA自学笔记22
- springboot13 发布和监听事件
- 51nod 1277 KMP 前缀出现次数
- 如何用C#检查硬盘是否是固态硬盘SSD
- [转]LESS CSS 框架简介
- C#嵌套任务和子任务
- 告别.NET生成报表统计图的烦恼 (转)
- 数仓和mysql的区别_数据库和数据仓库的区别和联系
- tomcat服务器文件被清空,SpringBoot内置Tomcat缓存文件目录被意外删除导致异常
- Java黑皮书课后题第3章:**3.28(几何:两个矩形)编写一个程序,提示用户输入两个矩形中心的x坐标和y坐标以及矩形的宽度和高度,然后判断第二个矩形是在第一个矩形内,还是和第一个矩形重叠