生成器是迭代器的子集,本质更轻量、写法更简洁;迭代器需实现__iter__和__next__方法,生成器则通过含yield的函数自动实现,且具有惰性求值、省内存特性。

迭代器和生成器都用来逐个获取数据,但生成器是迭代器的子集,本质更轻量、写法更简洁。
迭代器是实现了__iter__和__next__方法的对象
只要一个对象有这两个方法,它就是迭代器。你可以手动创建类来实现:
- __iter__ 返回自身(或另一个迭代器)
- __next__ 每次调用返回下一个值,没数据时抛出
StopIteration - 比如
list、str本身不是迭代器,但调用iter()后就变成迭代器
生成器是用函数语法写的迭代器
用 def 定义、含 yield 的函数,调用后不执行函数体,而是返回一个生成器对象——它天然就是迭代器。
- 每次
next()时从上次yield处继续,自动保存局部变量和执行状态 - 不用手动管理
StopIteration,函数结束就自动抛出 - 写起来比手写迭代器类简单得多,比如:
def count(): yield 1; yield 2
关键区别在创建方式和内存行为
- 迭代器可以是类、内置类型(如
map对象)、或生成器——范围更广 - 生成器一定是迭代器,但迭代器不一定是生成器
- 生成器是“惰性求值”的典型:不调用就不执行,不遍历就不生成数据,省内存
- 普通迭代器(比如把大列表转成
iter(my_big_list))仍会占用原列表的全部内存
基本上就这些。用生成器写循环逻辑更自然,要精细控制状态或复用逻辑时才考虑手写迭代器类。
立即学习“Python免费学习笔记(深入)”;