Python迭代器协议实现原理_自定义迭代解析【教程】

16次阅读

python迭代器协议核心是__iter__和__next__两个方法:前者返回迭代器对象(可为self或新实例),后者返回下一项或抛StopIteration;遵守该协议即支持for循环等操作,无需继承或装饰。

Python迭代器协议实现原理_自定义迭代解析【教程】

Python迭代器协议的核心是两个方法:__iter____next__。只要一个对象实现了这两个方法,它就能被 for 循环、list()next()工具直接使用——不需要继承任何类,也不依赖特殊装饰,纯粹靠约定。

迭代器协议的两个关键方法

__iter__ 必须返回一个迭代器对象(通常就是 self,也可以是新创建的迭代器实例);__next__ 每次调用返回下一个值,没有更多元素时抛出 StopIteration 异常。Python 内部正是靠捕获这个异常来判断迭代结束。

  • 如果 __iter__ 返回的是自身(且自身有 __next__),那它既是可迭代对象,也是迭代器(单遍历、不可重用)
  • 如果 __iter__ 每次都返回一个新的独立迭代器,那该对象就支持多次遍历(如 liststr
  • __next__ 不能返回 None 作为有效数据,因为 next(it, default)None 表示“取不到”,容易混淆

自定义只读序列迭代器(支持多次遍历)

想让自己的容器类(比如一个封装了列表的 MyList)支持 for 循环和 list(my_obj),推荐分离「可迭代对象」和「迭代器」角色:

  • 在容器类中实现 __iter__,每次返回一个新的迭代器实例
  • 单独写一个迭代器类,实现 __next____iter__(通常直接 return self
  • 这样能天然支持线程或嵌套循环中各自独立遍历,避免状态冲突

例如:MyList([1,2,3]).__iter__() 返回 MyListIterator 实例,每次调用都从头开始。

立即学习Python免费学习笔记(深入)”;

实现单次消耗型迭代器(节省内存)

适合处理流式数据、大文件或生成逻辑复杂的结果。这类对象本身既是可迭代对象,也是迭代器:

  • __iter__ 直接 return self
  • __next__ 维护内部状态(如索引、文件指针、随机数种子),每次推进并返回新值
  • 一旦抛出 StopIteration,再次调用 next() 仍会抛异常——不可重用

典型例子:逐行读取大文件的迭代器、斐波那契数列生成器(手动实现版)、数据库游标封装。

与生成器函数的关系

yield 写的生成器函数,调用后自动返回一个符合迭代器协议的对象。它的底层就是 Python 自动帮你实现了 __iter____next__,并管理好暂停/恢复、状态保存等细节。所以你无需手动写这些方法,但理解协议有助于调试和设计更灵活的迭代逻辑——比如在生成器里加缓存、重试、日志,或混合多种数据源。

不复杂但容易忽略:协议本身无类型检查、无强制规范,全靠开发者自觉遵守;只要方法名对、行为对,Python 就认。

text=ZqhQzanResources