本文共 3145 字,大约阅读时间需要 10 分钟。
第四章 基础知识进阶
第十七节 迭代、可迭代对象、迭代器 一、 引言 本来计划讲完元组和字典后就讲列表解析和字典解析,但要理解列表解析和字典解析,就需要掌握Python的高级的类型迭代器,因此本节将迭代器的概念先进行介绍。二、 概念
1. 迭代:是通过重复执行的代码处理相似的数据集的过程,并且本次迭代的处理数据要依赖上一次的结果继续往下做,上一次产生的结果为下一次产生结果的初始状态,如果中途有任何停顿,都不能算是迭代。例如: 1) 非迭代例子 loop = 0 while loop < 3: print("Hello world!") loop += 1 2) 迭代例子 loop = 0 while loop < 3: print(loop) loop += 1 例1仅是循环3次输出" Hello world!",输出的数据不依赖上一次的数据,因此不是跌代。 2. 容器:容器是一种把多个元素组织在一起的数据结构,容器中的元素可以逐个地迭代获取,可以用in, not in关键字判断元素是否包含在容器中。 1) 这个定义与在列表中定义的容器“可以包含其他类型对象(如列表、元组、字典等)作为元素的对象,在 Python中称为容器(container)”从字面上看是不同的,但本质上是一样的,因为基本上所有有元素的数据类型(字符串除外)都能包含其他类型的对象; 2) 容器仅仅只是用来存放数据的,我们平常看到的 l = [1,2,3,4]等等,好像我们可以直接从列表这个容器中取出元素,但事实上容器并不提供这种能力,而是可迭代对象赋予了容器这种能力。 3. 可迭代对象(Iterable):可迭代对象并不是指某种具体的数据类型,它是指存储了元素的一个容器对象,且容器中的元素可以通过__iter__( )方法或__getitem__( )方法访问。 1) __iter__方法的作用是让对象可以用for ... in循环遍历,__getitem__( )方法是让对象可以通过“实例名[index]”的方式访问实例中的元素。老猿认为这两个方法的目的是Python实现一个通用的外部可以访问可迭代对象内部数据的接口。 2) 一个可迭代对象是不能独立进行迭代的,Python中,迭代是通过for ... in来完成的。凡是可迭代对象都可以直接用for… in…循环访问,这个语句其实做了两件事:第一件事是调用__iter__()获得一个可迭代器,第二件事是循环调用__next__()。 3) 常见的可迭代对象包括: a) 集合数据类型,如list、tuple、dict、set、str等; b) 生成器(generator),包括生成器和带yield的生成器函数(generator function),下节专门介绍。 4) 如何判断一个对象是可迭代对象呢?可以通过collections模块的Iterable类型判断,具体判断方法如下: from collections import Iterable isinstance('', Iterable) #返回True,表明字符串也是可迭代对象 关于collections后续再介绍。 5) 在迭代可变对象如列表对象时候,一个序列的迭代器只是记录当前到达了序列中的第几个元素,所以如果在迭代过程中改变了序列的元素。更新会立即反应到所迭代的条目上。比如一个列表 用for…in方法迭代访问时,删除了当前索引n对应的元素,则下一个循环时,访问的数据索引为n+1,但实际访问元素的索引是上一轮循环中列表的索引n+2对应元素。 4. 迭代器(Iterator):迭代器可以看作是一个特殊的对象,每次调用该对象时会返回自身的下一个元素,从实现上来看,一个迭代器对象必须是定义了__iter__()方法和next()方法的对象。 1) Python的Iterator对象表示的是一个数据流,可以把这个数据流看做是一个有序序列,但我们却不能提前知道序列的长度,所以Iterator的计算是惰性的,只有在需要返回下一个数据时它才会计算; 2) Iterator对象可以被next()函数调用并不断返回下一个数据,直到没有数据时抛出StopIteration错误; 3) 所有的Iterable可迭代对象均可以通过内置函数iter()来转变为迭代器Iterator。老猿认为__iter__( )方法是让对象可以用for ... in循环遍历时找到数据对象的位置,__next__( )方法是让对象可以通过next(实例名)访问下一个元素。除了通过内置函数next调用可以判断是否为迭代器外,还可以通过collection中的Iterator类型判断。如: isinstance('', Iterator)可以判断字符串类型是否迭代器。注意: list、dict、str虽然是Iterable,却不是Iterator。 4) 迭代器优点:节约内存(循环过程中,数据不用一次读入,在处理文件对象时特别有用,因为文件也是迭代器对象)、不依赖索引取值、实现惰性计算(需要时再取值计算); 举例:用迭代器的方式访问文件 for line in open("test.txt"):print(line) 这样每次读取一行就输出一行,而不是一次性将整个文件读入,节约内存。 5) 迭代器使用上存在限制:只能向前一个个地访问数据,已访问数据无法再次访问、遍历访问一次后再访问无数据 举例: l = [1,2,3,4] i=iter(l) #从list列表生成迭代器i list(i) #将迭代器内容转换成列表,输出[1,2,3,4] list(i) #将迭代器内容再次转换成列表,输出[] 用for循环访问: i=iter(l) for k in i:print(k) #输出1、2、3、4 for k in i:print(k) #再次循环没有输出 如果需要解决这个问题,可以分别定义一个可迭代对象,每次访问前从可迭代对象重新生成和迭代器对象,如本部分前面所介绍的,当用for..in方式访问可迭代对象时,系统就是这么干的; 6) 迭代器当所有的元素全部取出后再次调用next就会抛出一个StopIteration异常,这并不是错误的发生,而是告诉外部调用者迭代完成了 三、 迭代器代码举例 1. 用for…in方式访问迭代器 vList=[1,2,3,4] vIter=iter(vList) #从列表生成迭代器对象 for i in vIter: print('第一次:',i) #输出迭代器中的数据1、2、3、4 for i in vIter: print('第二次:',i) #再次输出没有数据,因为迭代器已经空了 如果上述for循环访问变量改成列表,则每次都能输出数字 for i in vList: print('第一次:',i) #输出列表中的数据1、2、3、4,可以重复执行输出 从以上两种for循环方式可以看出迭代器和可迭代对象的区别。 2. 用next方式访问 vList=[1,2,3,4] vIter=iter(vList) while True: try:i=next(vIter) except:break print('第一次:',i) while循环如果执行第二次机也不会输出。本节介绍了迭代器相关的概念,并举简例介绍了迭代器的使用。
老猿Python()系列文章用于逐步介绍老猿学习Python后总结的学习经验,这些经验有助于没有接触过Python的程序员可以很容易地进入Python的世界。
欢迎大家批评指正,谢谢大家关注!转载地址:http://qovk.baihongyu.com/