- 开胃菜
- 使用 Python 解释器
- 非正式介绍Python
- 深入流程控制
- 数据结构
- 模块
- 输入和输出
- 错误和异常
- 类
- 标准库的简明介绍
- 标准库的简明介绍(第二部分)
- 现在干什么?
- 交互式输入编辑及历史替代
- 浮点算术: 问题和限制
# 剩余的队列, 它按照进入的顺序排列 deque([‘Michael’, ‘Terry’, ‘Graham’])
5.1.3. 列表推导式
列表推导式提供了从序列中创建列表的简便途径. 通常程序会对序列的每一个元素做些操作,并以其结果作为新列表的元素, 或者根据指定的条件来创建子序列.
而列表推导式的结构是, 在一个方括号里, 首先是一个表达式, 随后是一个 for
子句, 然后是零个或更多的 for
或 if
子句. 结果将是通过计算 for
和 if
子句来获得的一个列表. 如果要使表达式推导式出元组, 就必须用圆括号.
这里我们将一个数字列表每个元素翻三倍从而生成一个新列表:
>>> vec = [2, 4, 6]
>>> [3*x for x in vec]
[6, 12, 18]
现在加点儿小花样:
>>> [[x, x**2] for x in vec]
[[2, 4], [4, 16], [6, 36]]
这里我们对序列里每一项逐个调用某方法:
>>> freshfruit = [‘ banana’, ‘ loganberry ‘, ‘passion fruit ‘]
>>> [weapon.strip() for weapon in freshfruit]
[‘banana’, ‘loganberry’, ‘passion fruit’]
我们可以用 if
子句来进行过滤:
>>> [3*x for x in vec if x > 3]
[12, 18]
>>> [3*x for x in vec if x < 2]
[]
元组经常能不用圆括号而创建, 但这里不行:
>>> [x, x**2 for x in vec] # error – parens required for tuples
File “<stdin>”, line 1, in ?
[x, x**2 for x in vec] ^
SyntaxError: invalid syntax
>>> [(x, x**2) for x in vec]
[(2, 4), (4, 16), (6, 36)]
这里是一些循环的嵌套和其它技巧的演示:
>>> vec1 = [2, 4, 6]
>>> vec2 = [4, 3, -9]
>>> [x*y for x in vec1 for y in vec2]
[8, 6, -18, 16, 12, -36, 24, 18, -54]
>>> [x+y for x in vec1 for y in vec2]
[6, 5, -7, 8, 7, -5, 10, 9, -3]
>>> [vec1[i]*vec2[i] for i in range(len(vec1))]
[8, 12, -54]
列表推导式可使用复杂的表达式和嵌套的函式:
>>> [str(round(355/113, i)) for i in range(1, 6)]
[‘3.1’, ‘3.14’, ‘3.142’, ‘3.1416’, ‘3.14159’]
5.1.4. 嵌套列表推导式
如果你受的了的话, 其实列表推导式是可以嵌套的. 它的确是个强大的工具, 但 – 就像所有强大的工具一样 – 需要被小心地使用,
考虑下面的例子, 有一个 3×3 的矩阵, 存储为一个包含三个列表的列表, 每一行一个列表:
>>> mat = [
… [1, 2, 3],
… [4, 5, 6],
… [7, 8, 9],
… ]
现在, 如果你想交换行和列, 可以使用列表推导式:
>>> print([[row[i] for row in mat] for i in [0, 1, 2]])
[[1, 4, 7], [2, 5, 8], [3, 6, 9]]
使用*嵌套*列表推导式时特别需要注意:
从右至左地阅读嵌套列表推导式更容易理解.
该代码的冗长版本, 就明白地表述了流程:
for i in [0, 1, 2]:
for row in mat:
print(row[i], end=””)
print()
现实中, 你应当选择内建函式来处理复杂流程. 这里, 函式 zip()
就非常好用.
>>> list(zip(*mat))
[(1, 4, 7), (2, 5, 8), (3, 6, 9)]
参见 参数列表解包 了解本行中星号的详细内容.
5.2. del
语句
这有一种通过给定索引而不是值, 来删除列表中项的方法: 用 del
语句. 它与返回一个值的 pop()
方法不同. del
语句也可以移除列表中的切片, 或者清除整个列表 (之前我们通过给切片赋值为空列表来完成这点). 例如:
>>> a = [-1, 1, 66.25, 333, 333, 1234.5]
>>> del a[0]
>>> a
[1, 66.25, 333, 333, 1234.5]
>>> del a[2:4]
>>> a
[1, 66.25, 1234.5]
>>> del a[:]
>>> a
[]
del
也可以用于删除变量实体:
>>> del a
在这之后引用 a
的话会产生一个错误 (至少到给它赋另一个值之前). 我们将在后面找到 del
的其它用法.
5.3. 元组和序列
我们看到列表和字串有很多通用的属性, 例如索引和切片操作. 它们是 序列 数据类型的两个例子 (参考 Sequence Types — str, bytes, bytearray, list, tuple, range). Python 作为一门进化中的语言, 可能还有其它序列类型会被加入. 这里就有另一种标准序列数据类型: 元组 .
元组由若干逗号分隔的值组成, 例如:
>>> t = 12345, 54321, ‘hello!’
>>> t[0]
12345
>>> t
(12345, 54321, ‘hello!’)
>>> # Tuples may be nested:
… u = t, (1, 2, 3, 4, 5)
>>> u
((12345, 54321, ‘hello!’), (1, 2, 3, 4, 5))
如你所见, 元组输出时用圆括号包围, 以便正确表达元组的嵌套; 在输入时圆括号可加可不加, 不过圆括号经常是必要的 (特别是当元组是更大的表达式的一部分时).
元组有许多用途. 例如: (x, y) 坐标对, 数据库里的员工记录等. 元组同字串都是不可变的: 无法对元组指定项进行赋值 (尽管可通过切片和连接来模拟这个操作). 元组中可以包含可变的对象, 如列表.
构造包含 0 或 1 个项的元组是个特殊问题: 语法上为了适应这一情况,有些额外的规则. 空元组由一对空的圆括号构造; 一个项的元组由一个值后面跟着一个逗号构造 (把一个值放入一对圆括号里并不足以构造一个元组). 丑陋, 但有效. 例如:
>>> empty = ()
>>> singleton = ‘hello’, # <– 注意后面的逗号
>>> len(empty)
0
>>> len(singleton)
1
>>> singleton
(‘hello’,)
语句 t = 12345, 54321, 'hello!'
是 元组打包 的一个例子: 值 12345
, 54321
和 'hello!'
被打包进一个元组. 反过来, 这个操作也是可行的:
>>> x, y, z = t
这种对右侧任一序列的处理很合适称为 序列解包 . 序列解包时要求等号左边的值个数与右边序列元素个数相等. 注意, 多重赋值其实是联合使用了元组打包和序列解包. (虽然元组和列表都算序列,但是必须有所不同)
5.4. 集合(Set)
Python 还包含了 集合(set) 数据类型. 集合是种无序不重复的元素集. 基本用途包括成员关系测试和重复条目消除. 集合对象也支持合(union),交(intersection), 差(difference), 和对称差(sysmmetric difference)等数学操作.
花括号或函式 set()
可用于创建集合. 注意: 创建一个空集合只能使用 set()
, 而不能使用 {}
; 后者是创建一个空字典, 字典我们会在下一节里讨论.
以下是简明示范:
>>> basket = {‘apple’, ‘orange’, ‘apple’, ‘pear’, ‘orange’, ‘banana’}
>>> print(basket) # 重复的被移除了
{‘orange’, ‘banana’, ‘pear’, ‘apple’}
>>> ‘orange’ in basket # 快速成员关系测试
True
>>> ‘crabgrass’ in basket False
>>> # 在两个单词的不重复的字母里演示集合操作
…
>>> a = set(‘abracadabra’)
>>> b = set(‘alacazam’)
>>> a # a 中的不重复字母
{‘a’, ‘r’, ‘b’, ‘c’, ‘d’}
>>> a – b # a 中有而 b 中没有的字母
{‘r’, ‘d’, ‘b’}
>>> a | b # 既有 a 的字母又有 b 的字母
{‘a’, ‘c’, ‘r’, ‘d’, ‘b’, ‘m’, ‘z’, ‘l’}
>>> a & b # a 和 b 中都有的字母
{‘a’, ‘c’}
>>> a ^ b # a 或 b 中只有一个有的字母
{‘r’, ‘d’, ‘b’, ‘m’, ‘z’, ‘l’}
就像 列表, 集合也支持推导式:
>>> a = {x for x in ‘abracadabra’ if x notin ‘abc’}
>>> a
{‘r’, ‘d’}
5.5. 字典
Python 中另一很有用的内建数据类型为 字典 (参考 Mapping Types — dict). 在其它语言中字典一般被叫做 “关联存储” 或 “关联数组”. 与使用某个范围作为索引的序列不一样, 字典通过 键 来索引, 而键可以是任意不可变类型; 通常用字符串和数字作为键. 如果元组只包含字符串和数字, 元组也可以作为键; 但是, 当元组直接或间接地包含可变对象时, 就不能用作一个键. 不能使用列表作为键, 因为列表可以通过索引, 切片, 或如 append()
和 extend()
方法原地赋值而被改变.
最好把字典看成是一个没有顺序的 键:值 对集合, 键必须是唯一的 (在一个字典里). 一对花括号创建一个空字典: {}
. 在括号中间放置的以逗号分隔的 键:值对
列表就是字典的初始 键:值对
. 这也是字典输出时的格式.
字典最主要的操作是通过某键存储一个值, 以及从给定的键里提取它的值. 使用 del
可以删除一个键:值对. 如果你使用一个已被使用的键进行存储操作, 该键的旧值就没有了. 使用一个不存在的键提取值会产生一个错误.
在一个字典上执行 list(d.keys())
返回该字典中所使用键的列表, 该列表的顺序不确定 (如果需要有序, 只要使用 sorted(d.keys())
). [1] 要检查某一个键是否在字典里, 使用 in
关键字.
这是一个使用字典的小例子:
>>> tel = {‘jack’: 4098, ‘sape’: 4139}
>>> tel[‘guido’] = 4127
>>> tel
{‘sape’: 4139, ‘guido’: 4127, ‘jack’: 4098}
>>> tel[‘jack’]
4098
>>> del tel[‘sape’]
>>> tel[‘irv’] = 4127
>>> tel
{‘guido’: 4127, ‘irv’: 4127, ‘jack’: 4098}
>>> list(tel.keys())
[‘irv’, ‘guido’, ‘jack’]
>>> sorted(tel.keys())
[‘guido’, ‘irv’, ‘jack’]
>>> ‘guido’ in tel
True
>>> ‘jack’ notin tel
False
构造器 dict()
从键-值对序列里直接生成字典,如果有固定的模式,可在列表推导式指定特定的键值对:
>>> dict([(‘sape’, 4139), (‘guido’, 4127), (‘jack’, 4098)])
{‘sape’: 4139, ‘jack’: 4098, ‘guido’: 4127}
>>> dict([(x, x**2) for x in (2, 4, 6)]) # 使用列表推导式
{2: 4, 4: 16, 6: 36}
在本教程后面的章节, 会学习到生成器表达式, 这更适于为 dict()
构造器生成键-值对序列. 若键为字符串, 有时用关键字参数指定键-值对更为简单:
>>> dict(sape=4139, guido=4127, jack=4098)
{‘sape’: 4139, ‘jack’: 4098, ‘guido’: 4127}
5.6. 遍历技巧
当对字典遍历时, 可用 items()
方法同时取回键和对应的值.
>>> knights = {‘gallahad’: ‘the pure’, ‘robin’: ‘the brave’}
>>> for k, v in knights.items():
… print(k, v)
…
gallahad the pure
robin the brave
对序列遍历时, 可以使用 enumerate()
函式来同时取回位置索引和相应的值.
>>> for i, v in enumerate([‘tic’, ‘tac’, ‘toe’]):
… print(i, v)
…
0 tic
1 tac 2
toe
同时对两个或更多的序列进行遍历时, 可用 zip()
进行组合
>>> questions = [‘name’, ‘quest’, ‘favorite color’]
>>> answers = [‘lancelot’, ‘the holy grail’, ‘blue’]
>>> for q, a in zip(questions, answers):
… print(‘What is your {0}? It is {1}.’.format(q, a))
…
What is your name? It is lancelot.
What is your quest? It is the holy grail.
What is your favorite color? It is blue.
反向遍历序列时, 先指定这个序列, 然后调用 reversed()
函式
>>> for i in reversed(range(1, 10, 2)):
…
print(i)
…
9 7 5 3 1
想有序地遍历一个序列, 用 sorted()
函式返回排序后的序列,原序列将不被触及
>>> basket = [‘apple’, ‘orange’, ‘apple’, ‘pear’, ‘orange’, ‘banana’]
>>> for f in sorted(set(basket)):
… print(f)
… apple
banana
orange
pear
5.7. 深入条件控制
在 while
和 if
语句中使用的条件可以包含任何操作符, 而不仅仅是比较.
- 比较操作符
in
和not in
检查一个值是否在序列中. - 操作符
is
和is not
比较两个对象是否为同一对象; 这只对诸如列表的可变对象有用.
所有比较操作符具有相同的优先级, 低于所有的数值操作.
比较操作符可以连起来使用. 例如, – a < b == c
测试 a
小于 b
且 b
与 c
相等.
比较操作(或其它任何布尔表达式)都能用逻辑操作符 and
和 or
连接, 结果值可以用 not
取反.
- 逻辑操作符的优先级又低于比较操作符;
- 这其中,
not
优先级最高, 而or
的优先级最低, 因此A and not B or C
等价于(A and (not B)) or C
. 同样, 可以使用圆括号来表达想要的结果. - 逻辑操作符
and
和or
被称为 短路 操作符: 它从左至右计算参数,并且当结果确定时计算就立即停止.- 例如, 如果
A
和C
为真, 而B
为假时,A and B and C
不会计算表达式C
. - 当把短路操作符的返回值作为一个常规值而不是布尔值时, 它的值就是最后计算的参数值.
- 例如, 如果
可以把比较式或其它逻辑表达式的值赋给一个变量. 例如,
>>> string1, string2, string3 = ”, ‘Trondheim’, ‘Hammer Dance’
>>> non_null = string1 or string2 or string3
>>> non_null
‘Trondheim’
注意, 在 Python 中, 不像 C, 赋值不可以发生在表达式内部. C 程序员可能对此有抱怨, 但是这样就避免了 C 程序中常见的一类错误,比如说:
- 在使用
==
的表达式里键入了=
.
5.8. 序列和其它类型的比较
序列对象可以与同一类型的其它对象比较. 使用 字典编纂 顺序比较:
- 首先比较头两项, 如果它们不同, 它们的比较就决定整个比较的结果;
- 如果它们相同, 就比较下两项, 就这样直到其中有序列被比较完了.
- 如果要被比较的两项本身就是相同类型的序列, 那么就递归进行比较.
- 如果两个序列所有的项都相等, 那么, 它们就相等.
- 如果一个序列是另一个序列的初始子序列(initial sub-sequence),那么短的就是较小的.
- 字符串的 字典编纂 顺序由单个字符的 Unicode 字码来决定.
以下是比较相同类型序列的例子:
注意, 使用 <
或 >
比较两个不同类型的对象有时候是合法的, 条件是它们要有合适的比较方法. 例如, 不同的数字类型可以按照它们的数字大小来比较, 因此 0 等于 0.0, 等等. 否则, 解释器不会提供一个任意的顺序, 而会抛出一个 TypeError
异常.