在进行程序调试时用的最多的语句可能就是print,在Python2中,print是一条语句,而在Python3中,其是一个函数。有人可能就有疑问了,我在Python2中明明也看到当函数使用。
1
2
3
4
5
6 1# Python2
2print("hello") # 等价于print ("hello") 注意两者之间有空格
3
4# Python3
5print("hello")
6
然而,你看到的只是表象。那么,上面两个表达式有什么区别?从输出结果来看是一样的,但本质上,前者是把("hello")当作一个整体,而后者是一个函数,接收字符串作为参数。
1
2
3
4
5
6
7
8 1# Python2
2>>>print("hello","world")
3('hello','world')
4
5# Python3
6>>>print("hello","world")
7hello world
8
这个例子更明显了,在Python2中,print后面接的是一个元组对象,而在Python3中,print可以接收多个位置参数。如果希望在Python2中把print当函数使用,可以导入future模块中的print_function
1
2
3
4
5
6
7
8 1# Python2
2>>>print("hello","world")
3('hello','world')
4
5>>>from __future__ import print_function
6>>>print("hello","world")
7hello world
8
编码
Python2的默认编码是ASCII,这也是Python2中经常遇到编码问题的原因之一,至于是为什么会使用ASCII作为默认编码,原因在于Python这门语言诞生的时候还没有出现Unicode。Python3默认采用了UTF-8作为默认编码,所以不再需要在文件顶部写 # coding=utf-8
1
2
3
4
5
6
7
8 1# Python2
2>>>sys.getdefaultencoding()
3'ascii'
4
5# Python3
6>>>sys.getdefaultencoding()
7'utf-8'
8
字符串
字符串是最大的变化之一,这个变化使得编码问题降到了最低可能。在Python2中,字符串有两个类型,一个是unicode,一个是str,前者表示文本字符串,后者表示字节序列,不过两者之间没有明显的界限,开发者也觉得很混乱,不明白编码错误的原因,不过在Python3中两者做了严格区分,分别用str表示字符串,byte表示字节序列,任何需要写入文本或者网络传输的数据都只接收字节序列,这就从源头上阻止了编码错误的问题。
python2 | python3 | 表现 | 转换 | 作用 |
str | byte | 字节 | encode | 存储,传输 |
unicode | str | 字符 | decode | 展示 |
1 | 1 |
True和False
True和False在Python2中是两个全局变量(名字),在数值上分别对应1和0,既然是变量,那么它们就可以指向其它对象。例如:.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15 1# Python2
2>>>True=False
3>>>True
4False
5
6>>>True is False
7True
8>>>False="x"
9>>>False
10'x'
11>>>if False:
12... print("?")
13...
14?
15
迭代器
在Python2中很多返回列表对象的内置函数和方法在Python3都改成了类似于迭代器的对象,因为迭代器的惰性加载特性使得操作大数据更有效率。Python2中的range和xrange函数合并成了range,如果同时兼容2和3,可以这样:
1
2
3
4
5 1try:
2 range=xrange
3except:
4 pass
5
另外,字典对象的dict.keys() 、dict.values()方法都不再返回列表,而是以一个类似迭代器的"view"
对象返回。高阶函数map、filter、zip返回的也都不是列表对象了。Python2的迭代器必须实现next方法,而Python3改成了__next__