【IT168 技术文档】2007年8月31日,Python 3000的最新版本Py3.0终于释出了第一个alpha版本。因为3.0版本与之前的2.x版本不兼容,所以,Py3.0版本完全可以看作是Py的新生。此实为Python社区盛事。虽然Py3.0的final版本要到08年8月才会释出,但我们仍然可以从a1版本看到很多Py3.0的新特性,现在我们就来体验一下。
下载与安装
在http://www.python.org/download/releases/3.0/下载。提供压缩的源代码包(50MB)和Windows安装包(10MB)。
兼容性
早在Py3.0释出之前,Guido就放言Py3.0不再对Py2.x兼容。现在看来,的确是这样的。
不过,提供了一个“2To3”的转换器,以便开发人员能够将Py2.x的代码转到Py3.0上来。但目前这个还没有正式的释出版本,只有SVN仓库可以CheckOut。地址在这里:http://svn.python.org/view/sandbox/trunk/2to3/
性能
Py3.0运行pystone benchmark的速度比Py2.5慢30%。Guido认为Py3.0有极大的优化空间,在字符串和整形操作上可以取得很好的优化结果。
编码
Py3.0源码文件默认使用utf-8编码,这就使得以下代码是合法的:
>>> 中国 = 'china'
>>> print(中国)
china
语法:
1)去除了<>,全部改用!=。
2)去除``,全部改用repr()
3)关键词加入as和with。
4)整型除法返回浮点数,要得到整型结果,请使用//。
5)加入nonlocal语句。使用noclocal x可以直接指派外围(非全局)变量。
6)去除print语句,加入print()函数实现相同的功能。同样的还有exec语句,已经改为exec()函数。
7)去除元组参数解包。不能def(a, (b, c)):pass这样定义函数了。
8)新式的8进制字面量,相应地修改了oct()函数。2.x这样:
>>> 0666
438
>>> oct(438)
'0666'
3.0这样:
>>> 0666
SyntaxError: invalid token (, line 1)
>>> 0o666
438
>>> oct(438)
'0o666'
9)增加了2进制字面量和bin()函数:
>>> bin(438)
'0b110110110'
>>> _438 = '0b110110110'
>>> _438
'0b110110110'
10)扩展的可迭代解包。在Py3.0里,a, b, *rest = seq 和 *rest, a = seq都是合法的,只要求两点:rest是list对象和seq是可迭代的。
11)新的super(),可以不再给super()传参数,
>>> class C(object): def __init__(self, a): print('C', a) >>> class D(C): def __init(self, a): super().__init__(a) # 无参数调用super() >>> D(8) C 8 <__main__.D object at 0x00D7ED90>
12) 新的metaclass语法:
class Foo(*bases, **kwds): pass
13)支持class decorator。用法与函数decorator一样:
>>> def foo(cls_a): def print_func(self): print('Hello, world!') cls_a.print = print_func return cls_a >>> @foo class C(object): pass >>> C().print() Hello, world!
class decorator可以用来玩玩狸猫换太子的大把戏。
14)raise语句的语法改变。
字符串和字节串
1)Py3.0去除了unicode类型,现在字符串只有str一种类型,但它跟2.x版本的unicode几乎一样。
2)关于字节串。
数据类型
1)Py3.0去除了long类型,现在只有一种整型——int,但它的行为就像2.x版本的long。
2)新增了bytes类型,对应于2.x版本的八位串,定义一个bytes字面量的方法如下:
>>> b = b'china' >>> type(b) str对象和bytes对象可以使用.encode() (str -> bytes) or .decode() (bytes -> str)方法相互转化。 >>> s = b.decode() >>> s 'china' >>> b1 = s.encode() >>> b1 b'china'
3)dict的.keys()、.items和.values()方法返回迭代器,而之前的iterkeys()等函数都被废弃。同时去掉的还有dict.has_key(),用in替代它吧!
面向对象
1)引入抽象基类(Abstraact Base Classes,ABCs)。
2)容器类和迭代器类被ABCs化,所以cellections模块里的类型比Py2.5多了很多。
>>> import collections >>> print('\n'.join(dir(collections))) Callable Container Hashable ItemsView Iterable Iterator KeysView Mapping MappingView MutableMapping MutableSequence MutableSet NamedTuple Sequence Set Sized ValuesView __all__ __builtins__ __doc__ __file__ __name__ _abcoll _itemgetter _sys defaultdict deque
另外,数值类型也被ABCs化。关于这两点。
3)迭代器的next()方法改名为__next__(),并增加内置函数next(),用以调用迭代器的__next__()方法
4)增加了@abstractmethod 和 @abstractproperty两个decorator,编写抽象方法(属性)更加方便。
异常
1)所以异常都从BaseException继承,并删除了StardardError。
2)去除了异常类的序列行为和.message属性。
3)用raise Exception(args) 代替 raise Exception, args语法。
4)捕获异常的语法改变,引入了as关键字来标识异常实例,在Py2.5中:
>>> try: ... raise NotImplementedError('Error') ... except NotImplementedError, error: ... print error.message ... Error
在Py3.0中:
>>> try: raise NotImplementedError('Error') except NotImplementedError as error: # 注意这个 as print(str(error)) Error
5)异常链,因为__context__在3.0a1版本中还没有实现,这方面就不说了。
其它:
1)xrange()改名为range(),要想使用range()获得一个list,必须显式调用:
>>> list(range(10))
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
2)bytes对象不能hash,也不支持b.lower()、b.strip()和b.split()方法,但对于后两者可以使用b.strip(b’ \n\t\r\f’)和b.split(b’ ‘)来达到相同目的。
3)zip()、map()和filter()都返回迭代器。而apply()、callable()、coerce()、execfile()、reduce()和reload()函数都被去除了。
4)string.letters和相关的.lowercase和.uppercase被去除,请改用string.ascii_letters等。
5)如果x < y的不能比较,抛出TypeError异常。2.x版本是返回伪随机布尔值的。
6)__getslice__系列成员被废弃。a[i:j]根据上下文转换为a.__getitem__(slice(I, j))或__setitem__和__delitem__调用。
7)file类被废弃,在Py2.5:
>>> file 在Py3.0 >>> file Traceback (most recent call last): File "", line 1, in file NameError: name 'file' is not defined
感想
Python 3.0版本是Python的革命性升级,废除了许多之前的特性,也引入了新特性(如大量使用迭代器的思想)。开发人员从2.x升级到3.0版本需要比较大的代价,不仅要重新训练自己已经僵化的手指,更要让脑子从以前的条条框框中跳出来。
现在释出的只是alpha 1版本,还有很多特性都没有实现,根据PEP 3000的计划,到08年4月将能够实现全部新特性,到时我们将会有更强的震憾感吧?