Differences between revisions 2 and 14 (spanning 12 versions)
Revision 2 as of 2004-08-10 18:13:54
Size: 5667
Editor: xyb
Comment:
Revision 14 as of 2006-11-16 11:55:46
Size: 2537
Editor: ohyha
Comment:
Deletions are marked like this. Additions are marked like this.
Line 1: Line 1:
##language:zh
'''
Python编程速度技巧'''
-- Zoom.Quiet [[[DateTime(2004-08-09T23:59:25Z)]]]

[[TableOfContents]]
[转载自oso,其上有“python编程简介”系列,这是第九篇,是篇译文]
有了前面的描述, 大家差不多知道什么是Python了. 最近因为在网
上看一两篇关于Python的运行速度问题, 不给大家介绍一下心里不
踏实, :-)

= Python编程速度技巧 =

== 最常见 ==

 一个最常见的速度陷坑(至少是俺在没看到网上这篇介绍时陷进去
过好些次的) 是: 许多短字串并成长字串时, 大家通常会用:
{{{
#!python
shortStrs = [ str0, str1, ..., strN]
#N+1个字串所组成的数列
longStr = ''
for s in shortStrs: longStr += s
}}}
因为Python里字串是不可变的, 所以每次 longStr += s 都是将原
来的 longStr 与 str 拷贝成一个新字串, 再赋给longStr. 随着
longStr的不断增长, 所要拷贝的内容越来越长. 最后导至str0被
拷贝N+1次, str1是N次, ... .

那咋办呢 ? 咱们来看看Skip Montanaro先生的解说:
http://musi-cal.mojam.com/~skip/python/fastpython.html
及可参考一下Guido van Rossum本人的:
http://www.python.org/doc/essays/list2str.html

=== 找出速度瓶颈 ===
 * 1)首先在大家应先学会怎么去找出速度瓶颈: Python自带有profile
模块:
{{{
#!python
import profile
profile.run ('想要检查的函数名()')
}}}
就会打印出那个函数里调用了几次其它函数, 各用了多少时间,
总共用了多少时间等信息 --- Nice ? 详请参阅<<库参考>>中的
profile模块的论述.

当然脑袋笨一点或是聪明一点的, 也可以用time模块中的time()
来显示系统时间, 减去上次的time()就是与它的间隔秒数了.

=== 字串相并 ===
 * 就头上的例子而言, 用 :
{{{
#!python
longStr =''.join(shortStrs)
}}}
立马搞定, :-) 但如果shortStrs里面不都是字串, 而包含了些数
字呢 ? 直接用join就会出错. 不怕, 这样来:
{{{
#!python
shortStrs = [str(s) for s in shortStrs[i]]
longStr = ''.join(shortStrs)
}}}
也即先将数列中所有内容都转化为字串, 再用join.

对少数几个字串相并, 应避免用:
all = str0 + str1 + str2 + str3
而用:
all = '%s%s%s%s' % (str0, str1, str2, str3)

=== 数列排序 ===
 * list.sort ()
你可以按特定的函数来: list.sort( 函数 ), 只要这个函数接受
两参数, 并按特定规则返回1, 0, -1就可以. --- 很方便吧? 但
会大大减慢运行速度. 下面的方法, 俺举例子来说明可能更容易
明白.

比方说你的数列是 l = ['az', 'by'], 你想以第二个字母来排序.
先取出你的关键词, 并与每个字串组成一个元组:
new = map (lambda s: (s[1], s), l )

于是new变成[('z', 'az'), ('y', 'by')], 再把new排一下序:
new.sort()

则new就变成 [('y', 'by'), ('z', 'az')], 再返回每个元组中
的第二个字串:
sorted = map (lambda t: t[1], new)

于是sorted 就是: ['by', 'az']了. 这里的lambda与map用得很
好.


=== 循环 ===

比如for循环. 当循环体很简单时, 则循环的调用前头(overhead)
会显得很臃肿, 此时map又可以帮忙了. 比如你想把一个长数列
l=['a', 'b', ...]中的每个字串变成大写, 可能会用:
{{{
#!python
import string
newL = []
for s in l: newL.append( string.upper(s) )
}}}
用map就可以省去for循环的前头:
{{{
#!python
import string
newL = map (string.upper, l)
}}}
Guido的文章讲得很详细.


=== 局域变量 及 '.' ===
象上面, 若用 append = newL.append, 及换种import方法:
{{{
#!python

import string
append = newL.append
for s in l: append (string.upper(s))
}}}

会比在for中运行newL.append快一些, 为啥? 局域变量容易寻找.

俺自己就不比较时间了, Skip Montanaro的结果是:
{{{
基本循环: 3.47秒
去点用局域变量: 1.79秒
使用map: 0.54秒
}}}

=== try的使用 ===
比如你想计算一个字串数列:
l = ['I', 'You', 'Python', 'Perl', ...]
中每个词出现的次数, 你可能会:
{{{
#!python
count = {}
for s in l:
    if not count.has_key(s): count[s] = 0
    else: count[s] += 1
}}}
由于每次都得在count中寻找是否已有同名关键词, 会很费时间.
而用try:
{{{
#!python
count ={}
for s in l:
    try: count[s] += 1
    except KeyError: count[s] = 0
}}}
就好得多. 当然若经常出现例外时, 就不要用try了.


=== import语句 ===
这好理解. 就是避免在函数定义中来import一个模块, 应全在
全局块中来import


=== 大量数据处理 ===
由于Python中的函数调用前头(overhead)比较重, 所以处理大量
数据时, 应:
{{{
#!python
def f():
for d in hugeData: ...
f()
}}}
而不要:
{{{
#!python
def f(d): ...
for d in hugeData: f(d)
}}}
这点好象对其它语言也适用, 差不多是放之四海而皆准, 不过对
解释性语言就更重要了.


=== 减少周期性检查 ===
这是Python的本征功能:
周期性检查有没有其它绪(thread)或系 统信号(signal)等要处理.

可以用sys模块中的setcheckinterval 来设置每次检查的时间间隔.

缺省是10, 即每10个虚拟指令 (virtual instruction)检查一次.

当你不用绪并且也懒得搭理 系统信号时, 将检查周期设长会增加速度, 有时还会很显著.

{{{
---编/译完毕. 看来Python是易学难精了, 象围棋?
}}}

= 我们自个儿的体悟 =
''请有心得者分享!''
大哥小弟,附件不能删除了,还叫什么wiki啊,要人怎么更新阿?! 哈哈!大哥小弟,附件不能删除了,还叫什么wiki啊,要人怎么更新阿?!哈哈!大哥小弟,附件不能删除了,还叫什么wiki啊,要人怎么更新阿?! 哈哈!大哥小弟,附件不能删除了,还叫什么wiki啊,要人怎么更新阿?!哈哈!大哥小弟,附件不能删除了,还叫什么wiki啊,要人怎么更新阿?! 哈哈!大哥小弟,附件不能删除了,还叫什么wiki啊,要人怎么更新阿?!哈哈!大哥小弟,附件不能删除了,还叫什么wiki啊,要人怎么更新阿?! 哈哈!大哥小弟,附件不能删除了,还叫什么wiki啊,要人怎么更新阿?!哈哈!大哥小弟,附件不能删除了,还叫什么wiki啊,要人怎么更新阿?! 哈哈!大哥小弟,附件不能删除了,还叫什么wiki啊,要人怎么更新阿?!哈哈!大哥小弟,附件不能删除了,还叫什么wiki啊,要人怎么更新阿?! 哈哈!大哥小弟,附件不能删除了,还叫什么wiki啊,要人怎么更新阿?!哈哈!大哥小弟,附件不能删除了,还叫什么wiki啊,要人怎么更新阿?! 哈哈!大哥小弟,附件不能删除了,还叫什么wiki啊,要人怎么更新阿?!哈哈!大哥小弟,附件不能删除了,还叫什么wiki啊,要人怎么更新阿?! 哈哈!大哥小弟,附件不能删除了,还叫什么wiki啊,要人怎么更新阿?!哈哈!大哥小弟,附件不能删除了,还叫什么wiki啊,要人怎么更新阿?! 哈哈!大哥小弟,附件不能删除了,还叫什么wiki啊,要人怎么更新阿?!哈哈!大哥小弟,附件不能删除了,还叫什么wiki啊,要人怎么更新阿?! 哈哈!大哥小弟,附件不能删除了,还叫什么wiki啊,要人怎么更新阿?!哈哈!大哥小弟,附件不能删除了,还叫什么wiki啊,要人怎么更新阿?! 哈哈!大哥小弟,附件不能删除了,还叫什么wiki啊,要人怎么更新阿?!哈哈!大哥小弟,附件不能删除了,还叫什么wiki啊,要人怎么更新阿?! 哈哈!大哥小弟,附件不能删除了,还叫什么wiki啊,要人怎么更新阿?!哈哈!大哥小弟,附件不能删除了,还叫什么wiki啊,要人怎么更新阿?! 哈哈!大哥小弟,附件不能删除了,还叫什么wiki啊,要人怎么更新阿?!哈哈!

大哥小弟,附件不能删除了,还叫什么wiki啊,要人怎么更新阿?! 哈哈!大哥小弟,附件不能删除了,还叫什么wiki啊,要人怎么更新阿?!哈哈!大哥小弟,附件不能删除了,还叫什么wiki啊,要人怎么更新阿?! 哈哈!大哥小弟,附件不能删除了,还叫什么wiki啊,要人怎么更新阿?!哈哈!大哥小弟,附件不能删除了,还叫什么wiki啊,要人怎么更新阿?! 哈哈!大哥小弟,附件不能删除了,还叫什么wiki啊,要人怎么更新阿?!哈哈!大哥小弟,附件不能删除了,还叫什么wiki啊,要人怎么更新阿?! 哈哈!大哥小弟,附件不能删除了,还叫什么wiki啊,要人怎么更新阿?!哈哈!大哥小弟,附件不能删除了,还叫什么wiki啊,要人怎么更新阿?! 哈哈!大哥小弟,附件不能删除了,还叫什么wiki啊,要人怎么更新阿?!哈哈!大哥小弟,附件不能删除了,还叫什么wiki啊,要人怎么更新阿?! 哈哈!大哥小弟,附件不能删除了,还叫什么wiki啊,要人怎么更新阿?!哈哈!大哥小弟,附件不能删除了,还叫什么wiki啊,要人怎么更新阿?! 哈哈!大哥小弟,附件不能删除了,还叫什么wiki啊,要人怎么更新阿?!哈哈!大哥小弟,附件不能删除了,还叫什么wiki啊,要人怎么更新阿?! 哈哈!大哥小弟,附件不能删除了,还叫什么wiki啊,要人怎么更新阿?!哈哈!大哥小弟,附件不能删除了,还叫什么wiki啊,要人怎么更新阿?! 哈哈!大哥小弟,附件不能删除了,还叫什么wiki啊,要人怎么更新阿?!哈哈!大哥小弟,附件不能删除了,还叫什么wiki啊,要人怎么更新阿?! 哈哈!大哥小弟,附件不能删除了,还叫什么wiki啊,要人怎么更新阿?!哈哈!大哥小弟,附件不能删除了,还叫什么wiki啊,要人怎么更新阿?! 哈哈!大哥小弟,附件不能删除了,还叫什么wiki啊,要人怎么更新阿?!哈哈!大哥小弟,附件不能删除了,还叫什么wiki啊,要人怎么更新阿?! 哈哈!大哥小弟,附件不能删除了,还叫什么wiki啊,要人怎么更新阿?!哈哈!大哥小弟,附件不能删除了,还叫什么wiki啊,要人怎么更新阿?! 哈哈!大哥小弟,附件不能删除了,还叫什么wiki啊,要人怎么更新阿?!哈哈!

PyOptimize (last edited 2009-12-25 07:10:04 by localhost)