文章来自《Python cookbook》. 翻译仅仅是为了个人学习,其它商业版权纠纷与此无关!
-- 61.182.251.99 [DateTime(2004-09-21T05:42:12Z)] TableOfContents
描述
Retrieving a Line at Random from a File of Unknown Size
读取未知大小文件的随机一行
问题 Problem
有文件,不清楚大小(但是可能非常大),需要忽略文件本身,只读取数据的随机一行。
解决 Solution
We do need to read the whole file, but we don't have to read it all at once: 需要读取文件的全部数据,但不是一次全部读出:
import random def randomLine(file_object): "顺序读取文件内容,取文件的随机的一行" lineNum = 0 selected_line = '' while 1: aLine = file_object.readline( ) if not aLine: break lineNum = lineNum + 1 # 本行有多大可能性是文件最后一行? if random.uniform(0,lineNum)<1: selected_line = aLine file_object.close( ) return selected_line
#译注: 算法的解释见讨论
讨论 Discussion
当然,更明了的方法是这样的:
random.choice(file_object.readlines( ))
但是,这需要将全部文件内容读入内存,对确实很大的文件可能有问题。
...