Size: 5391
Comment:
|
Size: 6331
Comment:
|
Deletions are marked like this. | Additions are marked like this. |
Line 50: | Line 50: |
1. `例8.14上`:''Well, it does seem like overkill to set up a dictionary of keys and values simply to do string formatting in the next line;''[[BR]] 好,'''在下面一行中''',仅为了进行字符串格式化就需要创建一个有键字和值的 dictionary 看上去的确有些小题大作。[[BR]] (./) '''的确''',仅为了进行字符串格式化,就'''事先'''创建一个有键字和值的 dictionary 看上去的确有些小题大作。[[BR]] (!) 看看原文就不难知道孰正孰误。“下一行”这个意思没有保留。原文的''next line''也只是笼统的概念,不一定创建了这样一个 dictionary 后就非得在下一行进行字符串格式化。 1. `例8.15, (1), b`:在这个列表'''理解''' <!> 的第一轮循环中,…… (./) '''解析''' 1. `例8.15, (1), c`:这个字符串就作为这个列表'''理解''' <!> 返回值的第一个元素。 (./) '''解析''' |
7-23<X8>dialect.xml HTML 处理
概览
Para 1:How do I parse/translate/munge the text of my HTML document but leave the tags alone?BR 怎么才能 [分析|解释|munge] 我的 HTML 文档的文本,但是不要标记呢?BR
“leave alone”的意思是“不惊动,不涉及”,而非“不要”。BR
怎么才能 [分析|解释|munge] 我的 HTML 文档的文本,但是又要保留标记呢?
sgmllib.py 介绍
Para 5:开始标记(Start tag)是一个
开始一个块的 HTML 标记,像……
警示, Line -1:在这
错误在 python 2.1 中改正了。
这个
从 HTML 文档中提取数据
Para 2:If you have some HTML lying around on your hard drive, you can use file functions to read it,... 如果在您的硬盘里存放着 HTML 文件,您可以使用 file 函数 将它读出来,……BR
就链接的指向来看,file functions 指的是
处理文件的函数
例8.6, (1), Line -1:……当某人重用一个分析器实例时,会
正确地重新初始化
可以
例8.6, (3):我们可以通过一个简单的 多变量 list 映射来查找是否这个 <a> 标记拥有一个 href 属性。BR
我们可以通过一个简单的 多变量 list 映射来查找这个 <a> 标记是否拥有一个 href 属性。
例8.7, (1), 脚注:……也许因为这就选择了 feed 这个名字。
汉语博大精深的词汇怎么不好好利用啊
因此
整节 Line -1:{i} 如果 当您读到此处发现输出结果不一样,那是因为下载了本书的更新版本。
BaseHTMLProcessor.py 介绍
Para 1:您可以通过将 SGMLParser 子类化来定义一个类,……BR
您可以定义 SGMLParser 的子类,……
Para 2:SGMLParser 子类化 BaseHTMLProcessor
BaseHTMLProcessor 子类化 SGMLParser
locals 和 globals
……一会
儿我们就会看到
例8.10上, Para 1, Line 1:您是否为此而感到困惑?不要绝望!
汗……哪这么容易绝望BR
您是否为此而感到困惑?不要灰心!
例8.10下, Para 1:不仅仅是模块的名字空间包含了模块级的变量和常量,它还包括了所有在模块中定义的函数和类。再加上,它包括了任何被导入到模块中的东西。BR
模块的名字空间不仅仅包含了模块级的变量和常量,还包括了所有在模块中定义的函数和类。除此以外,它还包括了任何被导入到模块中的东西。
下一段:这就是为什么您可以直接访问它们却不需要引用它们所来源的模块的原因
。BR
原句明显病句(句式杂糅)。
例8.11, 样例输出:原文最后的“rest of output omitted for brevity”翻译为“略”是正确的。但是这段输出是放在<programlisting>里面的,在语法着色的时候会把中文分解成XML标记,显示出来也是XML标记而不是中文。改回“rest of output omitted for brevity”。
例8.11, 样例输出, (1):SGMLParser 使用了 from module import 从 sgmllib 中被导入。BR
中文的表达采用主动式更自然。BR
我们使用了 from module import 把 SGMLParser 从 sgmllib 中导入。
例8.11, 样例输出, (2):对比这个和 htmlentitydefs,它是用 import 被导入的。也就是说 htmlentitydefs 模块本身也在名字空间中,但是 entitydefs 变量定义在 htmlentitydefs 之外。BR
上下文无法全部列出,还请参看原文。BR
把上面的例子和 htmlentitydefs 对比一下,它是用 import 被导入的。也就是说 htmlentitydefs 模块本身被导入了名字空间,但是定义在 htmlentitydefs 之中的 entitydefs 变量却没有。
例8.11, 样例输出, (4):当运行一个模块时 (对
从另外一个模块中导入而言)
相对于
例8.12上, Line -1:It will bite you anyway, but at least then you'll remember learning it.BR 它无论如何都会困扰您的,但至少您还记得了解过它。BR
它无论如何都会困扰您的,但至少您还会记得曾经学习过它。
例8.12, (1):locals 是一个返回 dictionary 的函数,并且
您在 dictionary 中设置
了一个值。
基于 dictionary 的字符串格式化
例8.13, (1):这个名字是 params dictionary 中的一个键字,并且将 %(pwd)s 标记所在的地方替换成相应的值 secret。BR
所以 %(pwd)s 标记所在的地方被替换成相应的值 secret。
例8.13, (3):You can even specify the same key twice; each occurrence will be replaced with the same value.BR 您甚至可以两次指定同一键字,每个键字发生之处将被同一个值所替换。BR
您甚至可以两次指定同一键字,每个键字出现之处将被同一个值所替换。
例8.14上:Well, it does seem like overkill to set up a dictionary of keys and values simply to do string formatting in the next line;BR 好,在下面一行中,仅为了进行字符串格式化就需要创建一个有键字和值的 dictionary 看上去的确有些小题大作。BR
的确,仅为了进行字符串格式化,就事先创建一个有键字和值的 dictionary 看上去的确有些小题大作。BR
看看原文就不难知道孰正孰误。“下一行”这个意思没有保留。原文的next line也只是笼统的概念,不一定创建了这样一个 dictionary 后就非得在下一行进行字符串格式化。
例8.15, (1), b:在这个列表理解
的第一轮循环中,……
解析
例8.15, (1), c:这个字符串就作为这个列表理解
返回值的第一个元素。
解析