Size: 1816
Comment:
|
Size: 3889
Comment:
|
Deletions are marked like this. | Additions are marked like this. |
Line 6: | Line 6: |
(!) 汗……“leave alone”的意思是“不惊动、不涉及”[[BR]] | (!) “leave alone”的意思是“不惊动,不涉及”,而非“不要”。[[BR]] |
Line 21: | Line 21: |
1. `Para 1`:您可以'''通过将 SGMLParser 子类化来定义一个类''',……[[BR]] (./) 您可以'''定义 SGMLParser 的子类''',…… 1. `Para 2`:'''SGMLParser''' 子类化 '''BaseHTMLProcessor''' (./) '''BaseHTMLProcessor''' 子类化 '''SGMLParser''' == locals 和 globals == 1. ……一会 {i} ^儿^我们就会看到 1. `例8.10上, Para 1, Line 1`:您是否为此而感到困惑?不要'''绝望'''! (!) 汗……哪这么容易绝望[[BR]] (./) 您是否为此而感到困惑?不要'''灰心'''! 1. `例8.10下, Para 1`:'''不仅仅是'''模块的名字空间包含了模块级的变量和常量,'''它还'''包括了所有在模块中定义的函数和类。'''再加上''',它包括了任何被导入到模块中的东西。[[BR]] (./) 模块的名字空间'''不仅仅'''包含了模块级的变量和常量,'''还'''包括了所有在模块中定义的函数和类。'''除此以外''',它'''还'''包括了任何被导入到模块中的东西。 1. `下一段`:这就是为什么您可以直接访问它们却不需要引用它们所来源的模块'''的原因''' {X} 。[[BR]] (!) 原句明显病句(句式杂糅)。 1. `例8.11, 样例输出`:原文最后的“rest of output omitted for brevity”翻译为“略”是正确的。但是这段输出是放在<programlisting>里面的,在语法着色的时候会把中文分解成XML标记,显示出来也是XML标记而不是中文。改回“rest of output omitted for brevity”。 1. `例8.11, 样例输出, (1)`:'''SGMLParser 使用了 from module import 从 sgmllib 中被导入。'''[[BR]] (!) 中文的表达采用主动式更自然。[[BR]] (./) '''我们使用了''' from module import '''把''' SGMLParser 从 sgmllib 中导入。 1. `例8.11, 样例输出, (2)`:对比'''这个'''和 htmlentitydefs,它是用 import 被导入的。[[BR]] (!) 上下文无法全部列出,还请参看原文[[BR]] (./) '''把上面的例子和''' htmlentitydefs 对比一下,它是用 import 被导入的。 |
7-23<X8>dialect.xml HTML 处理
概览
Para 1:How do I parse/translate/munge the text of my HTML document but leave the tags alone?BR 怎么才能 [分析|解释|munge] 我的 HTML 文档的文本,但是不要标记呢?BR
“leave alone”的意思是“不惊动,不涉及”,而非“不要”。BR
怎么才能 [分析|解释|munge] 我的 HTML 文档的文本,但是又要保留标记呢?
sgmllib.py 介绍
Para 5:开始标记(Start tag)是一个
开始一个块的 HTML 标记,像……
警示, Line -1:在这
错误在 python 2.1 中改正了。
这个
从 HTML 文档中提取数据
Para 2:If you have some HTML lying around on your hard drive, you can use file functions to read it,... 如果在您的硬盘里存放着 HTML 文件,您可以使用 file 函数 将它读出来,……BR
就链接的指向来看,file functions 指的是
处理文件的函数
例8.6, (1), Line -1:……当某人重用一个分析器实例时,会
正确地重新初始化
可以
例8.6, (3):我们可以通过一个简单的 多变量 list 映射来查找是否这个 <a> 标记拥有一个 href 属性。BR
我们可以通过一个简单的 多变量 list 映射来查找这个 <a> 标记是否拥有一个 href 属性。
例8.7, (1), 脚注:……也许因为这就选择了 feed 这个名字。
汉语博大精深的词汇怎么不好好利用啊
因此
整节 Line -1:{i} 如果 当您读到此处发现输出结果不一样,那是因为下载了本书的更新版本。
BaseHTMLProcessor.py 介绍
Para 1:您可以通过将 SGMLParser 子类化来定义一个类,……BR
您可以定义 SGMLParser 的子类,……
Para 2:SGMLParser 子类化 BaseHTMLProcessor
BaseHTMLProcessor 子类化 SGMLParser
locals 和 globals
……一会
儿我们就会看到
例8.10上, Para 1, Line 1:您是否为此而感到困惑?不要绝望!
汗……哪这么容易绝望BR
您是否为此而感到困惑?不要灰心!
例8.10下, Para 1:不仅仅是模块的名字空间包含了模块级的变量和常量,它还包括了所有在模块中定义的函数和类。再加上,它包括了任何被导入到模块中的东西。BR
模块的名字空间不仅仅包含了模块级的变量和常量,还包括了所有在模块中定义的函数和类。除此以外,它还包括了任何被导入到模块中的东西。
下一段:这就是为什么您可以直接访问它们却不需要引用它们所来源的模块的原因
。BR
原句明显病句(句式杂糅)。
例8.11, 样例输出:原文最后的“rest of output omitted for brevity”翻译为“略”是正确的。但是这段输出是放在<programlisting>里面的,在语法着色的时候会把中文分解成XML标记,显示出来也是XML标记而不是中文。改回“rest of output omitted for brevity”。
例8.11, 样例输出, (1):SGMLParser 使用了 from module import 从 sgmllib 中被导入。BR
中文的表达采用主动式更自然。BR
我们使用了 from module import 把 SGMLParser 从 sgmllib 中导入。
例8.11, 样例输出, (2):对比这个和 htmlentitydefs,它是用 import 被导入的。BR
上下文无法全部列出,还请参看原文BR
把上面的例子和 htmlentitydefs 对比一下,它是用 import 被导入的。