7-23<X8>dialect.xml HTML 处理

TableOfContents

概览

  1. Para 1How do I parse/translate/munge the text of my HTML document but leave the tags alone?BR 怎么才能 [分析|解释|munge] 我的 HTML 文档的文本,但是不要标记呢BR (!) 汗……“leave alone”的意思是“不惊动、不涉及”BR (./) 怎么才能 [分析|解释|munge] 我的 HTML 文档的文本,但是又要保留标记呢

sgmllib.py 介绍

  1. Para 5:开始标记(Start tag)是一个 {X} 开始一个块的 HTML 标记,像……

  2. 警示, Line -1在这 <!> 错误在 python 2.1 中改正了。 (./) 这个

从 HTML 文档中提取数据

  1. Para 2If you have some HTML lying around on your hard drive, you can use file functions to read it,... 如果在您的硬盘里存放着 HTML 文件,您可以使用 file 函数 将它读出来,……BR (!) 就链接的指向来看,file functions 指的是 (./) 处理文件的函数