|
Size: 546
Comment:
|
← Revision 4 as of 2009-12-25 07:15:30 ⇥
Size: 547
Comment: converted to 1.6 markup
|
| Deletions are marked like this. | Additions are marked like this. |
| Line 5: | Line 5: |
| 它只有一个可用的虚函数'__call__'(),可以接收一个字符串参数。主要是用它来判断一个字是否有用。也就是说,像a an the 这类词都是没有意义的,不应该把这类的词也做为关键词进行索引。 | 它只有一个可用的虚函数"__call__"(),可以接收一个字符串参数。主要是用它来判断一个字是否有用。也就是说,像a an the 这类词都是没有意义的,不应该把这类的词也做为关键词进行索引。 |
| Line 13: | Line 13: |
| [:torry:头太晕] | [[torry|头太晕]] |
Stoper类
这也是一个非常简单的类。
它只有一个可用的虚函数"call"(),可以接收一个字符串参数。主要是用它来判断一个字是否有用。也就是说,像a an the 这类词都是没有意义的,不应该把这类的词也做为关键词进行索引。
SimpleStopper类,从Stoper类继承而来。
可以用add方法添加需要过滤的词。
通常在我们的程序中,一般是由我们自己来定义一个XXStopper类来处理需要过滤的关键词。
