|
Size: 546
Comment:
|
Size: 546
Comment:
|
| Deletions are marked like this. | Additions are marked like this. |
| Line 5: | Line 5: |
| 它只有一个可用的虚函数'__call__'(),可以接收一个字符串参数。主要是用它来判断一个字是否有用。也就是说,像a an the 这类词都是没有意义的,不应该把这类的词也做为关键词进行索引。 | 它只有一个可用的虚函数"__call__"(),可以接收一个字符串参数。主要是用它来判断一个字是否有用。也就是说,像a an the 这类词都是没有意义的,不应该把这类的词也做为关键词进行索引。 |
Stoper类
这也是一个非常简单的类。
它只有一个可用的虚函数"call"(),可以接收一个字符串参数。主要是用它来判断一个字是否有用。也就是说,像a an the 这类词都是没有意义的,不应该把这类的词也做为关键词进行索引。
SimpleStopper类,从Stoper类继承而来。
可以用add方法添加需要过滤的词。
通常在我们的程序中,一般是由我们自己来定义一个XXStopper类来处理需要过滤的关键词。
[:torry:头太晕]
