如果你看过我写的文章 《saxon实践(二)》,从上面可以看到我使用了gb2312编码。但是,Saxon本身不支持gb2312,因此必须要修改Saxon的源码才可以。使用这种方法需要一些Java的经验。
我现在的处理方法是:使用utf-8编码。Saxon直接支持utf-8编码,因此这种方法不用修改源码,而且经过我测试没有问题。也许存在的唯一问题是,你需要一个可以打开和另存为utf-8编码的编辑器。我使用的是 EditPlus。 这样我们在写完文档时注意保存成utf-8编码就可以了。以后输出的HTML文档也将会是utf-8编码的。