3.6. 中文处理

3.6.1. 编码

如果你看过我写的文章 《saxon实践(二)》,从上面可以看到我使用了gb2312编码。但是,Saxon本身不支持gb2312,因此必须要修改Saxon的源码才可以。使用这种方法需要一些Java的经验。

我现在的处理方法是:使用utf-8编码Saxon直接支持utf-8编码,因此这种方法不用修改源码,而且经过我测试没有问题。也许存在的唯一问题是,你需要一个可以打开和另存为utf-8编码的编辑器。我使用的是 EditPlus。 这样我们在写完文档时注意保存成utf-8编码就可以了。以后输出的HTML文档也将会是utf-8编码的。

3.6.2. 调整相关xslt参数

需要调整下面参数:

<xsl:param name="saxon.character.representation" select="'native'"/>
<xsl:param name="l10n.gentext.language" select="'zh_cn'"/>

加入这样的参数到驱动样式表中后就可以很好的处理中文了。

在前面你看到了我用的样式表说明,已经加入了这些参数。