【发布时间】:2020-09-18 07:45:48
【问题描述】:
我在 Saxon xslt 处理器的 utf-8 文本输出中得到了奇怪的字符。
输入 xml 的标题是
<?xml version="1.0" encoding="windows-1252"?>
它包含类似的字符串(在 notepad++ 中显示,Windows-1252 编码显示在右下方)
“abc”
转换样式表包含
<xsl:output method="text" encoding="utf-8" />
但输出包含(在 notepad++ 中显示,右下方显示 UTF-8 编码)
�abc�
而不是 UTF-8 编码
“abc”
知道我错过了什么吗?
p.s.:当我使用 notepad++ 将 xml 输入从 windows-1252 更改为 UTF-8 时,输出被正确编码,这就是我的解决方法。不过,我想了解我是否遗漏了什么,或者某些软件应该在字符集方面进行改进。
【问题讨论】:
-
那么你如何准确地使用 Saxon,你是否使用它的命令行工具,例如
-o:result.txt创建文本文件?还是您编写 Java 或 C# 代码?您可能需要提供这方面的详细信息,以便任何人都知道哪里出了问题。
标签: xml xslt utf-8 saxon windows-1252