【问题标题】:Encoding issues with vtd-xmlvtd-xml 的编码问题
【发布时间】:2020-02-06 08:47:47
【问题描述】:

我在使用 vtd-xml 库(2.11 版)时遇到编码问题。

@Test
    public void test() throws Exception {
        final String originalXML = "<?xml version=\"1.0\"?>\r\n" + "<test>\r\n" + "öäüß\r\n" + "</test>\r\n" + "";
        final VTDGen vg;
        final XMLModifier xm;
        final AutoPilot ap;
        final VTDNav vn;

        vg = new VTDGen();
        // vg.setDoc(originalXML.getBytes()); --> results in
        // com.ximpleware.ParseException: UTF 8 encoding error: should never happen
        vg.setDoc(originalXML.getBytes("UTF-8"));
        vg.parse(false);

        ap = new AutoPilot();
        xm = new XMLModifier();

        vn = vg.getNav();
        ap.bind(vn);
        xm.bind(vn);

        final XMLByteOutputStream xms = new XMLByteOutputStream(xm.getUpdatedDocumentSize());
        xm.output(xms);
        xms.close();
        assertEquals(originalXML, xms.toString());
    }

这个断言语句失败了

java.lang.AssertionError: expected:<<?xml version="1.0"?>

<test>
öäüß
</test>
> but was:<<?xml version="1.0"?>
<test>
ᅢ쌔내태゚
</test>

知道如何解决这个问题吗?

谢谢,保罗

【问题讨论】:

  • 您正在将字符串与封闭的 XMLByteOutputStream 进行比较?变量名也可能更有说服力。
  • @güriösä :谢谢,应该与 toString() 一起映射。我编辑了这个。但关键是我的原始 XML 被修改而没有执行任何修改

标签: java vtd-xml


【解决方案1】:

我建议使用 ByteArrayOutputStream 而不是 XMLByteOutputStream。在这种情况下,您可以在从输出流构建字符串时提供字符集名称:

try (ByteArrayOutputStream os = new ByteArrayOutputStream()) {
    xm.output(os);
    assertEquals(originalXML, os.toString("UTF-8"));
}

在这种情况下,应该保留特殊字符。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2012-01-12
    • 1970-01-01
    • 1970-01-01
    • 2015-06-11
    • 2013-02-02
    相关资源
    最近更新 更多