【问题标题】:How to resolve ? com.sun.org.apache.xerces.internal.impl.io.MalformedByteSequenceException: Invalid byte 3 of 3-byte UTF-8 sequence如何解决? com.sun.org.apache.xerces.internal.impl.io.MalformedByteSequenceException:3 字节 UTF-8 序列的字节 3 无效
【发布时间】:2015-11-02 06:37:51
【问题描述】:

我在我的代码中使用了 DocumentBuilder 类的 parse() 方法。

  • 文档 doc = dBuilder.parse(bis);

在上面一行它抛出异常:

com.sun.org.apache.xerces.internal.impl.io.MalformedByteSequenceException: Invalid byte 3 of 3-byte UTF-8 sequence.
       at com.sun.org.apache.xerces.internal.impl.io.UTF8Reader.invalidByte(Unknown Source)
       at com.sun.org.apache.xerces.internal.impl.io.UTF8Reader.read(Unknown Source)
       at com.sun.org.apache.xerces.internal.impl.XMLEntityScanner.load(Unknown Source)
       at com.sun.org.apache.xerces.internal.impl.XMLEntityScanner.skipChar(Unknown Source)
       at com.sun.org.apache.xerces.internal.impl.XMLDocumentFragmentScannerImpl$FragmentContentDriver.next(Unknown Source)
       at com.sun.org.apache.xerces.internal.impl.XMLDocumentScannerImpl.next(Unknown Source)
       at com.sun.org.apache.xerces.internal.impl.XMLDocumentFragmentScannerImpl.scanDocument(Unknown Source)
       at com.sun.org.apache.xerces.internal.parsers.XML11Configuration.parse(Unknown Source)
       at com.sun.org.apache.xerces.internal.parsers.XML11Configuration.parse(Unknown Source)
       at com.sun.org.apache.xerces.internal.parsers.XMLParser.parse(Unknown Source)
       at com.sun.org.apache.xerces.internal.parsers.DOMParser.parse(Unknown Source)
       at com.sun.org.apache.xerces.internal.jaxp.DocumentBuilderImpl.parse(Unknown Source)
       at javax.xml.parsers.DocumentBuilder.parse(Unknown Source)
       at org.econ.alm.client.AbstractALMClient.getEntitiesBMD(AbstractALMClient.java:226)
       at org.econ.alm.extracter.MDBTestExtractor.run(MDBTestExtractor.java:204)
       at java.util.TimerThread.mainLoop(Unknown Source)
       at java.util.TimerThread.run(Unknown Source)

如果有人知道根本原因和解决方案,请提出建议。

提前致谢。

【问题讨论】:

  • 您没有解释bis 是什么,或者它包含什么。我猜是ByteInputStream,对吗?显然bis 的 XML 内容不是 UTF-8 编码的,或者是格式错误的 UTF-8。否则,您将不会首先收到错误。因此,请仔细检查源数据的编码。
  • bis 是一个ByteArrayInputStream。这个问题是通过在Windows->Perspective下的eclipse中设置参数解决的。感谢您的回复。

标签: java xml exception utf-8 malformed


【解决方案1】:

对我来说,更改解析函数:从文件 XML 到 InputSource(将字符集更改为 UTF)

 InputStream inputStream= new FileInputStream(file); 
 Reader reader = new InputStreamReader(inputStream,"UTF-8");        
 InputSource is = new InputSource(reader); 
 is.setEncoding("UTF-8");
 doc = dBuilder.parse(is);

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2012-10-16
    • 1970-01-01
    • 1970-01-01
    • 2012-07-04
    • 1970-01-01
    • 1970-01-01
    • 2012-03-29
    • 2011-01-26
    相关资源
    最近更新 更多