【问题标题】:SAXException when parsing the character "°"解析字符“°”时出现 SAXException
【发布时间】:2011-12-08 21:28:01
【问题描述】:

我在使用基于SAXParser 的RSS 提要解析器时遇到了一些问题。 我扩展了DefaultHandler 课程,直到今天一切正常;我现在遇到了麻烦,因为提要文件包含这一行:

<description>°</description>

所以我得到一个这样描述的异常:

org.apache.harmony.xml.ExpatParser$ParseException: At line 102, column 13: not well-formed (invalid token) 

我该如何解决这种情况?我应该怎么做才能避免这个异常?

【问题讨论】:

    标签: java xml-parsing saxparser


    【解决方案1】:

    文章here 建议您需要在输入源上正确设置编码。文章中的 sn-p 给出了以下解决方案,对您的数据使用适当的编码(此处给出了两个示例):

    InputSource inputSource = new InputSource(is);
    //inputSource.setEncoding("iso-8859-1");
    inputSource.setEncoding("utf-8");
    

    【讨论】:

    • xml 的第一行应该包含一个标题和一个可选的编码。这应该与您在上面设置的内容相匹配。如果没有,则解析器将默认为系统编码。如果您可以在浏览器中打开 xml 提要,您将能够看到编码。 windows默认编码是windows-1521,你也可以试试。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2022-01-01
    • 2022-11-05
    • 2017-05-21
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多