【问题标题】:RDF reading/parsing errorsRDF 读取/解析错误
【发布时间】:2011-11-14 11:03:35
【问题描述】:

我有一些 RDF 文件想要导入到tripplestore(AllegroGraph) 中,但在第一个文件中我得到一个 SAX 解析器错误,指出存在无法识别的字符。删除有问题的行后,一切都很好。 然后我尝试在带有错误行的 RDF 上使用 W3C RDF 验证器和 Jena,但我得到的只是一些关于未定义语言的警告(绝对没有关于错误行的内容)。 您能否建议一种方法(如果可能,使用 java)来查找 RDF 文件中的错误?

编辑:有问题的行是:

<gn:alternateName xml:lang="got">&#66352;&#66374;&#66354;&#66352;&#66365;&#66361;&#66371;&#66372;&#66352;&#66365;</gn:alternateName>

【问题讨论】:

  • 你能更具体地了解一下输出吗?确切的错误消息是什么,以及:产生错误的行是什么样的?

标签: rdf jena allegrograph


【解决方案1】:

您可以使用 Sesame 的 Rio parser 进行验证。 this blogpost 中有关于如何使用 Rio 的一般说明。特别是对于验证,诀窍是创建并附加一个ParseErrorListener,它从解析器接收详细的警告和错误。

但是,由于您提到您遇到的问题是在 SAX / XML 级别,您也可以只使用通用 XML 验证器来查看问题所在。最可能的原因(但如果没有更多细节就很难判断)是您在某处有一个错误编码的字符。

【讨论】:

    猜你喜欢
    • 2016-06-04
    • 2013-06-04
    • 1970-01-01
    • 2022-11-11
    • 1970-01-01
    • 1970-01-01
    • 2021-03-04
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多