【问题标题】:How to check if URL contains XML file or not?如何检查 URL 是否包含 XML 文件?
【发布时间】:2022-01-23 14:27:50
【问题描述】:

我有一个关于从 URL 获取 XML 文件,抓取它们,提取数据,然后处理它的项目。另外,我正在使用用户输入创建 URL。但我需要检查 URL 是否包含要抓取的 XML 文件。任何想法如何做到这一点?那么基本上如何检查URL是否包含XML文件?

【问题讨论】:

  • 为什么不直接下载给定 URL 中的文件(任何文件)。通过 XML 解析器运行它,如果解析器成功,则它是一个格式良好的 XML 文件。然后随心所欲地刮。在实际查看文件之前,无法确保文件中是否包含 XML 内容
  • 如果我可以在文件恢复这么多时间让代码工作之前检查文件。另外,我不需要读写那个特定的 URL,也不需要在上面浪费时间。 @office.aizaz
  • URL 就像一个地址。只有敲开那扇门,才能知道谁住在那个地址。除非 URL 带有一些标签来表明它托管的文件类型,否则我认为没有办法提前知道这一点。文件扩展名可以是一种方式,但它们也不能真正代表文件内容。
  • 我认为你是对的。谢谢你的回答。@office.aizaz

标签: java xml http url bufferedreader


【解决方案1】:

了解获取 URL 是否会检索 XML 的方法...

检索文件之前

  • 有带外保证。
  • 检查对 HEAD 请求的响应的 Content-Type HTTP 标头1

检索文件后

注意:只有通过符合标准的 XML 解析器进行解析才能保证提供 100% 的确定。


1XML 数据的 MIME 分配

  • application/xml(RFC 7303,以前的 RFC 3023)
  • text/xml(RFC 7303,以前的 RFC 3023)
  • Other MIME assignments 用于 XML 应用程序。

【讨论】:

    猜你喜欢
    • 2016-03-05
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2022-11-30
    • 1970-01-01
    • 2018-02-05
    • 2014-10-23
    • 1970-01-01
    相关资源
    最近更新 更多