【问题标题】:Reading XML using R - Error使用 R 读取 XML - 错误
【发布时间】:2014-09-03 14:50:18
【问题描述】:

我正在尝试使用 R(版本:3.1.0)从这个 url 中抓取 xml:data.gov.in/sites/default/files/Potato_2013.xml

试过

库(XML)

url

doc

但我收到一个错误提示

错误:XML 内容似乎不是 xml:

有什么办法解决这个问题??

只是打字

文档

给出一个文档是空的错误。

我希望提取节点状态、商品、到达日期等的值。

谢谢!

【问题讨论】:

    标签: xml r xml-parsing


    【解决方案1】:

    这取自this SO问题:

    library(XML)
    library(RCurl)
    ##
    url<- "data.gov.in/sites/default/files/Potato_2013.xml"
    Data <- getURL(url)
    doc <- xmlParse(Data)
    

    【讨论】:

    • @Spacedman 是好电话;这是一个非常大的文件,需要一段时间才能操作。
    • 我认为xmlParse(url) 会工作,如果 OP 只是在 URL 上粘贴“http://”,但我现在网速很慢......
    • 另外,这是最糟糕的一种 XML。它没有换行符。它看起来像一个 SOAP 响应。它看起来像常规的表格数据,作为 CSV 文件大约有 1Mb。通过在 标记上分成几行,它的可读性几乎是微不足道的。
    • @Spacedman 您应该将其发布为答案。这个文件太大了——我在doc 上运行了xmlToList(),但是大约20 分钟后我刚刚终止了该命令,因为它需要很长时间。
    • 非常感谢!作品。是的,getURL 确实需要一段时间才能完成
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2015-10-19
    • 1970-01-01
    相关资源
    最近更新 更多