【问题标题】:How to get an attribute in HTML/XML?如何获取 HTML/XML 中的属性?
【发布时间】:2012-09-02 08:26:14
【问题描述】:

这是一段要解析的html:

<td style="text-align:center; color:black; background:#ff6666; border:2px solid #8811ff;"   title="Alkali metals; Primordial; Solid">
37  
<br />  
<a title="Rubidium" href="/wiki/Rubidium">Rb</a>  
</td>`  

我可以使用xmlValue 获取值。 我得到的是:

text   br    a   
"19"   ""  "K"   

但是我想得到属性的值,在tdtitle的属性,值是"Alkali metal; Primordial; Solid" in a,属性title,值为“铷”

我怎样才能得到它?

【问题讨论】:

  • 顺便说一句:也许this SO 问题对你有帮助。

标签: xml r web-scraping


【解决方案1】:

您可以使用xmlAttrsxmlGetAttr(详情请参阅?xmlAttrs)。

html <- '<td style="text-align:center; color:black; background:#ff6666; border:2px solid #8811ff;" title="Alkali metals; Primordial; Solid">37<br /><a title="Rubidium" href="/wiki/Rubidium">Rb</a></td>'
td <- xmlRoot(xmlParse(html))
xmlAttrs(td)["title"]
# "Alkali metals; Primordial; Solid"
xmlAttrs(xmlChildren(td)$a)["title"]
# "Rubidium

# or
xmlGetAttr(td, "title")
# "Alkali metals; Primordial; Solid"

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2012-09-12
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2012-01-13
    • 2013-11-21
    • 1970-01-01
    相关资源
    最近更新 更多