【发布时间】:2021-06-07 20:24:43
【问题描述】:
我正在尝试将 HTML 表格从内部网页读入 R。
不幸的是,<td> 的结构很奇怪,所以我不能使用 rvest 包中的 html_table() 为我执行此操作。
html表的结构如下:
<table>
<tr>
<td>
<input disabled name="Attribute A" value="15.00">
</td>
</tr>
</table>
然后每行重复多个<td>。我想提取每个条目的值,我只是有点不确定如何。
我一直在考虑编写一个解析器,将每个<td> 的内容扔到相应的列中,然后使用正则表达式匹配name="Attribute A" 并返回值。但是,这似乎很复杂,我希望有一个更有效的选择:)
【问题讨论】: