【发布时间】:2018-04-10 03:26:35
【问题描述】:
我需要抓取一个与空格对齐的数据表。这不是一个 HTML 表格,但我很难让它正确。表格如下:
2017-10-28 @Westmont 100 Cal Lutheran 76
2017-10-30 @Arizona Chr 94 E New Mexico 87
2017-10-31 @Walsh 91 Mt Union 80
2017-10-31 @Card Stritch 71 Maranatha Bap 42
2017-11-01 @WV Tech 82 Glenville St 80
...
2018-03-31 Villanova 95 Kansas 79 P NCAA Tournament San Antonio, TX
2018-03-31 Michigan 69 Loyola-Chicago 57 P NCAA Tournament San Antonio, TX
2018-04-02 Villanova 79 Michigan 62 P NCAA I Championship San Antonio, TX
因为是纯文本,所以我将它粘贴到一个文本文档中并使用read.table,但我几乎丢失了一半的行,我不知道为什么。我想出了如何从输入的行中提取我想要的数据,所以我正在寻找两种解决方案中的任何一种:
- 一种简单的方法来抓取如下所示的表 (link to actual data),并将其放入数据帧(或 csv)中。
- 一种获取所有数据行的方法/我丢失大量数据的原因(我得到了 16445 行中的 8861 行)
【问题讨论】: