【发布时间】:2018-10-23 06:22:23
【问题描述】:
我正在尝试解析制表符分隔的数据,该数据已保存为包含无关数据的文本文件。我希望这是一个 R data.table/data.frame。
制表符分隔格式如下:
A 1092 - 1093 + 1X
B 1093 HRDCPMRFYT
A 1093 + 1094 - 1X
B 1094 BSZSDFJRVF
A 1094 + 1095 + 1X
B 1095 SSTFCLEPVV
...
只有两种类型的行,A 和 B。A 始终有 5 列,例如对于第一行,
1092 - 1093 + 1X
B 始终有两列:
1093 HRDCPMRFYT
问题:如何解析具有不同格式的“交替”行的文件?
假设这是一个只有这种格式的文本文件,A 行和 B 行交替,分别有 5 列和 2 列。您如何将其解析为 R data.table?我的想法是如何创建以下格式:
1092 - 1093 + 1X 1093 HRDCPMRFYT
1093 + 1094 - 1X 1094 BSZSDFJRVF
1094 + 1095 + 1X 1095 SSTFCLEPVV
...
【问题讨论】:
-
只是为了确认:您想将偶数行附加到奇数行(它们总是交替的吗?),以创建七列?
-
@user20650 是的,这是最好的方法。如果创建两个data.tables“A”和“B”更容易,我认为这也会很有用
标签: r parsing data.table csv