【发布时间】:2020-07-01 11:11:39
【问题描述】:
想象一下,我有一个带有以下字符串列的 R data.table:
string
a1; b: b1, b2, b3; c: c1, c2, c3
a1; b: b2, b3, b4; c: c1, c2, c3; d: d1, d2, d3
a2; b: b1, b2, b3; c: c2, c5, c6; d: d1, d2, d3; e: e2, e3, e4
a5; b: b5, b6, b7; c: c1, c2, c3; d: d1, d2, d3
a6; b: b1, b2, b3; c: c1, c4, c5; d: d1, d2, d3; e: e1, e2, e3; f: f1, f2, f3
我想用分号分隔每个字符串并将其写入新列 (a, b, c, d, e, f),如下所示:
a b c d e f
a1 b1, b2, b3 c1, c2, c3 NA NA NA
a1 b2, b3, b4 c1, c2, c3 d1, d2, d3 NA NA
a2 b1, b2, b3 c2, c5, c6 d1, d2, d3 e2, e3, e4 NA
a5 b5, b6, b7 c1, c2, c3 d1, d2, d3 NA NA
a6 b1, b2, b3 c1, c4, c5 d1, d2, d3 e1, e2, e3 f1, f2, f3
考虑到我有一个包含 100k+ 行的 data.table,什么是最快的方法?
【问题讨论】:
-
您自己有没有尝试过但速度太慢的想法?
标签: r string data.table str-replace