【发布时间】:2018-02-14 19:19:41
【问题描述】:
我有一个可能包含数百万行的数据框,如下所示:
df:
name value
1 bob1 abc
2 bob3 def
3 jake2 ghi
4 jake jkl
5 sam1 mno
6 bob5 pqr
如何根据包含某些子字符串的名称列值将其拆分为多个数据帧,例如本例中的“bob”、“jake”和“sam”?
如果发生任何变化,新的数据帧仍可以保存在一个数据结构中,例如字典。
所需的数据帧:
df1:
name value
1 bob1 abc
2 bob3 def
3 bob5 pqr
df2:
name value
1 jake2 ghi
2 jake jkl
df3:
name value
1 sam1 mno
【问题讨论】:
-
您建议的拆分规则是什么?名称(减去任何整数)?
-
是的,准确地说,命名减号和尾随整数。不过我不知道名字提前,但它们总是字母,最后可能包含一个整数。