【发布时间】:2016-02-11 16:44:54
【问题描述】:
我正在尝试在 pandas 中将数据连接在一起,但对我来说似乎效果不佳。
我有一些数据想要转换为数字,我能够做到这一点。然后我想让它重新加入数据集。
原始数据如下所示:
CallDate Agent Group Direction
0 2015-09-01 Adam Billing Inbound
1 2015-09-01 Nathaniel Billing Outbound
2 2015-09-01 Jessica Claims Inbound
3 2015-09-01 Tom Billing Outbound
4 2015-09-01 Jane CCS Inbound
这是我将组转换为数字的代码
data['Group']=data['Group'].astype(str)
data.Group=data['Group'].apply(lambda x:len(x))
这很有效,给了我我想要的东西 0 1 1 1 2 13 3 1 4 6
然后我尝试将其合并回组(基本上我想知道每个名称/数字对应的内容)
y=pd.concat([data,data.Group], ignore_index=True)
y [:5]
但是结果和原来的数据库是一样的
是否有一些明显的我遗漏或我没有想到的更简单的解决方法。
【问题讨论】:
-
同时发布其他数据集
-
正如 WoodChopper 所说,您的代码不适合您的“原始数据”,它访问
AssignedWorkGroup但这不在您显示的数据中。还包括为您打印这些数字(0 1 1 等)的代码,以及您期望的代码的完整输出。 -
@sgvd 抱歉忘记清理标签了
-
@user3120266 你想连接
Billing+len(Billing)吗? -
@WoodChopper 实际上不,它将是一个单独的列。所以组仍然存在,但随后是一个带有数字的单独列
标签: python pandas merge concatenation dataframe