【发布时间】:2014-10-22 17:36:07
【问题描述】:
我的问题与Converting a list of ints, tuples into an numpy array 类似,但不同之处在于每个项目的格式不一定是 [float, (float, float, float)] 但第一个是 [float, float] 下一个是 [float,浮动,浮动]等。
我的 DataFrame 中的数据是通过查询 mySQL 数据库获得的,如果这很重要的话。 “值”列最初由“1,2”和“1,2,3”和“1,2,3,4,5”等格式的字符串填充。 DataFrame 现在看起来大致如下:
ID values num
1 [1, 2] 2
2 [1, 2, 3] 3
3 [1, 2, 3, 4, 5] 5
我想要做的是能够从 DataFrame 中获取每个 [float, float, ...] 条目,并将基于它的新值/变量报告给附加到同一 DataFrame 的新列,例如计算每个“values”列表或新变量“avg = sum(values)/num”的标准差,并将结果存储在 df_new['stddev'] 或 df_new['avg'] 中。
这是我目前关注的代码部分:
df_new = df[df.num <= 10]
df_new['values'] = df_new['values'].astype(str).str.split(',')
valList = df_new.values.tolist()
我对 Python 比较陌生,所以如果我错过了一些基本的东西,请多多包涵。
【问题讨论】: