【发布时间】:2019-04-10 10:29:24
【问题描述】:
我有一个熊猫数据框:
原始数据非常混乱,有数百列和行,大部分是重复的,我能够尽我所能清理它,但遇到了这个障碍。数据现在是这样存储的:
col
0 [6, str]
1 [37, str]
2 [72, str]
3 [104, str]
4 [142, str]
5 [174, str]
6 [206, str]
7 [244, str]
...
似乎数据变成了一个 DataFrame,其中包含“[int, str]”的元组作为 1 列和 N 行。我只需要将“str”值作为列名,将整数作为相同顺序的行。最终结果仍将是一个 1xN 的 DataFrame,但删除所有重复的“str”值并将其仅存储为列标题。
我需要为这些文件中包含的 3 个单独的“str”值执行此操作,并将所有 3 个附加到一个已清理的巨型 DataFrame,如下所示:
str1, str2, str3
0 int1, int2, int3
1 int1, int2, int3
2 int1, int2, int3
...
脚本目前能够找出每个单独的 str 值,但像第一个示例一样存储它们。我可以弄清楚如何在之后附加它们,但是我该如何分离整数呢?
【问题讨论】: