【问题标题】:How to extract integer from dataframe?如何从数据框中提取整数?
【发布时间】:2019-04-10 10:29:24
【问题描述】:

我有一个熊猫数据框:

原始数据非常混乱,有数百列和行,大部分是重复的,我能够尽我所能清理它,但遇到了这个障碍。数据现在是这样存储的:

    col
0   [6, str]
1   [37, str]
2   [72, str]
3   [104, str]
4   [142, str]
5   [174, str]
6   [206, str]
7   [244, str]
...

似乎数据变成了一个 DataFrame,其中包含“[int, str]”的元组作为 1 列和 N 行。我只需要将“str”值作为列名,将整数作为相同顺序的行。最终结果仍将是一个 1xN 的 DataFrame,但删除所有重复的“str”值并将其仅存储为列标题。

我需要为这些文件中包含的 3 个单独的“str”值执行此操作,并将所有 3 个附加到一个已清理的巨型 DataFrame,如下所示:

    str1, str2, str3 
0   int1, int2, int3
1   int1, int2, int3
2   int1, int2, int3
...

脚本目前能够找出每个单独的 str 值,但像第一个示例一样存储它们。我可以弄清楚如何在之后附加它们,但是我该如何分离整数呢?

【问题讨论】:

    标签: python pandas dataframe


    【解决方案1】:

    自己找到答案了,谢谢。希望这对寻找类似东西的人有所帮助,它也很简单。

    我把DataFrame变成了一个列表“f”然后做了:

    for i in f:
        a.append(i[0])
    

    现在我将需要的数据存储在“a”中,并且可以按照我的意愿对其进行操作。 “a”和“f”是列表名称的任意示例。

    【讨论】:

      猜你喜欢
      • 2019-11-02
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2020-02-02
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多