【发布时间】:2018-11-16 05:58:15
【问题描述】:
我有一个.csv,我从中生成了一个数据框。此 csv 具有来自遵循此格式的系统的原始数据输出:
{"DataType1":"Value","DataType2":"Value","DataType3":"Value",.....}
数据框中的每一行都只有 1 列。我试图打破这一点,以便数据类型成为列标题并且值填充行。另一方面是并非所有行都具有相同的数据类型,有些行具有其他行中可能不存在的附加数据类型。例如,第 1 行可能有DataType1、DataType2 和DataType3,第2 行可能有DataType2、DataType4 和DataType5。理想情况下,我希望输出使列标题包含所有数据类型,无论该行是否具有值。所以最终的数据框将是这样的结构:
-------------------------------------------------------------
| DataType1 | DataType2 | DataType3 | DataType4 | DataType5 |
-------------------------------------------------------------
| Value | Value | Value | NaN | NaN |
-------------------------------------------------------------
| NaN | Value | NaN | Value | Value |
-------------------------------------------------------------
【问题讨论】:
-
嗨,欢迎来到 Stack Overflow。请查看 SO 是否有类似问题,例如 stackoverflow.com/questions/14745022/…、stackoverflow.com/questions/29370211/…、stackoverflow.com/questions/39553392/… 等。
-
如果你知道,数据是 JSON 还是 Python 字典?到目前为止,您尝试过什么?
-
数据在上面列出的 csv 表中。每行只有 1 列和 1 个字符串。它遵循字典格式
标签: python pandas csv dataframe