【发布时间】:2020-10-02 16:27:18
【问题描述】:
我正在尝试使用 Pandas 从调查结果表中读取一个 excel 文件(在有参与者的行上),但是我将许多变量分成多个列,就像这样
>>> df.columns
Index([ ... , 'Age', 'Unnamed: 12', 'Unnamed: 13', 'Unnamed: 14', 'Unnamed: 15', 'Unnamed: 16', ...], dtype='object', length=256)
'Age' 之后和下一个命名列之前的每个未命名列仅包含与该多项选择题中的单个选项相对应的 Age 变量的值。
如何获取同一列下的所有年龄值?
编辑:df.head(5).to_dict() 的输出示例:
{...,
'Gender': {0: 'M', 1: 'M', 2: 'M', 3: nan, 4: nan},
'Unnamed: 10': {0: 'F', 1: nan, 2: nan, 3: 'F', 4: 'F'},
'Age': {0: 25.0, 1: nan, 2: 25.0, 3: nan, 4: nan},
'Unnamed: 12': {0: 26.0, 1: nan, 2: nan, 3: 26.0, 4: nan},
'Unnamed: 13': {0: 27.0, 1: nan, 2: nan, 3: nan, 4: nan},
'Unnamed: 14': {0: 28.0, 1: nan, 2: nan, 3: nan, 4: 28.0},
'Unnamed: 15': {0: 29.0, 1: nan, 2: nan, 3: nan, 4: nan},
'Unnamed: 16': {0: 30.0, 1: nan, 2: nan, 3: nan, 4: nan},
...}
【问题讨论】:
-
能否提供您正在阅读的 Excel 文件的示例?这将有助于更好地理解问题。
-
像这样的一行代码吗?如果它不是表格,那么这将是一个问题。如果可能的话,您的 Excel 工作表的屏幕截图会很好。
-
是的,它是表格的,抱歉……我会截图
-
@garpez 查看您拥有的图像,复制并粘贴这些单元格,然后将其粘贴到您的问题中,然后格式化为代码。或执行
print(df.head(5).to_dict())并将其粘贴到您的问题中并格式化为代码。
标签: python excel pandas survey