【发布时间】:2021-10-14 16:40:05
【问题描述】:
首先,如果这个问题已经被问过,我很抱歉,但我相信我的挑战已经足够具体了。我不是在寻找完整的答案,而只是在寻找如何进行的指导。
-
首先,我有一个监控参与者的原始数据集。这些数据包括收入、储蓄等……这些参与者已被跟踪 6 个月(1 月至 6 月)。但数据存储在一个完整的 Excel 文件中,其中有一列指定月份,这意味着一个参与者的姓名在文件中出现 6 次,每个月一个。每个参与者都有一个唯一的 ID。
-
我想以一种更可行的方式转换这些数据,并且我想学习用 Python 来做这件事。但后来我感到卡住和生疏,因为我编码已经很久了,而且我只习惯于定期使用的代码(打印分组平均值等......);这是我要遵循的步骤:
一个。首先创建一个列,其中包含已使用 ID 跟踪的参与者的唯一列表。每个参与者只能被引用一次;
b.每个参与者都在原始文件中记录了一个活动和子活动类型,这也需要添加到新数据集中;
c。例如,对于 1 月份,我想创建一个“january_income”列,其中从原始数据集中拖出 1 月份的收入,以此类推每个变量和每个月。
任何人都可以就我如何进行操作提供指导吗?正如我所说,它不必是特定的代码,它可以是方法或步骤以及我可以使用的功能。
已经非常感谢了。 N.B:我使用 Spyder 作为工作环境。
【问题讨论】:
-
欢迎来到 Stackoverflow!目前,我将此问题标记为“需要更多关注”,因为这个问题似乎是一次询问多个步骤。请注意,Stackoverflow 不是免费的教程提供者,这个问题非常笼统地询问构成教程的内容,而不是询问特定问题。以下是一些建议:您可以编辑问题以专注于问题的特定步骤/部分,并提供您的代码尝试。堆栈溢出更像是一个有问题的代码助手,而不是免费的代码/教程提供者。无论如何祝你好运:D
标签: python excel spyder xlsx data-transform