【发布时间】:2022-01-22 22:25:14
【问题描述】:
我正在处理学生测试数据。提供的数据采用新格式,我需要将其与现有 BI 应用程序的旧格式对齐。在一系列列用于包含问题编号的情况下,列名现在包含正确答案(这包括从源 XLSX 导入的重复列名 - 请参见下图)。不同年级有不同数量的问题(因此“总计”列不固定。我需要将答案列重命名为从 1 开始的连续问题编号。实现此目的的最佳方法是什么?
NB 示例 df 不太正确,因为列名代表正确答案,因此列名重复。如果不从 CSV/XLSX 导入,我无法提供示例 df。
更新了一些示例 df 数据:
data = {
'StudentID': [10, 11, 12, 13],
'Year' : [2021,2021,2021,2021],
'TestName': ['Math83', 'Math83','Math83','Math83'],
'A' : ['C','A','C','B'],
'B' : ['D','C','C','C'],
'C' : ['D','D','C','D'],
'D' : ['B','C','C','C'],
'Total': [5,4,3,5,],
'Score': [3,3,4,2,],
'Error': [1,2,1,1]
}
df = pd.DataFrame(data)
【问题讨论】: