【发布时间】:2021-04-21 00:59:14
【问题描述】:
数据框问题
| ID | C1 | C2 | M1 |
|---|---|---|---|
| 1 | A | B | X |
| 2 | A | Y | |
| 3 | C | W | |
| 4 | G | H | Z |
想要的结果
| ID | C |
|---|---|
| 1 | A |
| 1 | B |
| 2 | B |
| 3 | C |
| 4 | C |
| 4 | G |
主要问题是今天的第一个数据集有 C1 和 C2 明天我们可以有 C1 , C2 , C3 ...Cn 将提供文件名,我的任务是读取它并获得结果,无论该文件可能有多少与 C 相关的列。列:不需要 M1。
-----我尝试了什么:
df = pd.read_csv (r"C:\Users\JIRAdata_TEST.csv")
df = df.filter(regex='ID|C')
print(df2)
将返回所有 ID 和 C 相关列,并删除 M1 列作为数据清理的一部分——不知道这是否有帮助。
然后……卡住了!
【问题讨论】:
标签: python dataframe append concatenation