追加数据框问题答案

【问题标题】：Append data frame issue追加数据框问题
【发布时间】：2021-04-21 00:59:14
【问题描述】：

数据框问题

ID	C1	C2	M1
1	A	B	X
2		A	Y
3	C		W
4	G	H	Z

想要的结果

ID	C
1	A
1	B
2	B
3	C
4	C
4	G

主要问题是今天的第一个数据集有 C1 和 C2 明天我们可以有 C1 , C2 , C3 ...Cn 将提供文件名，我的任务是读取它并获得结果，无论该文件可能有多少与 C 相关的列。列：不需要 M1。

-----我尝试了什么：

df = pd.read_csv (r"C:\Users\JIRAdata_TEST.csv") 

df = df.filter(regex='ID|C')
print(df2)

将返回所有 ID 和 C 相关列，并删除 M1 列作为数据清理的一部分——不知道这是否有帮助。

然后……卡住了！

【问题讨论】：

标签： python dataframe append concatenation

【解决方案1】：

将df.melt 与df.dropna 一起使用：

In [1295]: x = df.filter(regex='ID|C').melt('ID', value_name='C').sort_values('ID').dropna().drop('variable', 1)

In [1296]: x
Out[1296]: 
   ID  C
0   1  A
4   1  B
5   2  A
2   3  C
3   4  G
7   4  H

【讨论】：

你是个天才
@danPy 请点击我答案左侧的check-mark 接受答案。
@danPy 请点击我答案左侧的复选标记接受答案。
@danPy 请accept它。