【问题标题】:Append data frame issue追加数据框问题
【发布时间】:2021-04-21 00:59:14
【问题描述】:

数据框问题

ID C1 C2 M1
1 A B X
2 A Y
3 C W
4 G H Z

想要的结果

ID C
1 A
1 B
2 B
3 C
4 C
4 G

主要问题是今天的第一个数据集有 C1 和 C2 明天我们可以有 C1 , C2 , C3 ...Cn 将提供文件名,我的任务是读取它并获得结果,无论该文件可能有多少与 C 相关的列。列:不需要 M1。

-----我尝试了什么:

df = pd.read_csv (r"C:\Users\JIRAdata_TEST.csv") 

df = df.filter(regex='ID|C')
print(df2)

将返回所有 ID 和 C 相关列,并删除 M1 列作为数据清理的一部分——不知道这是否有帮助。

然后……卡住了!

【问题讨论】:

    标签: python dataframe append concatenation


    【解决方案1】:

    df.meltdf.dropna 一起使用:

    In [1295]: x = df.filter(regex='ID|C').melt('ID', value_name='C').sort_values('ID').dropna().drop('variable', 1)
    
    In [1296]: x
    Out[1296]: 
       ID  C
    0   1  A
    4   1  B
    5   2  A
    2   3  C
    3   4  G
    7   4  H
    

    【讨论】:

    • 你是个天才
    • @danPy 请点击我答案左侧的check-mark 接受答案。
    • @danPy 请点击我答案左侧的复选标记接受答案。
    • @danPy 请accept它。
    猜你喜欢
    • 2020-04-21
    • 1970-01-01
    • 2019-03-06
    • 1970-01-01
    • 2018-05-14
    • 2016-07-21
    • 2014-01-13
    • 2020-09-11
    • 2018-01-08
    相关资源
    最近更新 更多