【问题标题】:How to combine Pandas dataframe according to unique column如何根据唯一列组合 Pandas 数据框
【发布时间】:2018-11-24 21:51:38
【问题描述】:

我有两个 CSV 文件。一种称为“master_registry.csv”,另一种称为“master_reference.csv”。这两个 CSV 文件都有一个名为“Master_Id”的列。我从“master_registery.csv”中过滤了一些值,包括“Master_Id”,并创建了名为“df”的新数据框,还从“master_reference.csv”中过滤了一些值,包括“Master_Id”,并创建了一个名为“ df2'。所以这两个数据框都有“Master_Id”列。现在我想通过组合“df”和“df2”数据框来创建新的数据框。谁能帮我做这个?

    # reading CSV from the directory
    master_registry = pd.read_csv('application/master_registry.csv')
    master_reference = pd.read_csv('application/master_registry.csv')

    # filtering some selected columns form the csv
    df = master_registry .filter(items=['Master_ID', 'Provider First Name', 'Provider Last Name (Legal Name)', 'Provider Credential Text', 'Provider Gender Code','Provider License Number State Code_1',
                    'Provider Business Practice Location Address City Name'])

    df2 = master_reference .filter(items=['Master_ID', 'Client_Reference_ID'])

【问题讨论】:

    标签: python pandas csv


    【解决方案1】:

    在我看来,您想通过“主 ID”合并两个数据框。你可以看看这个link

    我认为这应该可以解决您的问题:pd.merge(df, df2, on='Master_ID')

    【讨论】:

    • 不鼓励仅链接的答案。见stackoverflow.com/help/how-to-answer。引用链接的相关部分,因为链接可能会随着时间的推移而失效。
    • @MarkTolonen 我已经编辑了答案并试图使其有用。谢谢!
    【解决方案2】:

    使用join method。下面的用法-

    df.set_index('Master_ID').join(df2.set_index('Master_ID'))
    

    【讨论】:

      猜你喜欢
      • 2021-04-03
      • 1970-01-01
      • 2022-08-11
      • 2017-09-11
      • 2023-03-06
      • 2019-11-10
      • 2021-10-03
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多