如何根据唯一列组合 Pandas 数据框答案

【问题标题】：How to combine Pandas dataframe according to unique column如何根据唯一列组合 Pandas 数据框
【发布时间】：2018-11-24 21:51:38
【问题描述】：

我有两个 CSV 文件。一种称为“master_registry.csv”，另一种称为“master_reference.csv”。这两个 CSV 文件都有一个名为“Master_Id”的列。我从“master_registery.csv”中过滤了一些值，包括“Master_Id”，并创建了名为“df”的新数据框，还从“master_reference.csv”中过滤了一些值，包括“Master_Id”，并创建了一个名为“ df2'。所以这两个数据框都有“Master_Id”列。现在我想通过组合“df”和“df2”数据框来创建新的数据框。谁能帮我做这个？

    # reading CSV from the directory
    master_registry = pd.read_csv('application/master_registry.csv')
    master_reference = pd.read_csv('application/master_registry.csv')

    # filtering some selected columns form the csv
    df = master_registry .filter(items=['Master_ID', 'Provider First Name', 'Provider Last Name (Legal Name)', 'Provider Credential Text', 'Provider Gender Code','Provider License Number State Code_1',
                    'Provider Business Practice Location Address City Name'])

    df2 = master_reference .filter(items=['Master_ID', 'Client_Reference_ID'])

【问题讨论】：

标签： python pandas csv

【解决方案1】：

在我看来，您想通过“主 ID”合并两个数据框。你可以看看这个link。

我认为这应该可以解决您的问题：pd.merge(df, df2, on='Master_ID')

【讨论】：

不鼓励仅链接的答案。见stackoverflow.com/help/how-to-answer。引用链接的相关部分，因为链接可能会随着时间的推移而失效。
@MarkTolonen 我已经编辑了答案并试图使其有用。谢谢！

【解决方案2】：

使用join method。下面的用法-

df.set_index('Master_ID').join(df2.set_index('Master_ID'))

【讨论】：