【问题标题】:Column compare and return values列比较和返回值
【发布时间】:2017-12-17 01:29:18
【问题描述】:

我有两个数据框 df1 和 df2。我正在将数据帧 1 中的列值与 df2 中的许多列值进行比较,并返回唯一的交集,而在另一个数据帧中没有重复。

df1

       WORD    
0     This     
1       is    
2        a    
3    sample   
4  sentence   
5        to  
6     check  
7      NLP   
8        in   
9    python  

df2

Noun    Verb
Car     stand 
Sample  sit
        walk
        run
        is 

预期输出

df3

    Noun      Verb
    sample    is

我使用以下代码得到以下结果。虽然这是实现结果的迂回方式,但它并不完全正确。它为我显然不想要的每个匹配的名词列返回动词值。

import pandas as pd
df1 = pd.read_csv("1.csv")
df2 = pd.read_csv("2.csv")
df3 = df1.merge(df2, left_on=['Word'], right_on=['Noun'])
print df3.drop('Verb', 1)

   Word  Noun
0  this  this
1    is    is

【问题讨论】:

    标签: pandas


    【解决方案1】:

    通过使用numpy.intersect1d

    pd.DataFrame([np.intersect1d(x,df1.WORD.values) for x in df2.values.T],index=df2.columns).T
    Out[147]: 
         Noun Verb
    0  Sample   is
    

    如果你想使用熊猫

    df2.mul(df2.apply(lambda x : x.isin(df1.WORD))).apply(lambda x : sorted(x)).iloc[[-1],:]
    Out[159]: 
         Noun Verb
    4  Sample   is
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2018-10-31
      • 1970-01-01
      • 1970-01-01
      • 2015-03-14
      • 2023-03-11
      • 1970-01-01
      • 2017-04-04
      • 1970-01-01
      相关资源
      最近更新 更多