【发布时间】:2016-12-08 15:27:38
【问题描述】:
我有一个这样的数据框:
import pandas as pd
dic = {'A':[100,200,250,300],
'B':['ci','ci','po','pa'],
'C':['s','t','p','w']}
df = pd.DataFrame(dic)
我的目标是将行分隔为 2 个数据帧:
- df1 = 包含沿
B列不重复值的所有行(非队列行)。 - df2 = 只包含自己重复的行。
结果应该是这样的:
df1 = A B C df2 = A B C
0 250 po p 0 100 ci s
1 300 pa w 1 250 ci t
注意:
- 数据框通常可能非常大,并且有许多在 B 列中重复的值,因此答案应尽可能通用
- 如果没有重复,df2 应该是空的!所有结果都应该在df1中
【问题讨论】:
标签: python pandas dataframe subtraction divide