【发布时间】:2019-04-18 11:39:16
【问题描述】:
我有一个数据框和一个列表:
df = pd.DataFrame({'id':[1,2,3,4,5,6,7,8],
'char':[['a','b'],['a','b','c'],['a','c'],['b','c'],[],['c','a','d'],['c','d'],['a']]})
names = ['a','c']
只有当a 和c 都出现在char 列中时,我才想获取行。(这里的顺序无关紧要)
预期输出:
char id
1 [a, b, c] 2
2 [a, c] 3
5 [c, a, d] 6
我的努力
true_indices = []
for idx, row in df.iterrows():
if all(name in row['char'] for name in names):
true_indices.append(idx)
ids = df[df.index.isin(true_indices)]
这给了我正确的输出,但对于大型数据集来说太慢了,所以我正在寻找更有效的解决方案。
【问题讨论】:
标签: python python-3.x pandas