【发布时间】:2019-01-13 07:31:47
【问题描述】:
关于以下 Pandas 数据框,
idx = pd.MultiIndex.from_product([['A001', 'B001','C001'],
['0', '1', '2']],
names=['ID', 'Entries'])
col = ['A', 'B']
df = pd.DataFrame('-', idx, col)
df.loc['A001', 'A'] = [10,10,10]
df.loc['A001', 'B'] = [90,84,70]
df.loc['B001', 'A'] = [10,20,30]
df.loc['B001', 'B'] = [70,86,67]
df.loc['C001', 'A'] = [20,20,20]
df.loc['C001', 'B'] = [98,81,72]
df.loc['D001', 'A'] = [20,20,10]
df.loc['D001', 'B'] = [68,71,92]
#df is a dataframe
df
我很想知道在其“A”列中包含一组或列表中的所有值的 ID。让我们定义一个值为 [10,20] 的列表。在这种情况下,我应该得到位置 'B001' 和 'D001' 作为答案,因为这两个位置都有在它们的 'A' 列中提到的值。 此外,由于我必须处理非常大的数据集,您能否建议更快的实现。
【问题讨论】:
标签: python python-3.x performance pandas indexing