【发布时间】:2017-05-14 13:30:42
【问题描述】:
假设我有一个如下的数据框 A:
item_name
-------------------------
nike power shoes / 50% off / only today
nike super t-shirt / adidas / cool sale
reebok power t-shirt / reebock shoes
另一个数据框 B 是一个品牌字典,它是:
variation | original
nike nike
adidas adidas
reebok reebok
reebock reebok
reeboc reebok
(假设 reebock 和 reeboc 是“reebok”的一些变体)
我的问题是我想从数据框 A 中删除行 根据数据框 B,包含超过 1 个品牌。 所以我想要的结果如下:
item_name
nike power shoes / 50% off / only today
reebok power t-shirt / reebock shoes
你可以看到只有那一行“nike super t-shirt/adidas/cool sale” 已被删除,因为我们有 [nike] 和 [adidas]。 重要的是要知道这个逻辑是基于原始品牌,而不是变化部分。 因此,“reebok power t-shirt / reebock shoes”行没有被删除,因为 reebok 和 reebock 属于一个独特的品牌名称 [reebok]。
我怎样才能通过 pandas 完成这项工作?(不使用列表理解) 请帮帮我! :)
【问题讨论】:
标签: python pandas dictionary indexing dataframe