【发布时间】:2022-08-18 15:56:17
【问题描述】:
我有一个数据集如下:
data = [[1,\'bot\', \'a\'], [1,\'cust\', \'b\'], [1,\'bot\', \'c\'],[1,\'cust\', \'d\'],[1,\'agent\', \'e\'],[1,\'cust\', \'f\'],
[2,\'bot\', \'a\'],[2,\'cust\', \'b\'],[2,\'bot\', \'c\'],[2,\'bot\', \'d\'],[2,\'agent\', \'e\'],[2,\'cust\', \'f\'],[2,\'agent\', \'g\'],
[3,\'cust\', \'h\'],[3,\'cust\', \'i\'],[3,\'agent\', \'k\'],[3,\'agent\', \'l\']]
# Create the pandas DataFrame
df = pd.DataFrame(data, columns=[\'id\', \'sender\',\'text\'])
df
我想删除特定类别(发件人)的每个 id 组下的过滤记录。例如,如果我想过滤掉 \'bot\' 类别,我需要在每个 group(id) 下找到最后一个 bot 类别出现并删除该出现之前的记录。
预期产出
尝试了具有 groupby 功能的各种方法,但没有获得预期的输出。任何指针都会很有帮助
标签: python-3.x pandas dataframe group-by