【发布时间】:2019-03-20 19:51:25
【问题描述】:
我正在尝试删除房地产销售数据数据框中的重复项。有时,一份契约将包含许多包裹作为销售的一部分。因为数据是按包裹进行的,所以一次销售显示为几行,每个不同的包裹但具有相同的契约号和销售价格 - 我们不希望这些在我们的数据集中。
我想完全删除它们,而不保留一行。使用 duplicated() 或 unique() 将删除重复项,但将保留一行重复值,以便新数据框包含该列的唯一值。这对我们不起作用——我们想完全摆脱所有重复的行。那么,我怎样才能识别出 deed_number 和 销售价格是重复的,并在不保留任何行的情况下删除 所有 行?
【问题讨论】:
标签: r data-science