【发布时间】:2021-09-14 15:21:45
【问题描述】:
我看过这个question,但我无法理解它的含义。它与旋转数据框后将多个索引展平为单个索引有关。
我目前正在处理图像,并且我有一个包含重复行的数据框,但是,每个重复行都有不同的“主题”值。
目标:
我想删除这些重复的行,即使它们具有不同的值,并将所有重复项中的所有不同值合并到一个列中,即Aortic enlargement|Pulmonary fibrosis|Atelectasis。
问题:
这本质上是一个多部分的问题。
-
我怎样才能达到上述目标?
-
有人可以用蹩脚的语言解释我所链接的问题以完全理解它吗?
额外信息:
我有一个mock csv file,如果您需要完全理解我的意思,可以访问它。
【问题讨论】:
-
哪些行重复???您认为哪些列是重复行?也许 (16, 57) 和 (35, 65) 列在
class_name的右侧 -
在
image_id列中我复制了行。我有 15k 图片,但行数为 67k+。每个图像 id 在labelcol 中都有一个独特的疾病。所以我想删除所有这些重复并制作如下标签:img_id label 0001 fibrosis |我想要这样的肺不张 -
好吧,也许你应该更新你的帖子。
-
它更新的兄弟有人更新它
-
另一个问题:应该删除其他列吗?输出只包含 2 列:
image_id和class_name,对吗?
标签: python pandas dataframe csv