【发布时间】:2019-12-30 10:26:23
【问题描述】:
我需要读取 excel 文件并突出显示重复的行,而无需编辑 excel 或添加新的列/行。我阅读了excel文件:
df = pd.read_excel(path2, sheet_name='Sheet1')
与
df.drop_duplicates(subset=df.columns.difference(['Mark 4']))
我得到所有重复的行,不包括“Mark 4”。问题是我无法提取这些行号来使用它们
df.style.applymap(color_negative_red)
在 excel 中突出显示这些行,因为它们不包含在 df 中。
我试过了
dfToList = redovi['unique_row_to_index'].tolist()
但由于没有唯一的行,我无法提取数据。
df.drop_duplicates(subset=df.columns.difference(['Mark 4'])) 的输出是:
Type1 Type2
0 w A
11 w A
12 w A
18 w A
19 w A
20 w A
[6 行 x 170 列]
我需要提取那些不属于 excel 列的行号,并将它们用作将来格式化的列表。
【问题讨论】:
-
你想要
df['Mark 4'].duplicated()吗?这只是一个猜测,因为您没有提供输入数据,只提供了输出。
标签: python excel pandas duplicates rows