【发布时间】:2017-06-08 17:34:52
【问题描述】:
我正在尝试通过过滤值来组织一列。换句话说,有成千上万个重复的名称,我想从每个“组”中只取一个名称并将其复制到另一列中。
所以A列是当前情况,be列是我想要得到的结果:
Column A Column B
AB Mark Sociedad Ltda AB Mark Sociedad Ltda
AB Mark Sociedad Ltda Acosta Acosta Manuel
AB Mark Sociedad Ltda ALBAGLI, ZALIASNIK
AB Mark Sociedad Ltda
Acosta Acosta Manuel
Acosta Acosta Manuel
Acosta Acosta Manuel
ALBAGLI, ZALIASNIK
ALBAGLI, ZALIASNIK
ALBAGLI, ZALIASNIK
最后这是我要使用的脚本:
import openpyxl
from openpyxl import load_workbook
import os
os.chdir('path')
workbook = openpyxl.load_workbook('abc.xlsx')
page_i = workbook.get_sheet_names()
sheet = workbook.get_sheet_by_name('Sheet1')
for a in range(1, 10):
representativex = sheet['A' + str(a)].value
tuple(sheet['A1':'A10'])
for row in sheet['A1':'A10']:
if representativex in row:
continue
else:
sheet['B' + str(a)].value
sheet['B' + str(a)] = representativex
workbook.save('abc.xlsx')
不幸的是,它不起作用。
【问题讨论】:
-
您只是想简单地对列进行重复数据删除?
-
嗨,德米特里。正是我正在尝试在 Python 中对其进行重复数据删除。
-
Excel 已经具备此功能。见here
-
感谢 KJ 的回答,但我需要在 python 中完成,因为这只是大脚本的一小部分。