【发布时间】:2019-10-17 04:38:49
【问题描述】:
我有一个包含几列的数据框,其中之一是 company_name。我正在尝试删除基于具有相同公司名称的重复记录,但我不知道如何在保持公司名称的原始大小写的同时执行此操作。
我已尝试将所有名称转换为小写,然后删除重复项,但如前所述,我想保留原来的大小写。
df = pd.DataFrame({'company_name': ['Apple', 'apple', 'BlackBerry', 'blackberry','Blackberry'])
df['company_name'] = df['company_name'].str.strip()
df['company_name'] = df['company_name'].str.lower()
input_records.drop_duplicates(subset=['company_id'], inplace=True,
keep="first")
此代码消除了重复,但以全小写形式存储公司名称。
想要的结果
company_name
Apple
BlackBerry
实际结果
company_name
apple
blackberry
【问题讨论】:
-
欢迎来到 StackOverflow。请花时间阅读how to provide a great pandas example 上的这篇文章以及如何提供minimal, Complete, and Verifiable example 并相应地修改您的问题。这些关于如何提出好问题的提示也可能很有用。