【发布时间】:2023-03-22 19:15:01
【问题描述】:
假设我想删除标题包含“X”的列中的任何单元格包含单词“acme”的行。我目前的想法是添加一个 for 循环(对于包含 X 的列标题),然后使用先前定义的掩码删除“acme”行。有没有更好的办法?
此外,我们将不胜感激有关掩码/查询的帮助,因为我从未使用过它们。
输入 DF:
Company_x First Name Last Name Emails_x Created_x Hosted Meetings 03112016 Facilitated Meetings_x Attended Meetings_x Company_y Emails_y ... Created_x Hosted Meetings 04122016 Facilitated Meetings_x Attended Meetings_x Company_y Emails_y Created_y Hosted Meetings 04212016 Facilitated Meetings_y Attended Meetings_y
0 TS X Y X@Y.com 03/10/2016 0.0 0.0 0.0 TS X@Y.com ... 03/10/2016 0.0 0.0 2.0 NaN NaN NaN NaN NaN NaN
1 TS X Y X@Y.com 03/10/2016 0.0 0.0 0.0 TS X@Y.com ... 01/25/2016 0.0 0.0 0.0 NaN NaN NaN NaN NaN NaN
2 TS X Y X@Y.com 03/10/2016 0.0 0.0 0.0 TS X@Y.com ... 04/06/2015 9.0 10.0 17.0 NaN NaN NaN NaN NaN NaN
ValueError: 无法从重复的轴重新索引 all_users_sheets_hosts.filter(like='Company')
【问题讨论】:
-
在提问时尽量提供Minimal, Complete, and Verifiable example。如果有 pandas 问题,请提供示例 input 和 output 数据集(CSV/dict/JSON/Python 代码格式的 5-7 行 作为文本,因此可以在为您编写答案时使用它)。这将有助于避免以下情况:
your code isn't working for me或it doesn't work with my data等。 -
谢谢。用数据框的前三行和错误以及它发生的位置编辑了我的问题
-
你有很多重复的列(相同的列名) - 你怎么能使用这个 DF???
-
好点。我寻找了一种不同的方式来处理事情,并提出了一个新问题,即在加载到 excel 文件中的 for 循环中删除最终文件中的 NaN 行,并从除了最终加载到 excel 文件中之外的所有列中删除许多重复的列