【发布时间】:2018-02-10 16:02:45
【问题描述】:
我正在尝试在 python pandas 中使用df['column_name'].str.count("+"),但我收到了
“错误:无需重复”
。使用常规字符,该方法有效,例如df['column_name'].str.count("a") 工作正常。
另外,“^”符号也有问题。如果我使用df['column_name'].str.contains("^"),结果是不正确的——看起来“^”被解释为“”(空白)。
令人惊讶的是,如果我在常规的非 pandas 字符串上使用 .count("+") 和 .contains("^"),它们可以正常工作。
简单的工作示例:
df = pd.DataFrame({'column1': ['Nighthawks+', 'Dragoons'], 'column2': ['1st', '2nd']}, columns = ['column1', 'column2'])
当应用df["column1"].str.contains("^") 时,会得到“真,真”,但应该是“假,假”。
当申请df["column1"].str.count("+") 时会得到一个
“错误:无需重复”
但是,在 panda 之外,"bla++".count("+") 正确地给出了结果“2”。
有什么解决办法吗?谢谢
【问题讨论】:
标签: python pandas special-characters contains