【发布时间】:2017-06-28 08:04:52
【问题描述】:
目前我在处理 pandas 时遇到了一些问题……
我正在尝试定义以下函数:
def outlier(frame, col1, col2):
(frame.pipe(frame.loc[:,"lower"] = frame.groupby(by='col1')['col2'].transform(lower))
frame.pipe(frame.loc[:,"upper"] = frame.groupby(by='col1')['col2'].transform(upper))
frame.pipe(frame.loc[:,"outlier"] = (frame['col2'] < frame['lower'])|(frame['col2'] > frame['upper']))
)
不幸的是,我得到: SyntaxError: 关键字不能是表达式
有些东西阻止我只见树木不见森林,也无法发现我明显愚蠢的错误......
在以下代码中有效:
这是函数“upper”和“lower”:
lower = lambda x: x.quantile(q=.25) - (1.5*(x.quantile(q=.75)-x.quantile(q=.25)))
upper = lambda x: x.quantile(q=.75) + (1.5*(x.quantile(q=.75)-x.quantile(q=.25)))
这是我将新列添加到 DataFrame 的“意大利面条代码”:
acid81.loc[:,"lower"] = acid81.groupby(by='Ursprung')['Analysenwert'].transform(lower)
acid81.loc[:,"upper"] = acid81.groupby(by='Ursprung')['Analysenwert'].transform(upper)
acid81.loc[:,"outlier"] = (acid81['Analysenwert'] < acid81['lower']) | (acid81['Analysenwert'] > acid81['upper'])
【问题讨论】:
-
.transform(lower) -
通常不是 - 这个较低的代表已经定义的另一个函数。
-
那你应该给我们看minimal reproducible example。
-
请edit您的问题提供所需的信息。错误似乎是您使用表达式作为关键字。参见例如this question。你如何调用你的异常值函数?
-
再次,请edit您的问题。请尝试格式化代码并检查您是否复制粘贴了所有内容。我只是计算了左括号的数量,它与右括号的数量不匹配。您当前的示例代码中有一个左括号太多。