【问题标题】:Misc Question Python-Comparing Rows with different thresholds其他问题 Python-比较具有不同阈值的行
【发布时间】:2021-05-05 16:49:45
【问题描述】:

我必须根据数据中其他列的数据将每一行与不同的阈值进行比较。我该怎么做。

例如,我有 5 列如下。

我必须根据市场、产品组和价格类型的数据分布将价格列与阈值进行比较。

假设我将计算每个组的中值,例如GBRToysLow ASP。我会将1 行的价格(即 10 美元)与该组的中位数(即GBRToysLow ASP)进行比较。

因此,我的阈值将根据市场、产品组和价格类型的属性值对每一行有所不同)。我该怎么做?我一直坚持在 Python 中为此确定逻辑。

数据sn-p:

【问题讨论】:

    标签: python dataframe multiple-conditions


    【解决方案1】:

    我不知道你的 DF 长什么样。我假设你正在使用熊猫。将来提供一些代码,以便我们为您提供更好的答案。你想要做的可能是这样的:

    filtered_df = df[(df['Price'] > 100) & (df['Product Group']=='Toys')]
    

    在此之后,您可以比较两个不同的数据帧。要添加具有中位数的列,您可以执行以下操作:

    filtered_df[median] = filtered_df['Price'].median()
    

    更多关于 pandas 中值函数的信息请看这里:https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.median.html 使用 Groupby 可以让您更轻松地完成所有这些工作;但是,正如我之前所说,我需要更多代码才能启动。
    抱歉,如果此答案不是您所需要的,我不确定您使用比较的上下文是什么。它看起来像一个excel替代品。查看这篇文章以获取更多上下文。 how do you filter pandas dataframes by multiple columns

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2014-05-27
      • 1970-01-01
      • 2016-09-30
      • 2015-11-14
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多