【问题标题】:Calculate a set of performance metrics from signals in a pandas column根据 pandas 列中的信号计算一组性能指标
【发布时间】:2022-01-05 09:50:45
【问题描述】:

我有一个包含以下三个信号的数据框:

  • rr_manually_cleaned 是地面实况信号

  • rr_noisy 是原始噪声信号

  • rr_filtered 是已清理的异常检测器的输出
    来自检测到的异常的 rr_noisy

评估异常检测器的性能 - 我想找出 FP、FN 等。

  • 对于 FN(假阴性) - 这将是存在 rr_filtered 中但不在 rr_manually_cleaned 中的数据点(即 NaN 值),因为这意味着异常检测器未能检测到 异常

  • 对于 FP(误报) - 这将是数据点的情况 存在于rr_manually_cleaned 但不存在于rr_filtered 中 异常检测器检测到不应该是一个异常

使用此设置 - 计算 FP、FN 和其他相关性能指标(F1、Precision、Recall 等)的最佳方法是什么?是否可以直接由此构建混淆矩阵?

【问题讨论】:

    标签: python pandas confusion-matrix false-positive


    【解决方案1】:

    尝试使用 isna() 测试。

    df.loc[(~df['rr_filtered'].isna()) & (df['rr_manually_cleaned'].isna()), 'TEST'] = 'FN'
    
    df.loc[(~df['rr_manually_cleaned'].isna()) & (df['rr_filtered'].isna()), 'TEST'] = 'FP'
    
    

    【讨论】:

      猜你喜欢
      • 2019-12-22
      • 2021-09-11
      • 2022-11-23
      • 1970-01-01
      • 2020-11-09
      • 1970-01-01
      • 2020-07-23
      • 2017-10-22
      • 2021-10-17
      相关资源
      最近更新 更多