【发布时间】:2016-08-02 17:31:34
【问题描述】:
我相信它是使用 R 或 SAS 或其他东西生成的。我想确保我理解它所描绘的内容并从头开始重新创建它。
我了解左侧的 ROC 曲线,并且我使用我的概率模型在不同的阈值下生成了我自己的曲线。
我不明白的是右手边的图表。 “成本”函数是什么意思?有哪些单位?我假设标记为“阈值”的 x 轴是我在 ROC 中使用的成功截止阈值。我唯一的猜测是 Y 轴是残差平方和?但是如果是这样的话,我必须在每次阈值迭代后得到残差?
请解释一下轴是什么以及如何计算它们。
--编辑-- 为了清楚起见,我不需要证明或一行代码。因为我使用不同的统计软件,所以让某人从概念上(用最少的术语)解释如何计算 Y 轴会更有用。这样我就可以用我的软件语言来编写它。
谢谢
【问题讨论】:
-
这是一个针对 Data Science SE 或 Cross Validated 的问题。
-
这可以在R中的
ggplot2包的帮助下绘制。 -
好的,谢谢您的意见。实际上,我不使用 R,我使用不同的统计软件,所以我对这个图表的概念方面更感兴趣,这样我就可以使用我的软件完成这些步骤。因此,如果 R 社区的某个人可以解释该软件包的作用(如我上面的帖子所述),那将是理想的。
-
这里是r-bloggers.com/illustrated-guide-to-roc-and-auc 它与您在此处显示的地段相同。希望这有助于理解这个概念。
-
我通读了一遍,似乎只有这部分讨论了右手边的图:“成本函数和 ROC 点的相应着色说明最佳 FPR 和 TPR 组合由相关联的成本。” -- 但不幸的是,我仍然不知道单位是什么,也不知道 x 或 y 轴是如何计算的。例如,r-bloggers 的文章一直在谈论“成本”,但我不知道这是指什么。
标签: r statistics data-science