如何计算 z 分数归一化？答案

【问题标题】：How to work out z-score normalisation?如何计算 z 分数归一化？
【发布时间】：2016-10-12 16:41:50
【问题描述】：

我对如何进行 z-score 标准化感到困惑。我找到了执行此操作的方程式，需要均值和标准差，但鉴于我的情况，我不确定如何解决。

我的系统中有 2 个分类器。要一起使用分数，我知道我需要对它们进行归一化，因为它们在尺度等方面会有所不同。我希望为此使用 z 分数归一化。我的问题是，鉴于两个分类器的 2 个分数，我需要对分数做什么以使 z-score 标准化？我希望能够组合/比较它们。

我（可能有缺陷！）的理解是，对于分类器分数集，我们使用均值和标准差。但是我们不能总是假设我们已经有了一个分数集来获得平均值和标准差，可以吗？

【问题讨论】：

标签： machine-learning classification normalization standardized

【解决方案1】：

要计算给定数字集的 z 分数，您需要计算样本均值和样本偏差。从每个分数中减去平均值并除以标准差。考虑下面的一组数字，其中每个观察值都是从 0 到 100 的测试分数。

{40, 50, 60, 55, 70, 80, 90}

如果您想比较它们的另一组测试分数，其中测试分数范围从 0 到 250，例如：

{100, 115, 214, 50, 200, 80, 90}

您无法直接比较它们。 IE。第二盘80分明显低于第一盘80分（80/250 vs 80/100）。一种方法是使用 z 分数。他们的计算如下：

求平均值

第一组的平均值是：63.57143 第二组的平均值是：121.2857
从每个分数中减去样本均值。这将为您提供一组以零为中心的数字。

{-23.571429, -13.571429, -3.571429, -8.571429, 6.428571, 16.428571, 26.428571} {-21.285714, -6.285714, 92.714286, -71.285714, 78.714286, -41.285714, -31.285714}
计算与原始集合的标准差，并将“居中”分数除以该数字：

设置 1 sigma = 17.49149

设置 2 sigma = 61.98041

这被计算为：

{-1.3475937，-0.7758873，-0.2041809。 -0.4900341, 0.3675256, 0.9392320, 1.5109384} {-0.3434265, -0.1014145, 1.4958643, -1.1501330, 1.2699865, -0.6661091, -0.5047678}

现在你有两组数字可以直接比较。零值意味着它是集合的平均值。比集合平均值高 1 个标准差的值。值为 -1 表示它比平均值低一个标准差，依此类推。

【讨论】：

谢谢。但是在我的问题中，我问如果我得到 2 个分类器分数，我怎么能做到这一点？如何仅从两个分类器分数计算平均值？我无法生成 n 个分数来标准化它们，我希望立即比较这 2 个分数。