【问题标题】:Transforming a variable (with many data points close to the max and min) into uniform distribution?将变量(具有接近最大值和最小值的许多数据点)转换为均匀分布?
【发布时间】:2020-04-28 19:29:37
【问题描述】:
我需要在 R 中制作一些模型,但我的一些预测器遇到了一些问题。它们分布在 0 和 1 之间,它们给出了土地覆盖类型的百分比。例如。 0.3 表示 30% 的区域被森林覆盖。
这是其中一个的直方图和密度图:
histogram
density plot
我想将这些预测变量转换为 R 内的均匀分布(它不必是完美的)。我不知道要使用什么转换,因为有很多数据点接近它们的最大值和最小值。
感谢任何帮助,谢谢!
【问题讨论】:
标签:
r
dataset
transformation
【解决方案1】:
我不清楚为什么需要这样做 - 大多数统计方法不会对预测变量的分布提出要求 - 但是
rank(x)/(length(x)+1)
将为您提供一个新变量,该变量均匀分布在 0 和 1 之间(并且永远不会恰好是 0 或 1)