【问题标题】:Calculate the standard deviation of a cluster of datapoints计算一组数据点的标准差
【发布时间】:2019-09-18 17:15:35
【问题描述】:
所以,我有一个数据点列表,其中所有数据点都属于一个集群(每个项目都是一个具有 3 个特征的 numpy 数组(代表一个点))。我计算它们的质心(点的平均值)。我想计算一个点与质心的标准偏差。更准确地说,我想找出距离集群质心一个点有多少标准差。请帮我写代码。
我的数据点列表看起来像这样
([-5.75204079 8.78545302 8.00800119],....)
【问题讨论】:
标签:
python-3.x
k-means
standard-deviation
【解决方案1】:
假设集群中的数据点存储在名为data 的list 中,以下代码将计算该组数据的standard deviation。
# Calculate mean
mean = sum(data)/len(data)
# Calculate sum of square of difference
# of data points from mean
dev = 0
for rec in data:
dev += pow((rec - mean),2)
# Calculate variance
var = dev/len(data)
# Calculate standard deviation
std_dev = math.sqrt(var)