【发布时间】:2020-10-16 15:08:23
【问题描述】:
我有一个这样的数据框。
my_df = pd.DataFrame({'A' : [0.1,0.15,0.22,0.2], 'B' : [0.9,0.85,0.78,0.8]})
my_df
# normality test
stat, p = shapiro(my_df)
print('Statistics=%.3f, p=%.3f' % (stat, p))
夏皮罗检验表明数据不是高斯分布。
如何更改我的数据框,以便它获得两个新列(即现有两列的四个特征)以及遵循正态/高斯分布的新值?
【问题讨论】:
-
你能根据样本输入分享预期的输出吗?
-
我不太明白。新输出应该是为 A 列和 B 列中的现有值计算的新值。
-
新列应该如何连接到非正常的现有列?
-
这是我不知道的。我想可以通过某些函数来获得标准化值。
-
为什么不简单地生成新的常态?
标签: python pandas numpy dataframe