【发布时间】:2016-09-02 15:51:42
【问题描述】:
我在 Pandas 中有一个包含很多零的大型数据框。 我想应用附加平滑,但不是从头开始编写,而是想知道是否有更好的方法在 Pandas 中生成“平滑”数据帧。谢谢!
【问题讨论】:
标签: python pandas machine-learning smoothing naivebayes
我在 Pandas 中有一个包含很多零的大型数据框。 我想应用附加平滑,但不是从头开始编写,而是想知道是否有更好的方法在 Pandas 中生成“平滑”数据帧。谢谢!
【问题讨论】:
标签: python pandas machine-learning smoothing naivebayes
加法平滑只是一个基本的数学运算,只需要很少的加法和除法 - 没有“特殊”功能,您只需编写一个单线操作数据帧的特定列。
【讨论】:
df['smooth_count'] = df['count'].apply(lambda v: (v+alpha)/(N+alpha*d)*N),其中d = len(df['count']),但N,试验次数,可能不是df['count'].sum(),并且alpha,平滑参数,由用户决定(默认值:1)。考虑为这两个使用什么需要更多的努力,而不是编写方程式......