python scipy/numpy中的多项式pmf答案

【问题标题】：multinomial pmf in python scipy/numpypython scipy/numpy中的多项式pmf
【发布时间】：2012-12-03 22:40:10
【问题描述】：

scipy/numpy 中是否有用于获取多项式 PMF 的内置函数？我不确定binom 是否以正确的方式概括，例如

# Attempt to define multinomial with n = 10, p = [0.1, 0.1, 0.8]
rv = scipy.stats.binom(10, [0.1, 0.1, 0.8])
# Score the outcome 4, 4, 2
rv.pmf([4, 4, 2])

这样做的正确方法是什么？谢谢。

【问题讨论】：

为了完整起见，scipy 有一个类scipy.stats.multinomial，它从版本 0.19.0（2017 年 3 月）开始实现多项分布。这是文档的链接：docs.scipy.org/doc/scipy/reference/generated/…

标签： python numpy scipy probability scientific-computing

【解决方案1】：

据我所知，没有内置函数，并且二项式概率不能泛化（您需要对一组不同的可能结果进行归一化，因为所有计数的总和必须为 n 不会被采用由独立的二项式处理）。但是，实现自己相当简单，例如：

import math

class Multinomial(object):
  def __init__(self, params):
    self._params = params

  def pmf(self, counts):
    if not(len(counts)==len(self._params)):
      raise ValueError("Dimensionality of count vector is incorrect")

    prob = 1.
    for i,c in enumerate(counts):
      prob *= self._params[i]**counts[i]

    return prob * math.exp(self._log_multinomial_coeff(counts))

  def log_pmf(self,counts):
    if not(len(counts)==len(self._params)):
      raise ValueError("Dimensionality of count vector is incorrect")

    prob = 0.
    for i,c in enumerate(counts):
      prob += counts[i]*math.log(self._params[i])

    return prob + self._log_multinomial_coeff(counts)

  def _log_multinomial_coeff(self, counts):
    return self._log_factorial(sum(counts)) - sum(self._log_factorial(c)
                                                    for c in counts)

  def _log_factorial(self, num):
    if not round(num)==num and num > 0:
      raise ValueError("Can only compute the factorial of positive ints")
    return sum(math.log(n) for n in range(1,num+1))

m = Multinomial([0.1, 0.1, 0.8])
print m.pmf([4,4,2])

>>2.016e-05

我对多项式系数的实现有点幼稚，并且在对数空间中工作以防止溢出。另请注意，n 作为参数是多余的，因为它是由计数的总和给出的（并且相同的参数集适用于任何 n）。此外，由于对于中等 n 维或大维度，这将很快下溢，因此您最好在日志空间中工作（这里也提供了 logPMF！）

【讨论】：