【发布时间】:2015-07-03 14:03:00
【问题描述】:
我有一个结构如下图所示的模型:
我有几个人(在这张图片中索引为 1...5)。人口参数(A 和 B,但可以有更多)确定每个个体潜在变量 L[i] 的分布。潜变量L[i] 以概率方式确定观察X[i]。这个模型是“稀疏的”,因为大多数节点没有直接连接它们的边。
我正在尝试使用 PyMC 来推断总体参数以及每个人的潜在变量。 (一个更详细地描述了我的具体场景的相关问题是here。)我的问题是:我应该使用 Adaptive Metropolis 而不是另一种方法,如果是,是否有任何“技巧”来分组随机变量正确吗?
如果我正确理解 Adaptive Metropolis 采样(我可能不会...),该算法会通过考虑这些变量如何为未知数(A、B 和所有到目前为止,在运行中构建的后验分布中是相关的。如果A 和B 负相关,则增加A 的提案将倾向于减少B,反之亦然,以增加提案被接受的机会。
问题是,在这个模型中,每个L[i] 都是从A 和B 确定的基础人口分布中独立抽取的。因此,虽然它们会被视为在后验中相关,但这些相关性实际上仅归因于 A 和 B,因此它们在某种程度上是“混淆”。所以当我调用函数时,
M.use_step_method(pymc.AdaptiveMetropolis, stochastics)
所有L[i] 是否应该一起出现在随机指标列表中?或者我应该多次调用 use_step_method,每次都使用stochastics=[A, B, L[i]] 来获取L[i] 之一?我的想法是,为不同的随机变量组多次调用该函数将构建问题,并通过告诉 PyMC 只关注重要的相关性来使 PyMC 更容易。这是正确的吗?
【问题讨论】:
标签: python algorithm bayesian pymc mcmc