如何腌制 Python 类方法？答案

【问题标题】：How can I pickle a Python class method?如何腌制 Python 类方法？
【发布时间】：2019-03-02 02:19:14
【问题描述】：

在 Python 3.6 上，我定义了一个类 foo，它实例化了一个对象 p。在实例化时，该类执行计算量大的插值并将插值函数“附加”到对象。

完成此操作后，我可以调用其他类方法而无需再次进行插值。到目前为止，一切顺利。

下面的代码显示了一个最小的工作示例：

import numpy as np
from scipy.integrate import quad
from scipy.interpolate import interp1d

class foo(object):
    def __init__(self):
        self.func = self.interp()


    def interp(self):
        def integrand(x): return self.shape(x)

        xpoints = np.arange(100)
        ypoints = [quad(
                        integrand, a=-np.inf, b=np.inf
                        )[0]/x for x in xpoints]

        I = interp1d(xpoints, ypoints)
        return I


    def shape(self, x):
        F = x**2  # complicated maths here
        return F

然后我使用p 对象执行繁重的任务。我将其并行化以进行优化。我像这样使用multiprocessing 库：

import multiprocessing as mp

with mp.Pool(mp.cpu_count()) as pool:
    results = pool.map(func, list(bar))  # func uses my p instance

我得到一个错误MaybeEncodingError: Error sending result...，它的回溯指向我的插值函数不可提取。

我不知道如何腌制interp1d，而且我不想更改我当前代码的结构，因为这是经过深思熟虑的，我认为它是最有效的格式。我可以添加其他（几行）行来使我的插值函数成为顶级吗？

我尝试过使用joblib，它一直抱怨内存问题（即使使用了 1 个 cpu）。

就我而言，multiprocessing 确实可以胜任这项工作。它实际上完成了工作，在终端中输出结果，但未能将所有结果收集在一起。我正在并行化的迭代中的所有项目都是完全独立的。

【问题讨论】：

标签： python parallel-processing scipy multiprocessing joblib

【解决方案1】：

池使用多处理队列在进程之间传输数据。这些队列仅适用于可腌制数据。 Pickled 函数只是按名称存储并由 unpickler 重新导入。当然，这意味着它们必须是可导入的。

通常有一些方法可以解决这些酸洗问题，但请不要让自己头疼，而是安装pathos。它的多处理池使用dill，它几乎可以腌制任何东西。

【讨论】：

感谢您的建议，效果很好！我之前一直尝试单独使用dill，但无济于事。 pathos 正是我所需要的。我接受你的解决方案。