【问题标题】:Serialising a function object with attributes, one attribute missing when loading序列化具有属性的函数对象,加载时缺少一个属性
【发布时间】:2019-07-11 14:38:44
【问题描述】:

我在 python 3.7 中使用 dill,但是当我稍后重新加载它时,函数的属性之一丢失了。

我有一个名为 session 的类,我在程序退出时保存,在启动时加载。此对象间接包含Tranform 实例,这些实例具有引用特定函数的function 属性。该函数设置了几个属性。

当我在保存会话时使用调试器时,我可以看到特定属性存在并设置为None。但是当我加载一个保存的会话时,一切都很好,只是这个属性消失了。

这是保存代码:

def save(self):
    print ('\n SAVING SESSION STATE, DO NOT EXIT')
    breakpoint()

    sessionDirectory='__PETL__'
    if not os.path.exists(sessionDirectory):
        os.makedirs(sessionDirectory)
    with open(sessionDirectory+'/'+self.name, 'wb') as f: 
        dill.dump(self,f)
    print ('\nSession Saved, exiting')

这是加载代码:

def loadSession(self, sessionName):
    if (Session.dontLoad):
        print ('Creating New Session')
        return None
    try:
        with open('__PETL__/'+ sessionName, 'rb') as f:
            session=dill.load(f)
    except FileNotFoundError:
        print ('No session found, creating new one')
        return None

    return session

这里是调试器的输出:

保存:

> /home/osboxes/stage/inspireDataBase2/migrations/src/session/session.py(160)save()
-> sessionDirectory='__PETL__'
(Pdb) print( self.transforms[0].transform.function.queryRes)
None
(Pdb) print (dir(self.transforms[0].transform.function)[-9:])
['after', 'args', 'columns', 'fetch', 'indexs', 'query', 'queryRes', 'sameorderasafter', 'transformvar']
(Pdb) dill.dumps(self.transforms[0].transform.function)
b'\x80\x03cuserTransformModulePreparsed\ntransform__constru__buildinggeometry2d\nq\x00.'
(Pdb) c
Session Saved, exiting

加载中:

> /home/osboxes/stage/inspireDataBase2/migrations/src/session/session.py(39)__init__()
-> session.printJobDone()
(Pdb) print( self.transforms[0].transform.function.queryRes)
*** AttributeError: 'function' object has no attribute 'queryRes'
(Pdb) print( session.transforms[0].transform.function.queryRes)
*** AttributeError: 'function' object has no attribute 'queryRes'
(Pdb) print (dir(session.transforms[0].transform.function)[-9:])
['__subclasshook__', 'after', 'args', 'columns', 'fetch', 'indexs', 'query', 'sameorderasafter', 'transformvar']

如您所见,其他属性按预期工作。

由于保存部分是我在项目中做的最后一件事,我想我只是不明白 dill 是如何工作的。该属性与另一个不同,因为该属性是在另一个类中设置的(与函数不在同一个模块中)。其他属性直接在函数的模块中设置。这就是说,模块是通过编译一个AST树获得的,但我不明白为什么会出现问题。

而且我看到确实在第一个输出中,在 dill 输出中只有对函数模块的引用(但我不知道 dill 是如何工作的,也许这是正常的)。

【问题讨论】:

  • 这些属性通常是如何设置的?我强烈怀疑您看到的“已恢复”属性实际上是在您导入模块时设置的(或者在启动和运行dill.load() 之间的某个其他时间点已经在函数对象上设置)。提示:调试函数属性时,请使用sorted(vars(func))(仅属性名称)或vars(func)(完整属性字典),而不是dir()。后者添加了所有函数可用的属性。
  • 请马丁给点小费!我将编辑问题以回答您的问题。

标签: python python-3.x pickle dill


【解决方案1】:

dill 不捕获函数属性,不适用于可以直接导入的函数。您在加载时看到的任何属性由其他代码添加到该函数对象中,可能是在导入时。

dill.dumps() 存储的所有信息足以重新导入相同的函数对象;在userTransformModulePreparsed.transform__constru__buildinggeometry2d 的调试会话中。加载该序列化时,需要做的就是import userTransformModulePreparsed,然后使用该模块的transform__constru__buildinggeometry2d 属性。在这种情况下,函数被视为 singletons,每个 Python 进程只需要存在一个副本。假设该对象的所有加载都由正常的import 进程处理。这包括添加到函数对象的属性!

dill 可以处理生成的函数对象,即任何不能直接导入的函数对象,此时它会捕捉到包括属性的功能。例如,在函数(嵌套函数)内部使用def 将始终在每次调用父函数时创建一个新的、单独的函数对象。序列化此类对象的处理方式不同:

>>> import dill
>>> def foo():
...     def bar(): pass  # nested function
...     bar.spam = 'ham'
...     return bar
...
>>> foo()
<function foo.<locals>.bar at 0x110621e50>
>>> foo() is not foo()  # new calls produce new function objects
True
>>> bar = foo()
>>> vars(bar)   # the resulting function object has attributes
{'spam': 'ham'}
>>> bar_restored = dill.loads(dill.dumps(bar))
>>> vars(bar_restored)  # the attributes are preserved by dill
{'spam': 'ham'}
>>> bar.extra = 'additional'
>>> vars(dill.loads(dill.dumps(bar)))  # this extends to new attributes added later.
{'spam': 'ham', 'extra': 'additional'}

所以你有两个选择;在导入时设置函数属性,在嵌套函数中生成函数。

【讨论】:

  • 谢谢伙计。不错的答案。 “莳萝不捕获函数属性”部分确实是我所说的意外得到你。
猜你喜欢
  • 1970-01-01
  • 2021-12-13
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2021-06-11
相关资源
最近更新 更多