【问题标题】:pyyaml: dumping without tagspyyaml:不带标签的倾销
【发布时间】:2010-12-29 08:22:48
【问题描述】:

我有

>>> import yaml
>>> yaml.dump(u'abc')
"!!python/unicode 'abc'\n"

但我想要

>>> import yaml
>>> yaml.dump(u'abc', magic='something')
'abc\n'

什么魔法参数强制不标记?

【问题讨论】:

    标签: python yaml pyyaml


    【解决方案1】:

    您可以使用safe_dump 代替dump。请记住,那时它将无法表示任意 Python 对象。此外,当您 load YAML 时,您将获得 str 对象而不是 unicode

    【讨论】:

    • safe_dump 似乎在最后强制使用“...”,但这很容易解决
    • @ATOzTOA 我不确定你在问什么,但也有safe_dump_all
    • @interjay 是的,对。我试过了,但我有一个对象,而不是字符串。有道理。
    • safe_dump 对我根本不起作用。
    【解决方案2】:

    这个怎么样:

    def unicode_representer(dumper, uni):
        node = yaml.ScalarNode(tag=u'tag:yaml.org,2002:str', value=uni)
        return node
    
    yaml.add_representer(unicode, unicode_representer)
    

    这似乎使转储 unicode 对象与我转储 str 对象的工作方式相同(Python 2.6)。

    In [72]: yaml.dump(u'abc')
    Out[72]: 'abc\n...\n'
    
    In [73]: yaml.dump('abc')
    Out[73]: 'abc\n...\n'
    
    In [75]: yaml.dump(['abc'])
    Out[75]: '[abc]\n'
    
    In [76]: yaml.dump([u'abc'])
    Out[76]: '[abc]\n'
    

    【讨论】:

    • 这适用于基本情况,但在某些情况下会混淆数据。此外,您应该在答案中提到该函数是在 yaml 而不是对象上调用的。
    【解决方案3】:

    您需要一个新的 dumper 类,它可以完成标准 Dumper 类所做的所有事情,但会覆盖 str 和 unicode 的表示器。

    from yaml.dumper import Dumper
    from yaml.representer import SafeRepresenter
    
    class KludgeDumper(Dumper):
       pass
    
    KludgeDumper.add_representer(str,
           SafeRepresenter.represent_str)
    
    KludgeDumper.add_representer(unicode,
            SafeRepresenter.represent_unicode)
    

    导致

    >>> print yaml.dump([u'abc',u'abc\xe7'],Dumper=KludgeDumper)
    [abc, "abc\xE7"]
    
    >>> print yaml.dump([u'abc',u'abc\xe7'],Dumper=KludgeDumper,encoding=None)
    [abc, "abc\xE7"]
    

    当然,我仍然不知道如何保持这个漂亮。

    >>> print u'abc\xe7'
    abcç
    

    它会破坏以后的 yaml.load()

    >>> yy=yaml.load(yaml.dump(['abc','abc\xe7'],Dumper=KludgeDumper,encoding=None))
    >>> yy
    ['abc', 'abc\xe7']
    >>> print yy[1]
    abc�
    >>> print u'abc\xe7'
    abcç
    

    【讨论】:

      【解决方案4】:

      除了 interjay 的出色答案之外,如果您注意文件编码,您可以保持重新加载 unicode。

      # -*- coding: utf-8 -*-
      import yaml
      import codecs
      
      data = dict(key = u"abcç\U0001F511")
      
      fn = "test2.yaml"
      with codecs.open(fn, "w", encoding="utf-8") as fo:
          yaml.safe_dump(data, fo)
      
      with codecs.open(fn, encoding="utf-8") as fi:
          data2 = yaml.safe_load(fi)
      
      print ("data2:", data2, "type(data.key):", type(data2.get("key")) )
      
      print data2.get("key")
      

      test2.yaml 我的编辑器中的内容:

      {key: "abc\xE7\uD83D\uDD11"}

      打印输出:

      ('data2:', {'key': u'abc\xe7\U0001f511'}, 'type(data.key):', <type 'unicode'>) abcç?

      另外,在阅读 http://nedbatchelder.com/blog/201302/war_is_peace.html 之后,我很确定 safe_load/safe_dump 无论如何都是我想去的地方。

      【讨论】:

        【解决方案5】:

        我刚开始使用 Python 和 YAML,但这可能也有帮助。只比较输出:

        def test_dump(self):
            print yaml.dump([{'name': 'value'}, {'name2': 1}], explicit_start=True)
            print yaml.dump_all([{'name': 'value'}, {'name2': 1}])
        

        【讨论】:

          猜你喜欢
          • 2014-02-23
          • 2012-04-14
          • 1970-01-01
          • 1970-01-01
          • 1970-01-01
          • 1970-01-01
          • 2017-08-20
          • 2016-01-08
          • 1970-01-01
          相关资源
          最近更新 更多