【问题标题】:Parsing Erlang data to Python dictionary将 Erlang 数据解析为 Python 字典
【发布时间】:2019-12-31 13:35:19
【问题描述】:

我有一个 erlang 脚本,我想从中获取一些数据并将其存储在 python 字典中。 解析脚本很容易得到这样的字符串:

    {userdata,
     [{tags,
       [#dt{number=111},
        #mp{id='X23.W'}]},
      {log,
       'LG22'},
      {instruction,
       "String that can contain characters like -, _ or numbers"}
     ]
    }.

想要的结果:

userdata = {"tags": {"dt": {"number": 111}, "mp": {"id": "X23.W"}},
            "log": "LG22",
            "instruction": "String that can contain characters like -, _ or numbers"}
# "#" mark for data in "tags" is not required in this structure. 
# Also value for "tags" can be any iterable structure: tuple, list or dictionary.

但我不确定如何将这些数据传输到 python 字典中。我的第一个想法是使用json.loads,但它需要许多修改(将单词放入引号中,将“,”替换为“:”等等)。

此外,userdata 中的键不限于某个池。在这种情况下,有“标签”、“日志”和“指令”,但可以有更多,例如。 “标语”、“标识”等 另外,我不确定订单。我假设键可以随机出现。

我的代码(它不适用于id='X23.W',所以我从输入中删除了“.”):

import re
import json
in_ = """{userdata, [{tags, [#dt{number=111}, #mp{id='X23W'}]}, {log, 'LG22'}, {instruction, "String that can contain characters like -, _ or numbers"}]}"""

buff = in_.replace("{userdata, [", "")[:-2]

re_helper = re.compile(r"(#\w+)")
buff = re_helper.sub(r'\1:', buff)

partition = buff.partition("instruction")
section_to_replace = partition[0]
replacer = re.compile(r"(\w+)")
match = replacer.sub(r'"\1"', section_to_replace)
buff = ''.join([match, '"instruction"', partition[2]])
buff = buff.replace("#", "")
buff = buff.replace('",', '":')

buff = buff.replace("}, {", "}, \n{")
buff = buff.replace("=", ":")
buff = buff.replace("'", "")
temp = buff.split("\n")
userdata = {}
buff = temp[0][:-2]
buff = buff.replace("[", "{")
buff = buff.replace("]", "}")

userdata .update(json.loads(buff))
for i, v in enumerate(temp[1:]):
    v = v.strip()
    if v.endswith(","):
        v = v[:-1]
    userdata .update(json.loads(v))

print(userdata)

输出:

{'tags': {'dt': {'number': '111'}, 'mp': {'id': 'X23W'}}, 'instruction': 'String that can contain characters like -, _ or numbers', 'log': 'LG22'}

【问题讨论】:

  • 你想要的结果不是有效的python。
  • 就不能直接用erlang把结果吐出python能看懂的形式吗?喜欢 JSON?
  • “很容易解析脚本来获取这样的字符串”你到底是什么意思,通过“解析脚本?”比如源代码?
  • @Wombatz 哦,是的!你说的对!对不起那个错误! tags 的值应该是字典然后:"tags": {"dt": {"number": 111}, "mp": {"id": "X23.W"}} @AlekseiMatiushkin 我不想在我的应用程序中使用 erlang。 @juanpa.arrivillaga 是的。我的输入是一些用 erlang 编写的代码。我正在解析“.erl”文件以从中获取数据。

标签: python json dictionary erlang


【解决方案1】:
import json
import re
in_ = """{userdata, [{tags, [#dt{number=111}, #mp{id='X23.W'}]}, {log, 'LG22'}, {instruction, "String that can contain characters like -, _ or numbers"}]}"""


qouted_headers = re.sub(r"\{(\w+),", r'{"\1":', in_)
changed_hashed_list_to_dict = re.sub(r"\[(#.*?)\]", r'{\1}', qouted_headers)

hashed_variables = re.sub(r'#(\w+)', r'"\1":', changed_hashed_list_to_dict)
equality_signes_replaced_and_quoted = re.sub(r'{(\w+)=', r'{"\1":', hashed_variables)
replace_single_qoutes = equality_signes_replaced_and_quoted.replace('\'', '"')

result = json.loads(replace_single_qoutes)
print(result)

生产:

{'userdata': [{'tags': {'dt': {'number': 111}, 'mp': {'id': 'X23.W'}}}, {'log': 'LG22'}, {'instruction': 'String that can contain characters like -, _ or numbers'}]}

【讨论】:

  • 我没有注意到您已经在使用正则表达式组替换。我主要关注字符串替换,很抱歉,从答案中删除了无用的参考。无论如何,很高兴我提供了帮助。
猜你喜欢
  • 2021-05-01
  • 1970-01-01
  • 1970-01-01
  • 2018-02-11
  • 2021-08-13
  • 1970-01-01
  • 2013-06-30
  • 2011-01-29
  • 1970-01-01
相关资源
最近更新 更多