【发布时间】:2016-12-04 12:06:19
【问题描述】:
我想遍历一个文件并将每一行的内容放入一个深度嵌套的字典中,其结构由前导空格定义。这种愿望与记录在案的here 非常相似。我已经解决了这个问题,但现在遇到了处理重复键被覆盖而不是被强制转换为列表的情况的问题。
基本上:
a:
b: c
d: e
a:
b: c2
d: e2
d: wrench
当它应该被转换成{"a":{"b":"c2","d":"wrench"}}时被转换成
{"a":[{"b":"c","d":"e"},{"b":"c2","d":["e2","wrench"]}]}
一个独立的例子:
import json
def jsonify_indented_tree(tree):
#convert indentet text into json
parsedJson= {}
parentStack = [parsedJson]
for i, line in enumerate(tree):
data = get_key_value(line)
if data['key'] in parsedJson.keys(): #if parent key is repeated, then cast value as list entry
# stuff that doesn't work
# if isinstance(parsedJson[data['key']],list):
# parsedJson[data['key']].append(parsedJson[data['key']])
# else:
# parsedJson[data['key']]=[parsedJson[data['key']]]
print('Hey - Make a list now!')
if data['value']: #process child by adding it to its current parent
currentParent = parentStack[-1] #.getLastElement()
currentParent[data['key']] = data['value']
if i is not len(tree)-1:
#determine when to switch to next branch
level_dif = data['level']-get_key_value(tree[i+1])['level'] #peek next line level
if (level_dif > 0):
del parentStack[-level_dif:] #reached leaf, process next branch
else:
#group node, push it as the new parent and keep on processing.
currentParent = parentStack[-1] #.getLastElement()
currentParent[data['key']] = {}
newParent = currentParent[data['key']]
parentStack.append(newParent)
return parsedJson
def get_key_value(line):
key = line.split(":")[0].strip()
value = line.split(":")[1].strip()
level = len(line) - len(line.lstrip())
return {'key':key,'value':value,'level':level}
def pp_json(json_thing, sort=True, indents=4):
if type(json_thing) is str:
print(json.dumps(json.loads(json_thing), sort_keys=sort, indent=indents))
else:
print(json.dumps(json_thing, sort_keys=sort, indent=indents))
return None
#nested_string=['a:', '\tb:\t\tc', '\td:\t\te', 'a:', '\tb:\t\tc2', '\td:\t\te2']
#nested_string=['w:','\tgeneral:\t\tcase','a:','\tb:\t\tc','\td:\t\te','a:','\tb:\t\tc2','\td:\t\te2']
nested_string=['a:',
'\tb:\t\tc',
'\td:\t\te',
'a:',
'\tb:\t\tc2',
'\td:\t\te2',
'\td:\t\twrench']
pp_json(jsonify_indented_tree(nested_string))
【问题讨论】:
-
您希望它们始终是一个列表,或者如果只有一个元素,则只是一个字典?我,我总是会做一个列表,只使用
defaultdict -
输入看起来更像是一个有向多重图,而不是树,而输出是一个字典,而不是 json。数组中的最后一个元素不称为叶子。您没有指定多级缩进应该发生什么,只有 2 级应该形成字符串 dicts 列表的 dict ..您能否尝试使您的意图(业务逻辑)更清晰?
-
输入格式在某处有名称/规格吗?
-
好点@Aprillion。输出是一个字典,虽然我打算把它变成 json。我的例子可能太短了,但那是因为它引用了这个 post 和水果例子。如果这不能说明问题,我可以改进我正在使用的实际数据来制作一个更强大的示例
-
看起来一个答案消失了,有一点很好,
isinstance(parsedJson[data['key']],list)应该在data['key'] in parsedJson前面,以避免KeyError异常...
标签: python json parsing data-structures nested