【发布时间】:2015-10-13 00:28:22
【问题描述】:
我有 JSON 值列表(实际上它是一个文本文件,其中每一行都是一个 JSON 对象)。像这样:
{ "id": 1, "name": "john", "age": 18, "education": "master" }
{ "id": 2, "name": "jack", "job": "clerk" }
...
某些值可能会丢失(例如,第一项没有“工作”值,第二项没有“教育”和“年龄”)。
我需要在 R 中创建数据框并将所有缺失的列值填充为 NA(如果具有唯一名称的字段至少存在于一行中)。如何更轻松地实现这一目标?
我已经完成的 - 我安装了“rjson”包并将这些行解析为 R 列表。假设 lines 变量是行的字符向量。
library(rjson)
lines <- // initialize "lines" var here
jsons <- sapply(lines, fromJSON)
“jsons”变量变为“列表列表”(每个 JSON 对象都转换为 R 术语中的列表)。怎么转成data.frame?
我想查看我提供的示例的以下数据框:
"id" | "name" | "age" | "education" | "job"
-------------------------------------------
1 | "john" | 18 | "master" | NA
2 | "jack | NA | NA | "clerk"
【问题讨论】: