【发布时间】:2017-10-19 08:29:38
【问题描述】:
我尝试将嵌套的 mongodb 结果读取到 pandas 数据框中。
数据如下所示。
{
"_id" : ObjectId("5911b9cebb56c016794d45a4"),
"crawlat" : "2017-05-09 14:45",
"traffic" : [
{
"timestamp" : "1494338401",
"organic" : 53
},
{
"timestamp" : "1494342001",
"organic" : 64
},
{
"timestamp" : "1494345601",
"organic" : 74
},
{
"timestamp" : "1494349201",
"organic" : 78
},
{
"timestamp" : "1494352801",
"organic" : 80
},
{
"timestamp" : "1494356401",
"organic" : 88
},
{
"timestamp" : "1494360001",
"organic" : 91
},
{
"timestamp" : "1494363601",
"organic" : 92
},
{
"timestamp" : "1494367201",
"organic" : 94
}
]
}
流量数组包含每个结果的 48 个条目。
我只对按数组顺序排列的“有机”值感兴趣。
我从
开始con = pymongo.MongoClient(['...:27017'])
collsitemap = con.sitemap.newssitemap
sitemapsdata = collsitemap.find({'traffic':{'$size':48}})
我使用 json_normalize 和
做了一些清理工作dfsitemap = dfsitemap['traffic'].apply(pd.Series)
现在结果是这样的
但我需要一张只有有机值的表格。我该如何清理这个?
【问题讨论】:
-
你的数据框中的两个维度是什么?
标签: python json mongodb pandas dataframe