【发布时间】:2018-05-29 15:15:09
【问题描述】:
我有一个时间序列数据,每分钟都有数据,但由于传感器的一些问题,有时数据没有被提取并且没有记录那一分钟的数据。我想找出这件事发生在哪一天和哪一小时。我有熊猫数据框中的数据。这是我存储在数据框中的代码 sn-p,我想显示未收到的分钟数据。
l=['Year', 'Month', 'Day', 'Hour', 'Minute']
df = pd.DataFrame(columns=l)
k=0
if __name__ == '__main__':
client = MongoClient("localhost", 27017, maxPoolSize=50)
db=client.test
collection=db['data']
cursor = collection.find({"deviceId":3},{"timestamp":1,"cd":1}).sort("timestamp",-1).limit(1000)
for document in cursor:
for key,value in document.items()[1:-1]:
df.loc[k,'Year']=2017
df.loc[k,'Month']=value.month
df.loc[k,'Day']=value.day
df.loc[k,'Hour']=value.hour
df.loc[k,'Minute']=value.minute
k=k+1
minute_a = pd.Series(np.arange(0, 60))
我想通过minute_a 来使用isin 函数,但由于我必须每小时检查一次,我不知道该怎么做?
【问题讨论】: