【发布时间】:2021-12-15 12:36:54
【问题描述】:
如何创建一个结合data1, data2 and data3 的函数。该代码必须结合所有与所有 3 个数据集共有的列,因此 data1 中的 Low 与 data2/3 不常见,因此将被排除在外。数据以同步顺序排序,每一行必须是唯一的,没有两个日期可以相同。在 data2 data3 中包含日期的行:2021-10-21 00:03:00 但只有一行数据在输出中,因为它不是唯一的行。我怎么能做这个代码?
import pandas as pd
import numpy as np
import functools
data1 =pd.read_csv('dataset1.csv', low_memory=False)
data2 =pd.read_csv('dataset2.csv', low_memory=False)
data3 ==pd.read_csv('dataset3.csv', low_memory=False)
数据1 csv:
Unix Timestamp date Symbol Open High Low
1444311600000 2015-10-08 13:40:00 BTCUSD 10384.54 10389.08 10340.2
1444311660000 2015-10-08 13:41:00 BTCUSD 10389.08 10389.08 10332.8
1444311720000 2015-10-08 13:42:00 BTCUSD 10387.15 10388.36 10385
数据2 csv:
Unix Timestamp Date Symbol Open High
1634774460000 2021-10-21 00:01:00 BTCUSD 4939.95 4939.97
1634774520000 2021-10-21 00:02:00 BTCUSD 4959.18 4961.75
1634774580000 2021-10-21 00:03:00 BTCUSD 4964.33 4964.33
数据3 csv:
Unix Timestamp Date Symbol Open High
1634774580000 2021-10-21 00:03:00 BTCUSD 4964.33 4964.33
1634774640000 2021-10-21 00:04:00 BTCUSD 4800.2 4867.47
预期输出:
Unix Timestamp date Symbol Open High
1444311600000 2015-10-08 13:40:00 BTCUSD 10384.54 10389.08
1444311660000 2015-10-08 13:41:00 BTCUSD 10389.08 10389.08
1444311720000 2015-10-08 13:42:00 BTCUSD 10387.15 10388.36
1634774460000 2021-10-21 00:01:00 BTCUSD 4939.95 4939.97
1634774520000 2021-10-21 00:02:00 BTCUSD 4959.18 4961.75
1634774580000 2021-10-21 00:03:00 BTCUSD 4964.33 4964.33
1634774640000 2021-10-21 00:04:00 BTCUSD 4800.2 4867.47
【问题讨论】:
标签: python pandas numpy datetime func