【问题标题】:Time series data modelling in pythonpython中的时间序列数据建模
【发布时间】:2020-01-20 06:43:45
【问题描述】:

我有一个数据集,其中日期(yyyy/mm/dd)、小时和输出是三列。我可以将此数据建模为时间序列数据,以使用 ARIMA 或任何其他算法将输出预测为日期和小时的函数吗?

【问题讨论】:

  • 简而言之-是的。您在这里要解决的具体挑战是什么?
  • 我对数据科学和 M L 很陌生,我无法理解如何将这些数据建模为 ARIMA 模型,因为 ARIMA 是单变量的。由于我在这里将输出作为两个变量的函数,所以我不知道如何在 python 中对其进行建模。如果您能告诉我如何在 python 中执行此操作,那就太好了。谢谢!
  • 您需要将日期和时间列合并为一个 datetime 格式的列。请参阅答案中的示例。如果有帮助,请接受。
  • 请提供一个最小的、可重复的示例:stackoverflow.com/help/minimal-reproducible-example

标签: python data-science


【解决方案1】:

这是一个例子。它假设数据被导入到 pandas 数据框中。我想你对 pandas 很熟悉。

import pandas as pd
data = [{'date': "2019/12/29", 'hour': 12, 'output': 42},
        {'date': "2019/12/30", 'hour': 10, 'output': 36},
        {'date': "2019/12/31", 'hour': 23, 'output': 48}]
df=pd.DataFrame(data)  # build DataFrame (do this with your data).

df['time'] = df.date + ' ' + df.hour.astype(str)  # create date+time string
df['time'] = pd.to_datetime(df.time, format='%Y/%m/%d %H') # convert to datetime format

print(df)
         date  hour  output                time
0  2019/12/29    12      42 2019-12-29 12:00:00
1  2019/12/30    10      36 2019-12-30 10:00:00
2  2019/12/31    23      48 2019-12-31 23:00:00

因此,您将获得datetime 格式的时间标签,可供进一步分析。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2016-08-29
    • 2014-11-18
    • 2020-07-04
    • 2012-11-16
    • 2021-01-19
    • 2013-07-16
    • 1970-01-01
    相关资源
    最近更新 更多