【问题标题】:Google Auto ML taking huge time for forcastingGoogle Automl 花费大量时间进行预测
【发布时间】:2021-10-25 04:02:19
【问题描述】:

我有大约 500 个时间序列数据集,为期 2.5 年,每个序列的粒度为 1 天。这相当于大约 100 万个数据点。 我想为每个时间序列以 1 天的粒度预测 2 周。这 500 个时间序列之间可能存在相关性。 在确保我拥有每个时间戳的数据之后,我们将这些 (500) 个时间序列提供给 autoML,其中每个时间序列都由“序列标识符”标识。 因此,我们对 autoML(预测)的输入是时间戳、系列标识符、特征和目标值。我有 30 个特征,它们是分类和数字的组合。 使用此设置,如果我向 autoML 提供数据,则需要 20 多个小时进行训练,这对我来说并不划算。

请帮我优化一下。

【问题讨论】:

    标签: time-series google-cloud-automl automl google-cloud-vertex-ai


    【解决方案1】:

    AutoML 是一个黑盒子。 您几乎无法优化训练时间,因为 AutoML 将在后台进行特征工程,并且会非常努力地不过度拟合您的数据。

    这里只有两个选择:

    • 使用具有最重要时间序列的较小数据集训练模型(这需要时间,因为 automl 必须努力避免过度拟合您的数据集)。

    • 如果对您有意义,请删除时间序列标识符。这使 autoML 有更多机会不过度拟合数据,并可能更早获得结果。

    请记住,您正在调整黑匣子。您的里程会有所不同。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2022-10-13
      • 1970-01-01
      • 2018-01-10
      • 2015-03-14
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多