【问题标题】:How to train a model on a data where there are multiple data inside a data point?如何在数据点内有多个数据的数据上训练模型?
【发布时间】:2019-08-01 17:17:41
【问题描述】:

我正在尝试对容量列进行预测,但是每个数据点都包含更多数据。

我尝试分解数据集并将容量值复制到每一行,但情况并非如此,因为每一行都会得到不同的容量预测值。有没有办法训练这种数据集?

【问题讨论】:

  • 一个非常相关的问题是:为什么每个数据点都有多个数据点?这些值是否按容量分组?每个嵌套数据元素与预测目标有何关系?
  • 其实每个数据点代表一个循环数据。每个循环都有 a 容量。每个周期都会运行一段时间,在这段时间内会收集一些数据,这些数据取决于容量
  • 您可以尝试在Data Science stack 网站上提问,因为他们可以更深入地了解理论和技术,而 stackoverflow 更多的是关于特定的编码问题,您可能会在那里找到更多领域的人- 特定的经验或知识

标签: python machine-learning data-science


【解决方案1】:

每个条目的大小是否一致?如果是这样,您可以将数据集分解为不同的列(current_battery0、current_battery1、...),每个列都是不同的预测变量。您可能会以这种方式丢失一些信息,但这可能对您有用。

【讨论】:

  • 不,大小不一致。
【解决方案2】:

图片未显示。但是,如果每个数据点 A 包含更多数据点 A={a1,a2,a3,..an} 尝试取这些点 {a1,a2,a3,..an} 的平均值或中位数并分配结果对 A 的价值: A=平均值或中位数 {an}

【讨论】:

  • 我认为这不是一个好主意。在那我丢失了很多信息
猜你喜欢
  • 2020-12-15
  • 2020-08-11
  • 2018-05-01
  • 2021-10-16
  • 1970-01-01
  • 2018-10-23
  • 2020-10-22
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多