【发布时间】:2020-10-08 03:54:42
【问题描述】:
我有一个 LSTM 数据集。一些标签最后包含 NaN,不能向后填充(因为它们后面没有值)并且向前填充它们没有意义(因为标签时间戳将在“较近的将来”时间戳中被弃用(=缺失值locatoin) 与其实际时间索引相比)
那么:有没有办法屏蔽 LABEL-set(/Output-set) 中的 NaN 值? (因为 sample_weights 看起来只适用于输入数据)。
【问题讨论】:
-
A) 我阅读了 github 文档,但不明白
interval做了什么,你能解释一下 @AtherCheema -
B) 不能跳过整个样本。我更多地想到了一些东西,比如只为标签提供一个掩码 2d 数组。有可能吗
-
不能跳过是什么意思?如果某些样本/示例的标签不可用,则无法计算这些样本的损失。您必须在数据准备期间跳过这些样本,或者在损失计算期间必须跳过这些样本。对于第二种情况,您将编写自定义训练循环,在损失计算期间跳过这些样本。如果您喜欢使用
dl_ts_prediction,我可以为您提供这两种情况的工作示例,前提是这是您想要的? -
所以如果我有一个像 [0.123, 0.437, 0.891, NaN, 1,497, 1.1] 这样的标签样本是不可能的。只训练有效数字?
标签: python tensorflow machine-learning keras lstm