【问题标题】:H2O Flow date issue and splitH2O Flow 日期问题和拆分
【发布时间】:2019-08-22 06:11:03
【问题描述】:

我在上传时间序列数据时使用的是 H2O Flow,它将日期转换为数字,例如 1.07317E+12。我使用的是 2004-02-01 和 01/02/2004。我不知道如何解决这个问题。我看到一些音符被击中,但没有帮助。

h2o.ai - Flow UI not detecting date formatting to convert to Time

第二个问题,h20 flow split frame 自动打乱数据。有没有办法阻止它?我知道在 R 中我们可以输入 shuffle=FALSE。但是如何在 H2O Flow 中做到这一点,因为它在拆分为训练和测试时会给时间序列数据带来问题。

【问题讨论】:

    标签: h2o


    【解决方案1】:

    如果您想更好地控制数据的拆分方式,我建议您使用 H2O R 或 Python API。目前,Flow 只能选择随机拆分。

    Flow 正在将您的时间列转换为自 Unix 纪元以来的毫秒数。在 Python 和 R API 中进行了更新,因此当您查看框架时,您会看到更易于阅读的格式。

    如果您想了解这些功能(拆分数据帧和原始时间格式的更多方法),可以在此处创建 JIRA 票证:http://jira.h2o.ai。 H2O-3 是开源的,并接受社区的功能请求。

    但同样,最快的选择是使用 Python 或 R API,因为那里存在您想要的功能。

    【讨论】:

    • 非常感谢您的宝贵意见。我认为如果他们添加选项来控制 h2o 流中的随机播放将非常有用。
    • 没问题!您是否能够为您的两个问题创建 JIRA 票证?可以在此处找到有关如何创建 JIRA 票证的说明:github.com/h2oai/h2o-3#21-issue-tracking-and-feature-requests
    • 再次感谢分享链接。我没有 JIRA 票的经验,但我会尝试。关于日期问题,我可以使用以下命令在 R 中修复它 test$date
    • 如果您使用的是最新版本的 H2O,则不必修复日期格式,它应该会自动处理。但是,是的,如果您使用的是旧版本,您可能仍然会看到该问题。如果您可以为时间问题和拆分问题创建 JIRA,那就太棒了。再次感谢!
    • 我正在使用 h2o-3.26.0.2,我认为这是最新版本。如前所述,日期应采用这种格式 2004-02-01。但是日期问题仍然存在。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-09-02
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-11-08
    相关资源
    最近更新 更多