【发布时间】:2018-12-07 06:13:36
【问题描述】:
我曾经通过以下格式的文件路径将数据文件从 s3 存储桶导入 H2O 流(版本 3.18.0.10):
importFiles ["s3a://ACCESS KEY:SECRET KEY@parvin-us-west1-data/Prod/154351418084_train/"]
更新到版本 3.22.0.2 后,我在相同的文件路径下收到以下错误。
Error calling GET /3/ImportFiles?path=s3a%3A%2F%2ACCESS KEY%3SECRET KEY%40parvin-us-west1-data%2FProd%2F154351418084_train%2F
--------------------
HTTP connection failure: status=error, code=500, error=Server Error
--------------------
现在它似乎需要不同的 s3 文件路径格式,是否有任何文档说明如何将带有凭据的 s3 文件路径传递给最新版本的 h2o?
更新:
更改配置后,我可以导入文件。运行 importfile 单元后,将显示以下内容。
1 / 1 个文件已导入。
文件 s3a://parvin-us-west1-data/Prod/154351418084_train/data.csv
但是,当我按下“解析这些文件”时,它会显示具有以下内容的新单元格,但没有任何进展:
setupParse source_frames: [ "s3a://parvin-us-west1-data/Prod/154351418084_train/data.csv"]
还在页面底部显示“请求 /3/ParseSetup”,但没有任何反应。即使它在 20 分钟后也没有给出超时错误。
终端日志的最后一行是: 1283 #71051-12 信息:POST /3/ParseSetup,参数:{source_frames=["s3a://parvin-us-west1-data/Prod/154351418084_train/data.csv"]}
关于没有此问题的版本 (3.18.0.10) 的注意事项:
按下“解析这些文件”后: 它会在一个单元格中提示以下信息:
setupParse source_frames: ["s3a://ACCESS KEY:SECRET KEY@parvin-us-west1-data/Prod/154351418084_train/data.csv"]
不同之处在于它还包括url的凭据部分。
更新:
我也尝试过以独立模式启动 h2o(使用 core-site.xml 传递凭据)。 即使在这种情况下,它也无法在导入文件后解析它们。
【问题讨论】:
-
您能否测试访问以下公开可用的文件并让我知道您是否仍有问题?所以在你点击
Import Files后粘贴http://h2o-public-test-data.s3.amazonaws.com/smalldata/prostate/prostate.csv看看是否有效。还请说明您是如何启动 h2o 的:您是否使用了 h2o.init() - 带有哪些参数。还是您以其他方式开始。谢谢! -
是的,它适用于提供的公共文件路径。当前版本似乎不接受 s3a 协议。在这个版本中,如何从 s3 传递私有文件路径?我正在使用 h2o.jar 来启动和运行 h2o flow
-
您可以下载日志并将其发送到 support@h2o.ai 吗?谢谢!
-
@Lauren,您想要一个特殊的主题或标签让电子邮件可见吗? (我也会附上这个帖子的链接。)
-
没有特殊标签,我们将识别该问题。谢谢!