【问题标题】:How can I use drill-embed with file extensions different from the default ones?如何使用具有不同于默认扩展名的文件扩展名的 Drill-embed?
【发布时间】:2015-10-22 21:27:32
【问题描述】:

我正在尝试通过 Drill-embed 测试 apache Drill,但我所有的 json 文件都是带有 jl.gz 文件扩展名的 jsonline 文件。

如果我将它们重命名为 json.gz 它可以工作,但在我的情况下这是不可取的。

我如何告诉drill jl.gz 文件实际上是json?

PS:我尝试将 bootstrap-storage-plugins.json 添加到 $CP 但钻嵌入似乎没有读取它。

【问题讨论】:

    标签: apache-drill


    【解决方案1】:

    是的,不要使用引导。这仅适用于分布式环境并使用 Web Console 或 REST API is recommended。毫无疑问,必须压缩 gz 文件,而不是具有 gz 扩展名的解压缩 JSON 文件。根据默认的 dfs 存储插件创建一个新的存储插件配置,例如 myplugin。

    1. 启动钻壳并转到http://<IP address or host name>:8047。在工具栏中选择存储。 dfs 存储插件配置出现在默认配置列表中。
    2. 在“存储”选项卡上的“已启用存储插件”下,单击“更新”以复制 dfs 存储插件配置。 出现插件的配置。
    3. 复制配置并返回(只需取消配置)。
    4. 在存储选项卡上,在新存储插件中输入名称。例如,输入 myplugin。每个在 Drill 上注册的配置必须有一个不同的名字。名称区分大小写。
    5. 点击创建。
    6. 在配置中,格式部分,更改 json 格式以指定扩展名:“gz”

      “json”:{ “类型”:“json”, “扩展”:[ “gz” ] },

    7. 点击创建。

    现在,在 Drill shell 中,您可以查询名为 something.gz 的 JSON 文件:

    use myplugin;
    select * from `/Users/me/donuts.gz` limit 2;
    

    【讨论】:

    • 感谢@catpaws 的回答。我还是很陌生。当您谈到默认的 dfs 存储插件时,您具体指的是什么文件?
    • 抱歉,添加了一些步骤让您进入 dfs 默认存储插件配置。在尝试查询您的 json 文件之前查看 drill.apache.org/docs/json-data-model 可能会有所帮助。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2012-11-13
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2019-11-05
    • 2013-06-02
    相关资源
    最近更新 更多