【问题标题】:GUI tools for viewing/editing Apache Parquet用于查看/编辑 Apache Parquet 的 GUI 工具
【发布时间】:2018-03-19 16:03:00
【问题描述】:

我有一些 Apache Parquet 文件。我知道我可以在我的 shell 中执行 parquet file.parquet 并在终端中查看它。但我想要一些 GUI 工具以更用户友好的格式查看 Parquet 文件。有这样的程序吗?

【问题讨论】:

    标签: apache hadoop parquet


    【解决方案1】:

    查看此实用程序。适用于所有 Windows 版本:https://github.com/mukunku/ParquetViewer

    【讨论】:

    • 感谢您的建议,我已经尝试过了,但是对于结构复杂的镶木地板,例如 JSON,这种类型的实用程序不起作用。它适用于具有简单结构的镶木地板,例如 CSV。
    • 我也试过这个。在我的镶木地板文件中,通过在第一列中插入一个不正确的 0 值并将所有正确的值向下移动到它插入的每个 0 的一行,它似乎每第二行都搞砸了。我尝试了 BigDataFileViewer,它可以正确查看我的文件,但前提是您打开文件两次。第一次它会在尾部抛出关于不正确幻数的错误,但是当您第二次打开文件时似乎可以正常工作。架构和表数据似乎正确。
    • @Roochiedoor 可能会使用示例文件在 repo 上打开问题单?
    • @Sal 刚刚在github.com/mukunku/ParquetViewer/issues/20 登记了一张票
    • 我喜欢它,它又快又简单,我只想(预览)查看表格拼花文件
    【解决方案2】:

    实际上我找到了一些 Windows 10 特定的解决方案。但是,我正在使用 Linux Mint 18,所以我想要一些 Linux(或理想的跨平台)GUI 工具。还有其他的 GUI 工具吗?

    https://www.channels.elastacloud.com/channels/parquet-net/how-about-viewing-parquet-files

    【讨论】:

    • Windows 8 有什么类似的吗?
    【解决方案3】:

    有一个 GUI 工具可以查看 Parquet 以及其他二进制格式的数据,例如 ORCAVRO。它是纯 Java 应用程序,因此可以在 Linux、Mac 和 Windows 上运行。详情请查看Bigdata File Viewer

    它支持数组、映射、结构等复杂数据类型。您可以将读取的文件保存为CSV格式。

    【讨论】:

    【解决方案4】:

    JetBrains(IntelliJ、PyCharm 等)有一个插件,如果你有专业版:https://plugins.jetbrains.com/plugin/12494-big-data-tools

    【讨论】:

      猜你喜欢
      • 2012-06-04
      • 1970-01-01
      • 2020-07-10
      • 2018-11-28
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2011-12-04
      • 1970-01-01
      相关资源
      最近更新 更多