【问题标题】:Benchmark Amazon Redshift JSON_EXTRACT_PATH_TEXT基准 Amazon Redshift JSON_EXTRACT_PATH_TEXT
【发布时间】:2014-11-25 08:55:30
【问题描述】:

谁能帮助我进行红移 JSON_EXTRACT_PATH_TEXT 的基准测试/性能统计 功能?

对于海量数据提取json数据(约5000万),我们是否应该使用此功能?

【问题讨论】:

  • 嗯,所以亚马逊已经将 PostgreSQL 的 json 函数移植到 Reshift(或者更确切地说,ParAccel)。很难说它们的表现如何......我认为您可能只需要自己进行基准测试。
  • @CraigRinger 您可以在此处查看详细信息:docs.aws.amazon.com/redshift/latest/dg/… Redshift 还支持 JSON_ARRAY_LENGTH JSON_EXTRACT_ARRAY_ELEMENT_TEXT。

标签: postgresql statistics benchmarking amazon-redshift


【解决方案1】:

5000 万对于 redshift 来说是小菜一碟,但提取 json 内容肯定比普通列中的任何内容都慢。

在 24xdc1.large 集群上

2.3B 行

select count(*) from table where json_extract_path_text(what_extra_json, 'is_logged_in') is not null;

计数

1364239102 (1 行)

24 秒后

【讨论】:

    猜你喜欢
    • 2018-05-10
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2014-08-14
    • 1970-01-01
    • 2014-10-08
    • 2014-08-10
    相关资源
    最近更新 更多