基准 Amazon Redshift JSON_EXTRACT_PATH_TEXT答案

【问题标题】：Benchmark Amazon Redshift JSON_EXTRACT_PATH_TEXT基准 Amazon Redshift JSON_EXTRACT_PATH_TEXT
【发布时间】：2014-11-25 08:55:30
【问题描述】：

谁能帮助我进行红移 JSON_EXTRACT_PATH_TEXT 的基准测试/性能统计功能？

对于海量数据提取json数据（约5000万），我们是否应该使用此功能？

【问题讨论】：

嗯，所以亚马逊已经将 PostgreSQL 的 json 函数移植到 Reshift（或者更确切地说，ParAccel）。很难说它们的表现如何......我认为您可能只需要自己进行基准测试。
@CraigRinger 您可以在此处查看详细信息：docs.aws.amazon.com/redshift/latest/dg/… Redshift 还支持 JSON_ARRAY_LENGTH JSON_EXTRACT_ARRAY_ELEMENT_TEXT。

【解决方案1】：

5000 万对于 redshift 来说是小菜一碟，但提取 json 内容肯定比普通列中的任何内容都慢。

在 24xdc1.large 集群上

2.3B 行

select count(*) from table where json_extract_path_text(what_extra_json, 'is_logged_in') is not null;

计数

1364239102 (1 行)

24 秒后

【讨论】：