【问题标题】:TPC-DS queries generatorTPC-DS 查询生成器
【发布时间】:2019-05-24 16:04:49
【问题描述】:

我需要使用 TPC-DS 测试我的数据仓库。如何使用 TPC-DS 为我的数据仓库生成查询? 我试图生成,但它为特定的数据仓库生成。

谢谢。

【问题讨论】:

    标签: database database-performance data-warehouse tpc


    【解决方案1】:

    我不确定您所说的使用 TPC-DS“测试您的数据仓库”是什么意思。

    TPC-DS 是database engines 的基准测试,专注于典型的决策支持访问模式; data warehouse 是一个信息系统概念,通常使用各种数据库管理系统(和其他工具)构建。

    澄清后,您可以使用 TPC-DS 对您计划用作数据仓库的数据存储的数据库引擎进行基准测试。如果这是你的目标,你需要:

    1. 要么使用official TPC-DS tool 生成数据,要么下载数据集(如果您可以在网上找到它)(或者,也许是您的数据库供应商provides it already)。
    2. 将数据加载到您正在测试的数据库上的基准模型中。
    3. 在您创建的数据模型上运行基准测试(查询)。您可以找到查询 here 的示例(在本例中为 Impala),但您可能必须将它们转换为您正在使用的任何 DBMS 使用的 SQL 惯用语。

    TPC-DS 规范文档不仅提供了这些信息,还可以帮助您理解有关该主题的一些基本概念:http://www.tpc.org/tpc_documents_current_versions/pdf/tpc-ds_v2.11.0.pdf

    【讨论】:

    • 您好,感谢您的回答。我理解您所指的一切,但我的疑问是:TPC-DS 使用特定的 DW 和查询来进行基准测试,对吗?就我而言,我想为我的 DW 生成 TPC-DS 等效查询。如果你知道我很感激。谢谢。
    • TPC-DS 不“使用特定的 DW 进行基准测试”。它使用特定的数据模型(即链接的数据库表)和一组查询,而不是特定的数据库;它的目标正是对具有相同工作负载的不同数据库引擎进行基准测试。您可以在任何数据库中构建和加载数据模型,并且如有必要,转换查询以匹配您的数据库使用的 SQL 习惯用法。使用 TPC-DS 进行基准测试只是在不同的数据库引擎上以相似的条件执行相同的查询。
    • 我在回复中链接的工具 (dsdgen) 实际上可以为不同的 DBMS 生成 TPC-DS 查询,因此您可能根本不需要翻译 SQL,具体取决于您使用的数据库。
    • 嗨。谢谢您的回答。我的意思是我有一个 DW 模式,我需要将 TPC-DS 特定查询转换为他们的模型到我的模型中。我想知道我是否可以配置 dsdgen 工具来生成与我的 DW 架构类似的查询。
    • 啊,现在你的目标对我来说更清楚了 :) TPC-DS 不是为这种情况而设计的;它使用一个特定的数据模型,该模型可以在几乎任何 DBMS 中实现,并通过执行 TPC-DS 查询进行基准测试,可能需要对其进行调整以匹配被基准测试的 DBMS 的语法。数据模型和查询特定于 TPC-DS,因为目标是以可比较的方式对相同工作负载(即 TPC-DS 数据模型和查询)的不同 DMBS 执行情况进行基准测试。目标是使用“传统分析工作负载”而不是特定数据模型对 DBMS 进行基准测试。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多