【问题标题】:POC on Cassandra and PowerBI Report serverCassandra 和 PowerBI 报表服务器上的 POC
【发布时间】:2018-12-24 21:36:18
【问题描述】:

1.我的任务是为 Cassandra DB 设置硬件(最好在 VM 上)。目前,Cassandra 有 100 GB 的数据,每 2 秒数据摄取量为 500 字节。我应该使用哪种硬件/VM?

  1. 我们需要 Power-bi 报表服务器来连接到这个数据库,我打算使用 CData ODBC 驱动程序来建立连接。考虑到上述配置,我会面临性能或连接方面的任何问题吗?

谢谢, 卡提克

【问题讨论】:

    标签: cassandra power-bi-report-server


    【解决方案1】:

    到你的第一部分:

    您的传入数据速率为 250 字节/秒。在一年中,这大约是(原始)8GB - 这非常小,甚至应该适合虚拟机。请记住,您在磁盘上使用的存储空间将高于此值,因为内部结构和复制都会产生开销(如果您需要高可用性)。

    但我不推荐用于 Cassandra 的 VM,因为它们经常使用共享存储来存储图像,由于邻居噪声和延迟,这可能会成为真正的性能杀手。当使用 SSD 或 NVMe 存储时,此问题可能不太相关。

    对于第二部分:除了名称之外,我对 PowerBI 的了解不多。但是 DataStax 有/曾经有一个 Cassandra 的 ODBC 驱动程序:

    https://www.datastax.com/dev/blog/using-the-datastax-odbc-driver-for-apache-cassandra

    也许这有帮助。

    【讨论】:

    • 感谢您的回复。
    • 您可以查看这篇文章docs.datastax.com/en/dse-planning/doc/planning/… - 我之前使用的简单设置在 8GB 和 4 核上运行良好。如果您可以尝试一些设置,那么可能会在很大程度上取决于您将有多少请求。如果您的数据是时间序列(插入一次且未修改,可能还有一段时间),还请查看 TimeWindowCompactionStrategy(SizeTieredCompationStrategy 是默认值)。
    • 感谢您的回复。存储大小与 RAM + CPU 之间是否存在相关性?考虑到我的初始设置将有 100Gb 和增量数据(25B/秒),以下硬件要求是否可以完成这项工作? :500GB 和 2 核 64 位 CPU。我确实检查了docs.datastax.com/en/dse-planning/doc/planning/…
    • 我认为它应该很顺利,不要在 RAM 上太低,并密切关注您的性能指标。请记住,如有必要,Cassandra 很容易扩展。
    猜你喜欢
    • 1970-01-01
    • 2017-01-15
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多