【发布时间】:2016-08-29 20:35:49
【问题描述】:
我是 Cassandra 和 Spark 的新手。我正在尝试为我的 Spark 作业设置测试,它执行以下操作:
- 将表 A 中的数据加载到 DataFrames 中
- 对这些 DataFrame 进行一些过滤、分组和聚合
- 将结果加载到表 B 中
我想使用嵌入式 Cassandra 服务器来运行测试,而不是让它连接到 Cassandra 数据库的本地实例。有没有人这样做过?如果是这样,有人可以指点我一个很好的例子吗?提前感谢您的帮助!
【问题讨论】:
-
显然,有 cassandra-unit 库来帮助促进后端 Cassandra 数据库的测试。 github.com/jsevellec/cassandra-unit/wiki/What-is-it
标签: java apache-spark cassandra