【发布时间】:2016-01-30 07:05:23
【问题描述】:
我使用 DSE 4.7 datastax-enterprise、C* 2.1.5、spark 1.2.1,需要将数据从大表迁移到具有不同架构和需要从其中生成的附加列的新空表大表中的删除列。
我知道可以通过 spark 或通过将命令复制到 cqlsh 中的 csv 文件来将表数据迁移到具有新架构的另一个表,但我感兴趣一个工具,它可以为我提供未来迁移的长期解决方案以及管理和规划迁移的更多选项。
我认为这是一个普遍的问题,我没有找到任何可靠的解决方案。
有什么想法吗?
【问题讨论】:
-
数据框直到 1.4 才可用,因此您必须升级。我将分享一个示例作业,您可以从它开始并针对您的用例进行调整。
-
Spark 是最灵活的工具。也许试试 Cassandra loader + awk? sestevez.com/brians-loader-unloader-for-search
标签: mysql cassandra apache-spark datastax-enterprise