【发布时间】:2015-01-22 06:45:44
【问题描述】:
我们需要将几 GB 的 csv 文件加载到 cassandra 中。我们尝试使用 source 命令提取数据,以从包含插入语句的文本文件中提取数据,其中包含 csv 文件的数据值。
使用这种方法,数据无法正确上传 - 第一行的数据在所有后续行中重复。 (我检查了插入命令,它们似乎包含正确的值)。
可能是什么问题?我是否看到行是重复的,因为 Cassandra 需要时间将数据刷新到磁盘? (nodetool 显示没有挂起的刷新。)
创建 CSV 文件并使用复制语句提取数据是否更有效?请。建议。
【问题讨论】: