【发布时间】:2012-12-13 06:04:45
【问题描述】:
我想知道如何将 Cassandra 中的数据导入 Hadoop 文件系统,以及如何定期持续进行(即当 Cassandra 数据库发生变化或将新数据插入 Cassandra 时,如何我们可以检测到变化并将数据迁移到 HDFS(Hadoop 文件系统)吗?
【问题讨论】:
我想知道如何将 Cassandra 中的数据导入 Hadoop 文件系统,以及如何定期持续进行(即当 Cassandra 数据库发生变化或将新数据插入 Cassandra 时,如何我们可以检测到变化并将数据迁移到 HDFS(Hadoop 文件系统)吗?
【问题讨论】:
您有多种选择。您可以为自动化编写顺序程序或 mapreduce 作业或 pig 等,您再次有多种选择。你可以有一个 cron 来为你做这件事,或者如果你想让你的工作流更复杂,你可以使用 Oozie(一个工作流引擎),它会根据你想要的任何标准来安排你的工作。 高温
【讨论】: