【发布时间】:2014-11-26 18:45:54
【问题描述】:
我对 hadoop 和 MapReduce 比较陌生,但我想用它来分析大量数据。这些数据代表大约 1 GB 的棒球统计数据,并且全部存储在 MySQL 数据库中。我知道 hadoop 是围绕将代码引入数据而不是相反的想法构建的,因此传统数据库通常不能很好地与 hadoop 一起使用。但是,我做了一些研究,看起来 Sqoop 可能适合我的需求。以下是我的几个问题:
- 1 GB 的数据是否足以保证使用 MapReduce 框架?还是小到可以按顺序处理?
- 如何才能最有效地处理这些数据?我应该使用 Sqoop 插件还是尝试重构数据?
- 使用 hadoop 可以获得哪些性能提升?
【问题讨论】:
-
“假设”我们是假设还是您确认了这一点?
-
这是一个假设,如果我错了,你可以纠正我。
-
我无权访问您的数据和设置。你做。你需要弄清楚它是否是一个瓶颈,而不是仅仅假设它是。
标签: mysql hadoop bigdata sqoop