寻找更小规模的类似 Hadoop 的解决方案 [关闭]

【问题标题】：Looking for a Hadoop-like solution at a smaller scale [closed]寻找更小规模的类似 Hadoop 的解决方案 [关闭]
【发布时间】：2013-11-20 17:07:23
【问题描述】：

我们有一个大约 1000 GB（千千兆字节）的数据库，我们正在考虑使用 Hadoop 进行时间序列分析。问题是 Hadoop 需要一些时间才能进入，并且对于我们数据库的大小而言，Hadoop 实际上甚至是一个超大的解决方案。我的问题是，是否有人知道类似 Hadoop 的小规模解决方案。它还需要有一些类似 SQL 的查询语言。我唯一想到的是 JBoss Infinispan。但我想看看是否还有其他已知的解决方案。

【问题讨论】：

你存储什么样的数据？
嗯，数据是高度相关的，并且以多种方式连接。反应迅速的人... ;-)。
我应该补充一点，它是关于数据挖掘，而不是关于 MapReduce。
抽象目标是什么？使用数据挖掘可以与应用程序分离（或者实际上应该）因此，根据您的问题（这可能很容易实现），您可能会得到更好的答案
@OliverPlow，在执行 ET（或 ETL）之后，通常 Hadoop 与不同的工具一起使用，从而减少连接的数量并允许大型的、可能基于列的模式，而不会受到高度关系的阻碍模式。顺便说一句：您的问题没有单一、客观的答案，因此对于 StackOverflow 来说并不是很好。

标签： sql database hadoop infinispan

【解决方案1】：

查看greenplum

我们有两种大数据解决方案：

1 基于hadoop，支持PB级别的数据存储

2 基于greenplum，用于小数据规模的实时数据分析。

【讨论】：

猜你喜欢

1970-01-01
2023-01-23
2014-07-20
2012-10-11
2016-03-01
1970-01-01
1970-01-01
2012-07-10

相关资源

下载 2022-12-15
下载 2023-02-02
下载 2023-03-15
下载 2022-12-03

最近更新更多

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode