【发布时间】:2015-10-08 23:42:02
【问题描述】:
我正在寻找一些能够用于测试色调的真实数据和查询。数据需要专门使用不同的技术(猪、蜂巢等)来创建管道。我可以找到单独的 pig 或 hive 脚本,但找不到涉及不同框架的真实管道示例。
我在大数据的数据方面还没有完全掌握速度,因此我很难创建任何真实世界的用例。此外,像 Spark 这样的例子是微不足道的,比如字数等。
我在哪里可以挖掘管道的一些数据,以及管道的相关步骤?这样我就可以根据需要专注于 Hue UI。
【问题讨论】:
-
对于数据集,你可能想看看这个回复,stackoverflow.com/a/10870801
标签: hadoop hive apache-pig bigdata hue