【发布时间】:2015-01-17 04:26:54
【问题描述】:
对于 MongoDB,我完全是个新手,但我之前确实有使用过诸如 Hbase 和 Accumulo 等 nosql 存储的经验。当我使用这些其他 nosql 平台时,我最终编写了自己的数据摄取框架(通常在 java 中)执行类似 ETL 的功能,以及内联丰富。
我还没有找到与 Mongo 具有类似功能的工具,但也许我错过了它。
迄今为止,我有一个Logstash 实例,并从多个来源收集日志并将它们作为JSON 保存到磁盘。我知道 Logstash 有一个 mongodb output plugin,但它没有任何选项来配置记录的索引方式(即聚合文档等)。
根据我的需要,我想为通过 Logstash 到达的每个事件创建多个聚合文档——这需要一些预处理和特定的 Mongo 插入。
底线——在我开始构建摄取工具(可能在 python 或节点中)之前——是否已经存在一些东西?
【问题讨论】:
标签: node.js mongodb pymongo etl logstash