【问题标题】:What's the best way to get a 'lot' of small pieces of data synced between a Mac App and the Web?在 Mac App 和 Web 之间同步“大量”小数据的最佳方式是什么?
【发布时间】:2012-03-16 00:57:54
【问题描述】:

我现在正在考虑使用 MongoDB。目标很明确,这就是需要发生的事情: 在我的应用程序 Finch(finchformac.com 了解详细信息)中,我每天有成千上万的条目,每个用户打开的窗口、打开的时间、关闭的时间以及标签(如果他们选择一个)为了它。我需要在线备份这些数据,以便可以同步到他们的其他 Mac 计算机等。我还需要能够从他们的数据中在线绘制图表,这意味着一些复杂的查询会触及数十万条记录。

现在我已经尝试在应用程序端使用 Ruby/Rails/Mongoid 和 JSON 解析器,一次以 10,000 条记录的增量发送数据,数据通过后台 mapreduce 作业处理到其他集合。但是,这一切似乎都被阻止并且最终太慢了。 (如果有人)对如何解决这个问题有什么建议?

【问题讨论】:

  • 在这种情况下,CouchDB 似乎会更好。
  • 它是为断开模式和偶尔同步而设计的。
  • 不想使用 iCloud,因为我们将服务器同步作为一项高级服务收费。

标签: objective-c ruby-on-rails json mongodb mapreduce


【解决方案1】:

您遇到了一个复杂的问题,这意味着您需要将其分解为更小、更容易解决的问题。

问题(如我所见):

  1. 您有一个正在收集数据的应用程序。你只需要 将该数据存储在本地某处,直到它同步到 服务器。
  2. 您已在服务器上收到数据,现在您需要推送它 以足够快的速度进入数据库,以免速度变慢。
  3. 您必须报告这些数据,这听起来既困难又复杂。

您可能希望将其编写为某种 API,为简单起见(并且由于您在客户端上有大量空闲处理周期),您需要在客户端将这些数据块处理成 JSON导入数据库。一旦你有了 JSON,你就不需要 Mongoid(你只需将 JSON 直接扔到数据库中)。此外,您可能不需要 Rails,因为您只是在创建一个简单的 API,所以只使用 Rack 或 Sinatra(可能使用类似 Grape 的东西)。

现在您需要解决整个“这一切似乎都被阻止并且最终太慢”的问题。我们已经删除了 Mongoid(因此无需从 JSON -> Ruby Objects -> JSON 转换)和 Rails。在我们开始对这些数据进行 MapReduce 之前,您需要确保它足够快地加载到数据库中。您可能应该构建整个事物,以便您的 MapReduce 支持您的报告功能。为了同步数据,您不需要做任何事情,只需传递 JSON。如果您的数据写入数据库的速度不够快,您应该考虑Sharding your dataset。这可能会使用一些基于用户的密钥来完成,但您比我更了解您的数据架构。您需要选择分片键,这样当多个用户同时同步时,他们可能会使用不同的服务器。

一旦您解决了问题 1 和 2,您就需要处理您的报告。 Mongo 中的 MapReduce 函数可能支持这一点。我对这部分的第一个评论是确保您至少运行 Mongo 2.0。 In that release 10gen sped up MapReduce(我的测试表明它比 1.8 快得多)。除此之外,您可以通过分片并将读取定向到副本集中的辅助服务器(您正在使用副本集?)来实现进一步的增加。如果这仍然不起作用,请考虑构建您的架构以支持您的报告功能。这使您可以在客户端上使用更多周期来完成工作,而不是加载服务器。但这种优化应该留到您证明传统方法行不通之后。

我希望文字墙有所帮助。祝你好运!

【讨论】:

  • 感谢您的周到回复。我对在客户端机器上处理 JSON 的一个担忧是,他们可以轻松修改它并在我的 Mongo DB 中写入任何想要的内容。
  • 这绝对是真的,尽管他们可能只会丢弃自己的数据,并且会被限制编辑其他任何人。
猜你喜欢
  • 1970-01-01
  • 2010-09-27
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2017-02-09
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多