【发布时间】:2017-05-18 13:00:11
【问题描述】:
我正在做一个 Rails 项目,数据库是 OrientDB 图形数据库。我需要将数据从 Postgres 传输到 OrientDB 图。我在 Ruby 中编写了脚本来从 postgres 中获取数据,并通过创建相关的边和节点将其加载到图形结构中。
但是,这个过程非常缓慢,并且需要几个月的时间才能输入百万条记录。该图在某种程度上是一个密集连接的图。
我想使用 OrientDB 提供的内置 ETL 配置,但它似乎相对复杂,因为我需要从同一个表中的字段创建多个顶点,然后将它们连接起来。我提到了这个documentation。
我可以编写自定义 ETL 以与内置 ETL 工具相同的速度将数据加载到 OrientDB 中吗?
此外,是否有任何关于将数据加载到 OrientDB 的速度的基准。
【问题讨论】:
-
你好,你可以试试传送器,新的 OrientDB 功能吗?希望能帮助到你。问候
-
我正在使用社区版。那里没有传送器功能。仅在企业版中可用。但是我认为这与 ETL 模块没有太大区别。
-
只需一次迁移,您就可以通过下载 45 天试用版来使用 Enterprise Edition 的 Teleporter ;-) 如果您想让 OrientDB 与 Postgres 保持同步,那就不同了,在这种情况下,您需要一个 Enterprise许可证。
-
企业版 Teleporter 与 ETL 模块有何不同?我可以通过对数据进行检查来编写自定义 SQL 查询以进行加载吗?此外,这种迁移也不是一次性的任务。这将是一个持续的过程,postgres 的任何变化都必须反映在 OrientDB 中。
标签: ruby-on-rails postgresql orientdb etl