【发布时间】:2018-06-14 00:28:52
【问题描述】:
我有一个简单的顶点“url”:
schema.vertexLabel('url').partitionKey('url_fingerprint', 'prop1').properties("url_complete").ifNotExists().create()
还有一个名为“links”的edgeLabel,它将一个网址连接到另一个网址。
schema.edgeLabel('links').properties("prop1", 'prop2').connection('url', 'url').ifNotExists().create()
一个网址可能有数百万个传入链接(例如 ebay.com 的所有子页面的首页)。
但这似乎会导致非常大的分区 / 并且由于分区宽而导致 dse 崩溃(来自 Opscenter 宽分区报告): graphdbname.url_e (2284 mb)
我怎样才能避免这种情况?如何处理这个“超级节点”?我为标签找到了一个“分区”命令(关于此 [1] 的文章),但该命令已弃用并将在 DSE 6.0 中删除/发行说明中的唯一提示是以另一种方式对数据进行建模 - 但我我不知道在那种情况下我该怎么做。
我对每一个提示都很满意。谢谢!
[1]https://www.experoinc.com/post/dse-graph-partitioning-part-2-taming-your-supernodes
【问题讨论】:
标签: datastax graph-databases datastax-enterprise datastax-enterprise-graph