【问题标题】:Can I run gremlin queries on cosmos-db (graph) from azure databricks notebook?我可以从 azure databricks notebook 对 cosmos-db(图形)运行 gremlin 查询吗?
【发布时间】:2019-06-21 09:40:03
【问题描述】:

Gremlin 是否直接集成到 azure databricks notebook 中?

我有一张 cosmosDb 的图表,我想运行一些 gremlin 查询。例如

g.V().hasLabel('x').out('y').out('z')

我从 azure 门户运行查询,但对于大量数据,它会抛出

["请求率大"]

切换到 Azure databricks,我创建了一个集群,添加了“azure-cosmosdb-spark”库,并且从 python 笔记本中,a 只能运行诸如“SELECT * FROM c”之类的 sql 查询

我尝试过使用 spark-gremlin 和 hadoop-gremlin 库,但我现在能看到的唯一方法是将我的所有节点和边加载到数据帧中(逐个标签),然后将其更改为 graphFrame 和只有这样,在我在这里重建图表之后,我才能进行一些遍历查询,但 Gremlin 还不能。 (并且拥有数百万个节点和边,我不知道这对我有多大帮助)。

我想知道是否支持从 cosmosDb 上的笔记本直接进行 gremlin 查询,或者至少将图形直接迁移到 dataFrame 中?

【问题讨论】:

    标签: apache-spark graph azure-cosmosdb gremlin azure-databricks


    【解决方案1】:

    这看起来像你需要的:https://link.medium.com/zkaW4VIVQT

    虽然这篇文章是关于写入 CosmosDB,但我认为这些方法可以应用于阅读。

    【讨论】:

    • 感谢您的快速回复,但不幸的是我知道这篇文章,主要问题是我需要运行 Gremlin(搜索)查询。对于写作步骤,我使用批量操作。
    猜你喜欢
    • 1970-01-01
    • 2018-03-30
    • 1970-01-01
    • 1970-01-01
    • 2020-11-03
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多