【发布时间】:2016-04-18 18:41:54
【问题描述】:
我正在尝试这个 marklogic spark 连接器教程。 https://developer.marklogic.com/blog/marklogic-spark-example 我能够执行此操作。我发现,它默认选择文档数据库。
问题是:
给定的代码如下所示:
JavaPairRDD<DocumentURI, MarkLogicNode> mlRDD = context.newAPIHadoopRDD( hdConf, Configuration DocumentInputFormat.class, InputFormat DocumentURI.class, Key Class MarkLogicNode.class, Value Class );
我想知道如何通过特定的文档 URI 和数据库来获取数据库中的特定文档。 例如; 带有在导入 csv 文件时创建的 xml 文件的文档数据库。下面提到:Marklogic : Multiple XML files created on document on importing a csv. How to get root Document URI path? 有人可以分享一个关于如何将文档 URI 和数据库名称作为参数传递的示例代码吗?
【问题讨论】:
标签: java apache-spark marklogic connector bigdata