【问题标题】:How to connect Document Conversion Service with Watson Retrieval and Ranking如何将文档转换服务与 Watson Retrieval and Ranking 连接起来
【发布时间】:2017-06-18 15:12:35
【问题描述】:
我有 100 个 pdf 文档。我使用 Watson 文档转换服务将 pdf 文档转换为 JSON 应答单元。现在我需要训练这些文件。
我编写了需要 JSON 答案单元和文档相关性分数作为 Watson R 和 R 输入的 Python 代码。如何通过 Python 代码引用 JSON 答案单元或如何通过 Python API 从文档转换服务下载 JSON 答案单元
【问题讨论】:
标签:
json
ibm-watson
watson
ranking-functions
【解决方案1】:
我认为您可以看到来自 IBM Developers (Node SDK) 的 this 示例。
此line 显示了一个示例,用于参考 JSON 答案单元。
编程语言是其他语言,但您可以使用相同的逻辑来做您想做的事情,文档转换集成示例展示了如何使用文档转换服务将文档转换为答案单元并将其上传到检索和排名服务使答案单元可搜索。
-
创建一个solr集群,上传solr配置并创建一个集合
1.1 在文件retrieve_and_ran_lifecycle.v1.js 和retrieve_and_rank_solr.v1.js 中,您将找到示例函数
关于如何执行这些步骤。
1.2 重要提示:上传 solr 配置时,请使用资源文件夹中的 [answer_unit_config.zip],
其中包括一个 schema.xml,它定义了将被索引的字段。
-
编辑文件 document_conversion_integration.v1.js 并输入以下内容:
2.1 Document Conversion 和 Retrieve and Rank 服务的服务凭证(每个服务实例都有一组不同的凭证)
2.2 clusterId(创建集群时获取)
2.3 如果您使用与默认值不同的值,则 collectionName 和 inputDocument
- 运行以下命令:
node document_conversion_integration.v1.js