【发布时间】:2016-02-24 03:52:03
【问题描述】:
我有一个 CSV 文件要导入到 Solr。它有 HTMLText 列,其中包含带有 HTML 标记的英文文本。
我应该如何写我的schema.xml 才能正确导入此列?我正在使用示例模式 XML,在其中我看到了通用文本字段类型和英语字段类型,但我没有看到 HTML 的字段类型。
我知道post 命令允许你发布整个 HTML 文档,所以大概有一个字段解析器来处理这个,但我不知道它是什么。
Solr 中是否有内置的 HTML 解析器类型,或者我应该从我的HTMLText 列中去除 HTML 标记?
【问题讨论】: