【发布时间】:2021-10-07 08:53:53
【问题描述】:
我需要帮助!
我是 Elasticsearch 的新手...我刚刚从 Kaggle 导入 CSV 格式的数据,并通过指定配置文件通过 logstash 将它们集成到 elasticsearch,但是在 elasticsearch 上我的数据不再可读(格式如下: u0000E\u0000l) 我需要在配置文件中添加任何转换吗?
谢谢。
【问题讨论】:
-
能否请您也提供logstash配置。这将有助于其他人了解您的配置。
-
输入 { file { path => "C:/elastic_stack/data/*.csv" start_position => "beginning" sincedb_path => "NUL" } } filter { csv { separator => ", " 列 => ["id","name","location","description","rating","image","link"] } } 输出 { elasticsearch { hosts => "localhost:9200" index => "es_hotels" } }
-
您的文件格式应该是 UTF-8,只有它才能正确索引。您也可以使用编解码器插件将数据转换为 UTF-8。这是参考:elastic.co/guide/en/logstash/current/plugins-codecs-csv.html
-
我试过了:codec => plain { charset=> "UTF-8" } and ruby { code => 'event.set("decoded", Base64.decode64(event.get("message ")))' } 但它不起作用
-
我有一个二进制数据
标签: csv elasticsearch encoding format logstash