【发布时间】:2021-07-11 01:32:01
【问题描述】:
我在 data 文件夹中爬取了很多 JSON 文件,它们都以时间戳命名(./data/2021-04-05-12-00.json,./data/2021-04-05-12-30.json,./data/2021-04-05-13-00.json,...)。
现在我正在尝试使用 ELK 堆栈来加载那些不断增加的 JSON 文件。
JSON 文件的打印效果如下:
{
"datetime": "2021-04-05 12:00:00",
"length": 3,
"data": [
{
"id": 97816,
"num_list": [1,2,3],
"meta_data": "{'abc', 'cde'}"
"short_text": "This is data 97816"
},
{
"id": 97817,
"num_list": [4,5,6],
"meta_data": "{'abc'}"
"short_text": "This is data 97817"
},
{
"id": 97818,
"num_list": [],
"meta_data": "{'abc', 'efg'}"
"short_text": "This is data 97818"
},
],
}
我尝试使用 logstash multiline 插件来提取 json 文件,但它似乎会将每个文件作为一个事件处理。有没有办法将 JSON data 文件中的每条记录提取为事件?
另外,在 ELK 中加载多个打印精美的 JSON 文件的最佳做法是什么?
【问题讨论】:
标签: json elasticsearch logstash elastic-stack logstash-file