【发布时间】:2021-06-02 23:10:04
【问题描述】:
我正在尝试找到一种方法来捕获 dag 统计信息 - 即在单独的表中各种 dag 及其任务的运行时间(开始时间、结束时间)、状态、dag id、任务 id 等
- 找到了转到 elasticsearch/kibana 的默认日志,但不是将所需日志从那里拉回 s3 表的简单方法。
- 构建一个单独的进程将这些日志加载到 s3 中会产生复制数据,并且还会生成大量其他与系统相关的日志,因此需要扫描和过滤的数据过多。
- 向每个 dag 添加一个函数 - 必须修改每个 dag
还有什么其他的可能性使它不能有效地使用,任何其他气流内置功能都可以使用
【问题讨论】:
标签: statistics runtime airflow metrics directed-acyclic-graphs