【问题标题】:Python great expectation with Spark : Get result for each rowPython 对 Spark 寄予厚望:获取每一行的结果
【发布时间】:2022-07-12 00:01:56
【问题描述】:

我非常期待使用 python 来使用 Apache spark 验证我的数据。基本上我想为数据框的每一行添加一个标志 is_valid 。要添加此标志,我需要对行中的每一列应用多项检查。很大的期望是为考虑到整行的列给出结果。有什么方法可以让我通过伟大的期望来实现这一目标?

【问题讨论】:

    标签: apache-spark validation great-expectations


    【解决方案1】:

    如果您尝试附加到您正在使用 Great Expectations 验证的数据帧,目前这在 Great Expectations 中是不可能直接实现的。您可以在管道中添加一个步骤,该步骤将解析检查点生成的验证结果,然后根据结果附加到您的数据框。

    【讨论】:

      猜你喜欢
      • 2021-07-13
      • 2022-10-04
      • 2022-10-22
      • 2021-09-19
      • 2021-05-12
      • 1970-01-01
      • 2020-04-26
      • 1970-01-01
      • 2014-01-20
      相关资源
      最近更新 更多