【发布时间】:2021-03-22 09:38:32
【问题描述】:
所以,我在 Spark 中使用 Amazon Deequ,我有一个数据框 df,其中有一列 publish_date,其类型为 DateType。我只是想检查以下内容:
publish_date <= current_date(minus)x AND publish_date >= current_date(minus)y
其中x 和y 是整数。
我不知道在这里放什么支票:
val verificationResult: VerificationResult = { VerificationSuite()
.onData(df)
.addCheck(
Check(CheckLevel.Error, "Review Check")
//function to check this
)
.run()
}
【问题讨论】:
标签: scala dataframe apache-spark amazon-deequ