【问题标题】:Uniqueness check in DeequDeequ 中的唯一性检查
【发布时间】:2019-10-01 11:13:02
【问题描述】:

我目前正在探索 Deequ 库,并试图了解是否可以检查列组合的唯一性。

这段代码

.hasUniqueness(Seq("col1", "col2"), Check.IsOne))

似乎分别计算每一列的唯一性(如果我错了,请纠正)

谢谢

【问题讨论】:

    标签: scala amazon-web-services amazon-deequ


    【解决方案1】:

    我是 Deequ 的作者之一。您的代码 sn-p 应该计算组合列的唯一性。如果您觉得结果有问题,那么我鼓励您在https://github.com/awslabs/deequ/issues 打开一个问题并提供一些示例代码,以便我们重现错误。

    最好, 塞巴斯蒂安

    【讨论】:

    • 谢谢!删除以支持您的回答。
    • 塞巴斯蒂安,非常感谢您的回复。也许这里有一些我不明白的地方,但是如果 .hasUniqueness(Seq("col1"), Check.IsOne)) 返回 Success 我希望 .hasUniqueness(Seq("col1", "col2"), Check.IsOne) ) 也是成功的。唯一列和非唯一列的组合应该仍然是唯一的,对吧?
    • 是的,应该是这样的。
    • 好的,如果其中一列包含空值,则似乎不遵循此规则
    • 我们最近在 Deequ 中修复了这个问题,很快就会发布带有修复的版本。
    猜你喜欢
    • 2014-04-15
    • 1970-01-01
    • 2018-09-24
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多