【问题标题】:drop all rows that contain even one alphabet in pyspark [duplicate]在pyspark中删除所有包含一个字母的行[重复]
【发布时间】:2022-01-24 06:49:46
【问题描述】:

pyspark 2.3.1

我到col1 的行应该只包含整数。我正在尝试过滤掉任何包含一个字符的行。如何在 pyspark 中做到这一点?

我试过了

df.select('col1').filter(df.col1.rlike(^[a-zA-Z])) 

但是,包含字母的行也包含整数,因此不会被过滤。

我该怎么做?

【问题讨论】:

    标签: apache-spark pyspark


    【解决方案1】:

    您可以尝试选择纯数字行。

    df = df.filter('col1 rlike "^[0-9]+$"')
    df.show(truncate=False)
    

    【讨论】:

      猜你喜欢
      • 2016-12-16
      • 2022-11-17
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2016-03-09
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多