【发布时间】:2020-06-26 01:07:01
【问题描述】:
专家,我正在尝试从 Pyspark 中的金额字段中删除前导 0 和 $ 符号并使用 regexp_replace 来代替它,但是我没有得到预期的结果-
>>> df = sqlContext.createDataFrame([('abcd','$000000000000432.14')], ['s', 'd'])
>>> df.select(expr('regexp_replace((regexp_replace(d, "(\$)", "")), "(^0+)", "")').alias("d")).show()
+-------------------+
| d|
+-------------------+
|$000000000000432.14|
+-------------------+
我在这里做错了什么?
谢谢
【问题讨论】:
标签: apache-spark pyspark