【发布时间】:2018-12-29 04:57:08
【问题描述】:
我有一个 Spark 数据框,其中有一列 (assigned_products) 类型为字符串,其中包含以下值:
"POWER BI PRO+Power BI (free)+AUDIO CONFERENCING+OFFICE 365 ENTERPRISE E5 WITHOUT AUDIO CONFERENCING"
我想计算字符串中+ 的出现次数,并在新列中返回该值。
我尝试了以下方法,但一直返回错误。
from pyspark.sql.functions import col
DF.withColumn('Number_Products_Assigned', col("assigned_products").count("+"))
我正在运行 Apache Spark 2.3.1 的群集上的 Azure Databricks 中运行我的代码。
【问题讨论】:
标签: python string apache-spark pyspark apache-spark-sql