【问题标题】:how to convert row from csv to ArrayType in Apache spark java?如何在 Apache spark java 中将行从 csv 转换为 ArrayType?
【发布时间】:2020-11-25 10:53:17
【问题描述】:

我有一个 10k 行的 CSV,我想找出一些模式。我指的是 Apache Spark 文档的示例。在下面的示例中,代替项目,我给出了列列表,但出现错误。

输入列必须是ArrayType,但StringType

FPGrowthModel model = new FPGrowth()
  .setItemsCol("items")
  .setMinSupport(0.5)
  .setMinConfidence(0.6)
  .fit(itemsDF);

如何创建ArrayType

【问题讨论】:

    标签: java apache-spark dataset


    【解决方案1】:

    试试这个-

    val new_itemsDF = itemsDF.withColumn("items", array(col("items")))
    FPGrowthModel model = new FPGrowth()
      .setItemsCol("items")
      .setMinSupport(0.5)
      .setMinConfidence(0.6)
      .fit(new_itemsDF);
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2016-04-11
      • 2016-12-25
      • 1970-01-01
      • 2017-02-20
      • 1970-01-01
      • 2016-05-09
      • 2018-08-26
      相关资源
      最近更新 更多