【发布时间】:2019-06-09 09:12:51
【问题描述】:
我有一个 Scala 库,其中包含一些实用程序代码和用于 Scala Spark API 的 UDF。
但是,我现在很想开始将这个 Scala 库与 PySpark 一起使用。使用基于 Java 的类似乎工作得很好,就像概述的 Running custom Java class in PySpark,但是当我使用一个用 Scala 编写的库时,一些类的名称可能不是直截了当的,并且包含像 $ 这样的字符。
互操作性如何仍然可能?
如何使用提供需要泛型类型参数的函数的 Java/Scala 代码?
【问题讨论】:
-
diogoalexandrefranco.github.io/scala-code-in-pyspark 看起来很有趣,但到目前为止我仍然无法使用它。
标签: scala apache-spark pyspark py4j language-interoperability