【问题标题】:Convert Spark Scala join statement to Python将 Spark Scala 连接语句转换为 Python
【发布时间】:2018-06-25 08:48:34
【问题描述】:
【问题讨论】:
标签:
python
scala
apache-spark
pyspark
apache-spark-sql
【解决方案1】:
在 Scala DataFrame API 中,select 方法采用可变数量的参数。在方法签名中,这由 * 表示,如下例所示:
// Greet many people
def greet(who: String*): String = ???
// all valid calls
greet()
greet("world")
greet("alice", "bob")
: 标记用于向编译器提供有关参数类型的提示,在这种情况下,_* 用于指定我们将集合作为参数列表传递:
def people: Seq[String] = getPeopleToGreet()
greet(people) // won't compile
greet(people: _*) // passes the collection of people as a list of arguments -- works
不确定 Python API 是如何工作的,但根据我的经验,我想你可以传递单个值或数组,所以我相信 Python 中不存在这个问题。