【发布时间】:2021-10-16 09:48:14
【问题描述】:
我正在尝试读取不同文件夹中的多个 csv 文件
from pyspark.sql import *
spark = SparkSession \
.builder \
.appName("example") \
.config("spark.some.config.option") \
.getOrCreate()
folders = List("../../work/datainfo2/*.csv", "../../work/202003F1/*.csv")
df = spark.read.option("header", "false").csv(folders: _.csv)
df.createOrReplaceTempView("iris")
result = spark.sql("select * from iris where _c1 =1 order by _c0 desc")
result.show()
会报错
df = spark.read.option("header", "false").csv(folders: _.csv)
^
SyntaxError: invalid syntax
我在这里看到过类似的解决方法,但没有成功
【问题讨论】:
标签: python sql csv apache-spark pyspark