【发布时间】:2020-02-04 17:43:35
【问题描述】:
我想使用 pyspark 从 s3 (s3://test-bucket/testkey.csv) 读取一个 csv 文件作为 spark 数据帧。我的集群在 spark 2.4 上运行。
我不需要使用任何 infer_schema、凭据 a.o.t。考虑到。并且 csv 文件不能作为粘合表被抓取。
您能否在此处粘贴您的基于 spark 会话并转换为 csv 到 spark 数据帧的 pyspark 代码?
在此先感谢您并致以最诚挚的问候
【问题讨论】:
标签: amazon-web-services csv amazon-s3 pyspark pyspark-dataframes