【发布时间】:2021-11-20 16:02:03
【问题描述】:
我有一个简单的代码,它以 csv 和 parquet 格式将数据写入 hdfs,我如何在这里编写可以测试以下组件的 scala 测试。由于代码在 jules 管道中运行,我实际上无法将数据写入 hdfs(在测试中)。任何建议都会有所帮助
df
.write.format("com.databricks.spark.csv")
.option("header", "true")
.mode("append")
.save(hdfspath)
【问题讨论】:
-
您可以拥有一个本地目录,用作“假”kdfw 目录。只需在测试中使用本地文件路径,它就可以立即工作。
-
你能详细告诉我或分享一些网站链接吗?或示例 sn-p
标签: scala dataframe apache-spark testing mocking