【发布时间】:2019-08-23 17:34:25
【问题描述】:
我正在尝试使用 Spark CLI 读取 excel 文件,但我收到“org.apache.poi.openxml4j.exceptions.InvalidFormatException:您的 InputStream 既不是 OLE2 流,也不是 OOXML 流”错误。
以下是我的 Excel 工作表中的数据:
Id Name City
1 Amit Panji
2 Sharma Mumbai
3 Kumar Pune
4 Abhay Delhi
5 Rohit Gurgaon
下面是我正在使用的代码:
import com.crealytics.spark.excel
val df = spark.read.format("com.crealytics.spark.excel")
.option("useHeader", "true")
.option("startColumn", 0)
.option("treatEmptyValuesAsNulls", "false")
.option("inferSchema", "false")
.option("location", "/home/Desktop/lucky/logs.xlsx")
.option("addColorColumns", "False")
.load()
【问题讨论】: