【发布时间】:2018-08-17 17:35:01
【问题描述】:
我对 scala 中的 spark 数据框有疑问。我正在使用方法var df = spark.read.format("csv").load("csvfile.csv") 来读取CSV 文件并将其存储在DF 中。我的 CSV 文件有 16 行我不想阅读的一些 cmets。我还没有找到避免标题的方法,但它只有一行。任何想法?
谢谢。
【问题讨论】:
-
有
comment用于 spark csv 加载... -
cmets 是否被任何东西分隔?
-
我不能使用
coment方式,因为它们必须以“#”开头,但就我而言,我的行以任何字符开头,我无法更改。了解 cmets 限制的唯一方法是它们总是占用 16 行。 -
您可以对任何符号使用注释选项。它适用于数字/特殊字符/字母。
标签: scala apache-spark apache-spark-sql