【问题标题】:How to set/assign data type just reading CSV file in scala without knowing its schema如何在不知道其架构的情况下仅在 scala 中读取 CSV 文件来设置/分配数据类型
【发布时间】:2018-12-12 05:14:18
【问题描述】:

我有 CSV 文件,但我必须在不知道其数据类型和架构的情况下分配数据类型 我的意思是一切都是通过 scala 编程完成的有可能吗?? 我不知道如何在 scala 中编写代码,有人知道吗?

我是 scala 的新手,我只是对 scala 有基本的了解,我知道如何读取 csv 文件,但我没有它的架构和数据类型,这可能吗? 你能给我这样的答案吗 1)加载csv文件。 2)如何使用sparkSQL进行分析。 3)如何在scala中自动设置数据类型。

【问题讨论】:

  • 这个问题太宽泛了。到目前为止你尝试了什么,你在哪里卡住了?如果您对 scala 一无所知,那么解决方案是开始学习 scala,并且可能会在遇到这些问题时提出一些问题。
  • 对不起伊桑!我已经提到“我有 scala 的基本知识”,问题是我有一个关于 scala 的作业,问题陈述:首先我必须使用 spark-shell(scala shell) 加载 csv 文件,并且 CSV 文件没有它的模式和数据类型。默认情况下,如果我们没有提到这些,spark 会将字符串作为数据类型,将 _c0、_c1 作为列名。!那么有没有办法在不知道架构的情况下为列分配不同的数据类型,所以当我加载 csv 文件时,数据类型(如 int、float、string、作为列)必须自动分配!
  • 很抱歉这么久才回复你,我一直很忙。听起来您已成功将代码加载到 spark 中,但无法确定类型。你能告诉我们你有什么代码吗?不知道你究竟在哪里卡住或困惑,很难提供帮助。
  • 嘿 Ethan 我得到了一个答案 .option("InferSchema","True") 用于检测其数据类型

标签: scala apache-spark bigdata


【解决方案1】:

有推断架构,您可以将其添加到代码中作为选项。您需要代码示例吗?我可以提供scala代码。

【讨论】:

  • 嘿,非常感谢
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2021-07-07
  • 1970-01-01
  • 1970-01-01
  • 2015-08-24
  • 2015-08-30
  • 2020-11-12
相关资源
最近更新 更多