【发布时间】:2014-02-06 22:53:47
【问题描述】:
我的 Hadoop 集群上有一个大型 CSV 文件。文件的第一行是“标题”行,由字段名称组成。我想对此标题行进行操作,但我不想处理整个文件。另外,我的程序是用 Java 编写的并使用 Spark。
在 Hadoop 集群上仅读取大型 CSV 文件的第一行的有效方法是什么?
【问题讨论】:
-
讽刺?不确定。如果你觉得我可以做得更多,请告诉我。尝试学习如何正确使用 StackOverflow。谢谢。
-
是的讽刺。如果你说类似的话会好得多,我尝试了下面的方法,但它有这样那样的错误。
标签: java csv hadoop apache-spark