【发布时间】:2018-08-02 09:48:17
【问题描述】:
我是一名 java 初学者,想学习如何以易于操作的方式读取文件和存储数据。
我有一个非常大的 csv 文件(18000 行)。数据代表利口酒店销售的所有不同饮料的分类。它由 16 列组成,标题为“文章编号、名称、生产商、酒精量等。这些列由“\t”分隔。
我现在想在此文件中进行一些搜索,以查找瑞典生产的产品数量以及查找最昂贵的利口酒/升等信息。
因为我真的想学习如何编程,而不仅仅是找到答案,所以我不在这里寻找任何确切的代码。相反,我正在寻找这背后的伪代码以及在处理大量数据时的一种良好思维方式以及最适合某项任务的数据结构。
让我们以“有多少产品来自瑞典”为例。 由于数据由字符串、整数和浮点数组成,我无法将所有内容都放在一个列表中。存储它以便以后可以操纵它的最佳方法是什么?或者我可以在解析后立即找到它,也许我根本不需要存储它?
【问题讨论】:
-
当您事先知道您的问题时,您不必存储所有数据。只需逐行读取文件,拆分每一行并计算所需的列。但是如果你想操作数据,那么你需要存储所有的行。
标签: java csv data-manipulation