【发布时间】:2012-05-14 12:23:58
【问题描述】:
我想读取一个相当大的 csv 文件并对其进行处理(切片、切块、汇总等)interactively(数据探索)。我的想法是将文件读入数据库(H2)并使用SQL对其进行处理:
读取文件:我用Ostermiller csv parser
确定每一列的类型:我随机选择50行,导出每一列的类型(int、long、double、date、string)
我想用Squeryl来处理。为此,我需要动态创建一个案例类。这是目前为止的瓶颈!
我将文件上传到 H2 并使用任何 SQL 命令。
我的问题:
- 在 Scala 中是否有更好的通用交互方式来执行此操作?
- 有没有办法解决第三点?换一种说法,给定一个类型列表(对应于 csv 文件中的列),是否可以动态创建对应于 Squeryl 中的表的案例类?据我了解,我可以使用宏来做到这一点,但我没有足够的经验来做到这一点。
【问题讨论】:
-
你有没有想过使用 Scala 以外的东西?喜欢Gnu R?
-
@ziggystar 我在日常工作中广泛使用 R。它在 R 中绝对是可行的!我正在尝试探索 scala 进行数据分析...
-
这是一个高度相关的问题,得到了好评:dynamically creating case classes with macros