【发布时间】:2019-09-30 12:50:24
【问题描述】:
我目前正在使用 sqlite3 python 包来访问数据库中表中的数据。 该表非常大 - 大约 100GB - 我想随机化它的行,因为它包含我的 NN 的训练数据,它需要多次查看整个数据。
目前我正在使用游标遍历表,它会根据我的系统内存获取表的一部分。
我知道如何随机访问数据,但我不知道如何以某种方式做到这一点,即我只能在一个时期内访问一次表中的所有数据。因此,我正在寻找一种方法来随机化整个表,即使这在计算上可能非常昂贵。
有没有简单的方法或者你有更好的建议? 谢谢!
【问题讨论】:
-
可能只查询主键/rowid 列,打乱结果然后根据随机化的rowid/主键值分块查询表
标签: python sqlite random-access