【发布时间】:2021-07-12 00:15:07
【问题描述】:
基于this的帖子,使用shuf是最快的方式:
import sh
sh.shuf("words.txt", out="shuffled_words.txt")
但是,此代码也会对标头进行洗牌。我的文件有一个标题,我不希望标题在数据中随机播放。
【问题讨论】:
-
您的文件有多大?您可以在 Python 中轻松随机播放!
-
我无法在内存中加载它,有多个文件每个100GB+
标签: python-3.x linux bash csv shuffle