【发布时间】:2020-06-28 14:12:22
【问题描述】:
Unix Split command拆分大数据的问题:split -l 1000 file.json myfile。想要将此文件拆分为多个文件,每个文件有 1000 条记录。但我将输出作为单个文件 - 没有变化。
P.S. 创建文件将 Pandas Dataframe 转换为 JSON。
编辑:事实证明,我的 JSON 格式设置为仅包含一行。 wc -l file.json 正在返回 0
这里是示例:file.json
[
{"id":683156,"overall_rating":5.0,"hotel_id":220216,"hotel_name":"Beacon Hill Hotel","title":"\u201cgreat hotel, great location\u201d","text":"The rooms here are not palatial","author_id":"C0F"},
{"id":692745,"overall_rating":5.0,"hotel_id":113317,"hotel_name":"Casablanca Hotel Times Square","title":"\u201cabsolutely delightful\u201d","text":"I travelled from Spain...","author_id":"8C1"}
]
【问题讨论】:
-
请说明要求,例如通过显示每个分区的外观。如需进一步指导,请参阅 minimal reproducible example。