【发布时间】:2020-10-18 00:59:02
【问题描述】:
我需要对我的 JSON 数据进行一些处理,但事实证明我的 JSON 的格式设置为只包含一行。在终端上,wc -l file.json 正在返回 0
创建文件将 Pandas Dataframe 转换为 JSON。
这里是示例:file.json
[
{"id":683156,"overall_rating":5.0,"hotel_id":220216,"hotel_name":"Beacon Hill Hotel","title":"\u201cgreat hotel, great location\u201d","text":"The rooms here are not palatial","author_id":"C0F"},
{"id":692745,"overall_rating":5.0,"hotel_id":113317,"hotel_name":"Casablanca Hotel Times Square","title":"\u201cabsolutely delightful\u201d","text":"I travelled from Spain...","author_id":"8C1"}
]
【问题讨论】:
-
您的样本超过 1 行
-
您对上述问题的
jq要求是什么?似乎不清楚 -
如果我运行 wc -l file.json 它返回 0。它应该告诉我有一百万行。为什么我需要行数?因为我的数据很大。我想将它拆分为每个文件 10,000 条记录。我可以使用 Unix Split 命令拆分文件。为了将数据提供给 Split,我的数据应该有多行。 @ΔO'deltazero'
-
@Inian 这是我的问题:stackoverflow.com/q/62609271/2533173
标签: json data-science jq data-analysis data-cleaning