【发布时间】:2016-09-05 01:30:36
【问题描述】:
所以我有一个包含数十万行的巨大文件。我想知道它包含多少个不同的会话或 ID。我真的以为这不会那么难做,但我找不到方法。
会话如下所示:
"session":"1425654508277"
所以该会话将有几千行,然后它会切换,不一定会增加一,我不知道是否有模式。所以我只想知道文档中出现了多少会话,彼此之间有多少不同(它们应该是连续的,但这不是我注意到的要求)。
有没有简单的方法来做到这一点?只有我发现甚至很接近的东西是 excel 宏和脚本,这让我认为我没有问正确的问题。我还发现了这个:Notepad++ incrementally replace,但对我来说没有帮助。
提前致谢。
【问题讨论】:
-
这和 JSON 有什么关系?
-
不仅仅是
cat data | uniq | wc? -
通过正则表达式搜索使用建议重复项上的答案。
-
嗯,它是一个json文件,键值类型为表达式。以便。也许使用 json 的人知道这样做? @torazaburo老实说,我并没有想到用unix命令来做,但我从来没有为一个非常大的文件做过,它可以毫无问题地做到吗?根据我的经验,这有点大。