【发布时间】:2020-12-15 19:07:11
【问题描述】:
我有一个包含文件层次结构及其对应 CRC32 代码的文件:
Folder A\Folder C\File three.txt 56efd95f
Folder A\File one.txt b8e1b873
Folder A\Folder B\Folder D\File four.txt 56efd95f
Folder A\Folder B\File two.txt 21e8e9c9
我正在使用 notepad++,我需要知道一个能够查找具有相同 CRC32 的行的正则表达式。 在这个例子中,我希望找到第 1 行和第 3 行。
我知道\s[a-zA-Z0-9]{8,8}$ 可以匹配 CRC32,但如何检查这些匹配是否重复?
此外,如果我想删除除 CRC32 之外的所有内容,为什么不使用表达式 .*(?!\s[a-zA-Z0-9]{8,8}$) 将匹配项替换为空字符串并获得一个干净的 CRC32 列表?
【问题讨论】:
-
您也可以将文件导入 Excel/LibreOffice Calc 并按 CRC 列排序。然后滚动文件和身份副本。
-
@Robert Regex 更有趣
-
请参阅下面的答案以查找重复的 CRC 代码。如果您仍然有兴趣删除除 CRC 代码之外的所有内容,请尝试
.*\s(?=[a-zA-Z0-9]{8,8}$)并禁用. matches newline选项
标签: regex duplicates notepad++