【发布时间】:2021-08-30 20:43:47
【问题描述】:
我想使用 REGEX 来匹配出现在第一个字母或数字之后的所有制表符。如下图所示,我有一个分层文本文件,每个级别的类别都标有 TAB (\t) 字符。
经过一些研究,我发现了几乎符合我愿望的正则表达式:
正则表达式:\b[\t]{1,}\b
问题:
如下图所示,此 REGEX 不会选择出现在以点结尾的字符串(1.、2.、3.、4. ...)之后出现的 TAB。
有谁知道如何在 REGEX 中也包含这种模式?
这是我的示例的部分文本:
BBHH Balanço Patrimonial
1. ATIVO Assets
1.1 CIRCULANTE
1.2 NÃO CIRCULANTE
2. PASSIVO Liabilities and Equity
3. RECEITAS
4. CUSTOS E DESPESAS
4.1 CUSTOS DE PRODUTOS VENDIDOS E SERVIÇOS
4.1.1 CUSTOS DE PRODUTOS VENDIDOS
4.1.1.1 CUSTOS DE PRODUTOS VENDIDOS
【问题讨论】:
标签: regex regex-group re regexp-replace