【发布时间】:2020-11-27 21:34:37
【问题描述】:
我想编辑这个 HTML 词法分析器规则,我需要正则表达式方面的帮助 TAG_NAME 指的是任何 HTML 属性,例如:(必需、类、id 等...)。 我想对其进行编辑以使其不接受这种确切的语法:'az-'。 我认为这需要修改正则表达式,我查了一下,但我无法将我在网上找到的内容与这些规则的编写方式相结合。 我第一次尝试删除 Tag_NameChar 中的“-”,但这使得 HTML 无法识别“data-target”等属性。
这个sn-p是为了规则:
这个展示了如何识别属性。
【问题讨论】:
-
" 我想编辑它以使其不接受这个确切的语法:'az-'" 这是否意味着你特别不想允许确切的标签名称
az-,但是说ab-可以吗?或者您不想接受任何以破折号结尾的名称?或者由两个字母后跟一个破折号组成的任何名称?或者是其他东西? “我无法将我在网上找到的内容与这些规则的编写方式相结合”你在网上找到了什么? -
ab- 没问题 我希望完全排除 az- 我正在使用 antlr4 我发现这个正则表达式: (?![enp])[a-z] 只排除我想要的 a-z 中的字母排除整个字符串
标签: html regex compiler-construction tokenize lexer