【发布时间】:2018-05-08 22:03:55
【问题描述】:
我需要将 ascii char 转换为 unicode 转义
示例:
"&"
到
"\\u0026"
上下文:
我在输入中收到两个值,第一个是字符串,另一个是包含一些内容的原始字节。 在此之后,第一个字符串在正则表达式中用于捕获原始数据。
teste = "teste's teste & teste"
raw = '.... teste\'s teste \\u0026 teste",null,["here","here2"] ....'
在此之后,正则表达式与第一个 var teste 一起使用以在 var raw 中获取单词 here 和 here2,但是在第一个 var 中有一些像 & 之类的字符的情况下,他不能在 raw 中找到任何模式,因为在 raw 中,var 处于 unicode 转义中。
所以我尝试将一些字符(如 &)转换为 unicode 转义但没有成功
【问题讨论】:
-
什么 HTML 实体?您的字符串中没有 HTML 实体。
-
对不起,如果我不清楚这个问题,但问题只是将 & 转换为 unicode 转义,因为 & 在 html 实体表中有,我写这个,但如果你不喜欢标题,你能帮我取一个更好的标题吗?
-
@ahogen ,好吧,我真的整天都在搜索这个,也许我真的很菜鸟,但是如果你找到了,你可以分享一下吗?
-
"&" 已经是 ASCII;使用
unicode-escape编码将无效。 -
@IgnacioVazquez-Abrams 我需要这个在他被转义的另一个文本中使用正则表达式进行搜索:\
标签: python regex python-3.x parsing unicode