【问题标题】:Escape double quotes within double quotes在双引号内转义双引号
【发布时间】:2013-06-17 07:11:35
【问题描述】:

我有一个字符串[{"Id":"1","msg":""Lorem Ipsum""}],我需要在其中转义引号内的引号,例如[{"Id":"1","msg":"\"Lorem Ipsum\""}]。我无权访问生成器代码来修改,所以我正在寻找正则表达式解决方案或高效的 Java 解决方案。

我尝试使用\"[^\"]*?(\"*)[^\"]*?\" 选择匹配项,但没有用。非常感谢任何帮助。提前致谢。

请注意,不能保证模式总是两个双引号在一起,也可以是"Lorem "Ipsum" test",应该变成"Lorem \"Ipsum\" test"

PS:我已经看过Regular expression to escape double quotes within double quotes

【问题讨论】:

  • 将链接问题中的解决方案移植到 Java 时发生了什么?
  • 它并没有像我上面显示的那样逃脱。它只是返回了初始字符串

标签: java regex json


【解决方案1】:

问题

有限自动机 - 正则表达式的理论等价物 - 无法解析递归结构。由于您可以有内引号,并且可能有内引号,因此您的问题无法使用正则表达式解决。

尽管现代正则表达式引擎可以通过几个扩展来解决这个问题,但不要浪费时间在引号内寻找引号。您很快就会发现您实际上正在构建一个成熟的 JSON 解析器。

作为@johnchen902 stated,即使是图灵机驱动的解析器也无法处理歧义 - 所以你最好不要尝试对损坏的 JSON 提出修复建议。

解决方案

使用专用实用程序创建 JSON

给定的字符串is not a valid JSON。它可能是使用字符串连接创建的,这通常是个坏主意,因为它不能正确转义。您应该使用可以从 Java 数据结构构建 JSON 的 JSON 库,例如 gson。创建一个对象列表,向其中添加一个对象到对象的字典,然后让库进行转义和转换。

请创建者使用验证器

如果您从外部来源收到了字符串,那么请求您可以使用的 valid json 是完全合法的。我猜是创建者将字符串拼接在一起,这是构建结构化语言的错误方法。要求原始创建者使用标准库来创建 JSON,或者至少使用验证器。所有现代编程语言都提供这些机制。

【讨论】:

  • 我认为 OP 想知道如何以编程方式逃避这一点。
  • 它甚至无法被解析器解析,因为一个字符串可能有多种含义。例如,请参阅我的答案。
  • @johnchen902 正确,但至少可以验证并选择任意数量的可能解释之一。关键是它没有用 - OP 应该创建或接收有效的 JSON,而不是修复损坏的字符串。
  • 不错的解决方案@AdamMatan
【解决方案2】:

不,你不能,因为一个字符串可能有多种含义。

例如:

[{"Id":"1","msg":""Lorem Ipsum""}]

五月的意思

[{"Id":"<b><i>1","msg":""Lorem Ipsum"</i></b>"}]

即可以转义(解析)为

[{"Id":"1\",\"msg\":\"\"Lorem Ipsum\""}]

除非给出更多规则,否则程序无法确定其含义。

【讨论】:

    【解决方案3】:
    String escaped = str.replaceAll(":\"\"(.+?)\"\"([,}])", ":\"\\\\\"$1\\\\\"\"$2");
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2011-04-19
      • 2020-11-26
      • 2015-09-06
      • 2015-11-06
      相关资源
      最近更新 更多