【问题标题】:Regex markdown string for key-value pairs键值对的正则表达式降价字符串
【发布时间】:2016-07-26 19:20:29
【问题描述】:

我的 Rails 应用程序正在从第三方服务检索数据,该服务不允许我将任意数据附加到记录,但确实有一个支持 Markdown 的描述区域。我正在尝试通过 Markdown cmets 将每条记录的数据传递到描述内容中的 Rails 应用程序:

[//]: # (POST:28|USERS:102,78,90)

... additional Markdown content.

我在 this answer 中找到了用于在 Markdown 中嵌入 cmets 的 [//]: # (...) 语法,我的想法是然后将管道分隔的键值对作为评论内容传入。

使用上面的示例,我希望能够解析描述内容字符串来解释键值对。在这种情况下,POST=28USERS=102,78,90。如果有帮助,此评论将始终出现在 Markdown 内容的第一行。

我想正则表达式是这里的路吗?非常感谢任何帮助!

【问题讨论】:

  • 我认为你的想法很好,但我建议不要使用你自己的手工序列化格式,而是在# 之后使用像 JSON 这样的标准。它将显着简化匹配和解析。

标签: ruby-on-rails ruby regex markdown


【解决方案1】:

你可以使用\G:

(?:^\[//\]:[^(]+\(\K # match your token [//]: at the beginning
|                    
\G(?!\A)\|           # or right after the previous match
)
(\w+):([\w,]+)       # capture word chars (=key)
                     # followed by :
                     # followed by word chars and comma (=val) 

a demo on regex101.com

【讨论】:

  • 这种Regexp可以在Ruby环境中执行吗?我不知道如何使用~s 括起一个正则表达式
  • @JodyHeavener:是的,只是escape the slashes
【解决方案2】:

您需要 2 个步骤来正确解析:

先找到评论:^\[\/\/\]: # \(([^)]*)\)

  • 这会捕获评论的内容。

然后解析内容:(\w+):([^|]+)(带全局标志)

  • 这会分别捕获键和值。

【讨论】:

  • 真的没有理由在两个单独的步骤中这样做。
  • 哦,我从你的回答中看到了你的表现。我是一名 JS 开发人员,没有该功能。很酷!
【解决方案3】:

正如我在上面的评论中提到的,您可以通过在# 之后使用像 JSON 这样的标准数据序列化格式来简化很多事情。例如:

require "json"

MATCH_DATA_COMMENT = %r{(?<=^\[//\]: # ).*}

markdown = <<END
[//]: # {"POST":28,"USERS":[102,78,90]}

... additional Markdown content.
END

p JSON.parse(markdown[MATCH_DATA_COMMENT])
# => { "POST" => 28, "USERS" => [102, 78, 90] }

正则表达式%r{(?&lt;=^\[//\]: # ).*} 使用否定的lookbehind 来匹配“[//]: #”之后的任何内容。

【讨论】:

    猜你喜欢
    • 2012-01-07
    • 2015-01-23
    • 1970-01-01
    • 2021-05-30
    • 1970-01-01
    • 2016-12-07
    • 2012-06-09
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多