【问题标题】:Extract some data using Regex使用正则表达式提取一些数据
【发布时间】:2018-04-16 14:38:34
【问题描述】:

我正在努力从一个 html 标记中提取 JSON 数据。更具体地说,它是一个 script 标签,使用 JSOUP 库我可以在 script 标签之间获取数据。但是里面有一些我无法提取的 JSON 数据。这是标签:

<script type="text/javascript">jwplayer.key="WbtWzGvcRNi6Tk+gtKldIbx+nn6lXZFvKiaO2g==";jwplayer("tvplayer").setup({playlist:[{image: "http://img.canlitvlive.io/yayin/trt1_480.jpg?1509735585",title:"TRT 1 Canlı Yayın - CanliTVLive.io",file : "http://yayin.canlitvlive.io/trt1/live.m3u8?tkn=8JD95lXv9dOUXwtgOTBYfw&tms=1509749985"}],...</script>

我需要来自file 标签的url,它位于jwplayer 中。我尝试使用正则表达式,例如我尝试过这样的事情: "playlist[\":\\s\\{]+file[\":\\s\\{]+\"([^\"]+)\""

但我对正则表达式没有太多经验,也无法找出正确的模式。有人可以帮忙吗?谢谢

【问题讨论】:

  • 我建议使用 HTML 解析器,然后使用 JSON 解析器。
  • 试过file:"(.*?)" ?
  • 感谢您的 cmets。 @CAustin 如果您对一些代码示例更具体?
  • @sln 非常感谢。我尝试使用该网站创建模式,但经过一些输入后我不知道如何继续。我应该学习一些正则表达式语法。再次感谢你。如果您愿意,可以将其发布为答案。

标签: java android html json regex


【解决方案1】:

我猜你只需要一些空格

file\s*:\s*"(.*?)"

https://regex101.com/r/4HldaP/3

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2013-04-04
    • 2015-02-24
    • 2017-02-28
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多