【发布时间】:2018-04-16 14:38:34
【问题描述】:
我正在努力从一个 html 标记中提取 JSON 数据。更具体地说,它是一个 script 标签,使用 JSOUP 库我可以在 script 标签之间获取数据。但是里面有一些我无法提取的 JSON 数据。这是标签:
<script type="text/javascript">jwplayer.key="WbtWzGvcRNi6Tk+gtKldIbx+nn6lXZFvKiaO2g==";jwplayer("tvplayer").setup({playlist:[{image: "http://img.canlitvlive.io/yayin/trt1_480.jpg?1509735585",title:"TRT 1 Canlı Yayın - CanliTVLive.io",file : "http://yayin.canlitvlive.io/trt1/live.m3u8?tkn=8JD95lXv9dOUXwtgOTBYfw&tms=1509749985"}],...</script>
我需要来自file 标签的url,它位于jwplayer 中。我尝试使用正则表达式,例如我尝试过这样的事情:
"playlist[\":\\s\\{]+file[\":\\s\\{]+\"([^\"]+)\""
但我对正则表达式没有太多经验,也无法找出正确的模式。有人可以帮忙吗?谢谢
【问题讨论】:
-
我建议使用 HTML 解析器,然后使用 JSON 解析器。
-
试过
file:"(.*?)"? -
感谢您的 cmets。 @CAustin 如果您对一些代码示例更具体?
-
@sln 非常感谢。我尝试使用该网站创建模式,但经过一些输入后我不知道如何继续。我应该学习一些正则表达式语法。再次感谢你。如果您愿意,可以将其发布为答案。
标签: java android html json regex