【发布时间】:2020-09-06 07:01:26
【问题描述】:
我希望从以下数据字段中提取 id 标签:
{"purchased_at":"2020-04-21T05:55:30.000Z","product_desc":"Garnier 2019 Shampoo","onhold":{"copyright":true,"country_codes":["ABC"],"scope":"poss"},"id":"8745485"}
当我使用'"id":\s*"(.*?)"' 时遇到此字段时,我使用的正则表达式会中断。
因为,只有部分字段有这样的额外保留标签:
{"purchased_at":"2020-04-21T05:55:30.000Z","product_desc":"All clear 2019 \n ","id":"7462764"}
整个文件的格式为:
{"info":[{"purchased_at":"","product_desc":"","id":""}{..}]}
【问题讨论】:
-
这看起来像 JSON,你应该使用
json模块,而不是正则表达式。 -
并且正则表达式问题不清楚。 “休息”到底是什么意思?
-
@mkrieger1 ID = re.search(id_pattern, match.group(0)) 当我尝试这个时,我得到 Nonetype has no group object。
标签: python python-3.x regex regex-group regex-greedy