【发布时间】:2016-09-08 18:44:47
【问题描述】:
我正在使用数据抓取工具:Import.io 和 Portia。
它们都允许你为爬虫定义一个正则表达式来遵守。 例如网址:https://weedmaps.com/dispensaries/pdi-medical
我将如何解释结尾的“pdi-medical”?
我已经全面了解并了解如何在 JS 环境中使用正则表达式,但对于我在 Portia/Import.io 上的输入中到底输入了什么有点困惑
这样的? https://weedmaps.com/dispensaries//^[a-zA-Z0-9-_]+$/
【问题讨论】: