【问题标题】:How do I use scrapy re() selector?如何使用scrapy re() 选择器?
【发布时间】:2015-12-11 04:48:16
【问题描述】:

这是我的正则表达式:

".*\/(.*)\?ref"

这是我的测试字符串:

/product/sam/go-with-me?ref=popular

我可以得到:go-with-me
我确实尝试过https://regex101.com/#python

但是我不知道怎么用scrapy写, 它什么也得不到

这是我的代码:

for site in sites:
    title = sel.css("a::text").re(r".*\/(.*)\?ref")
    print title
    break

【问题讨论】:

  • 你能分享一个包含所需链接的示例 HTML 代码吗? (或分享网页的网址)

标签: python regex web-scraping scrapy


【解决方案1】:

如果不查看真实的 HTML 输入数据,很难说,但您可能只需要查看 href 属性值而不是文本:

for site in sites:
    title = site.xpath(".//a/@href").re(r".*\/(.*)\?ref")
    print title
    break

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2015-10-27
    • 2019-08-07
    • 1970-01-01
    相关资源
    最近更新 更多