【问题标题】:how to get href value from javascript onclick attribute in python using scrapy?如何使用scrapy从python中的javascript onclick属性中获取href值?
【发布时间】:2018-10-24 23:54:30
【问题描述】:
<td class="headerStyle">
   <input type="image" 
       name="ctl00$ContentPlaceHolder1$gvfacletails$ctl19$lnkView" 
       id="lnkView" title="View" src="images/view.png" 
       onclick="javascript:WebForm_DoPostBackWithOptions(new WebForm_PostBackOptions("ctl00$ContentPlaceHolder1$gvfaculetails$ctl19$lnkView", "", false, "", "viewculty.aspx?FacultyID=Li9S-20151", false, false))">
</td>

如何使用scrapy在python中从上面的javascript onclick中提取这个href viewculty.aspx?FacultyID=Li9S-20151

【问题讨论】:

  • 正则表达式?
  • 在 python scrapy 中提取该链接并通过回调解析的最佳方法是什么?

标签: javascript python-2.7 scrapy


【解决方案1】:
href = response.xpath('//input[@id="lnkView"]/@onclick').re_first( r'([^"]+\?[^"]+)' )

上面我正在使用正则表达式并搜索 ? 和周围未加引号的符号

【讨论】:

    猜你喜欢
    • 2018-10-26
    • 2013-09-08
    • 2019-01-18
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2011-06-11
    • 2015-10-09
    相关资源
    最近更新 更多