【问题标题】:FInd javascript-links with Python使用 Python 查找 javascript 链接
【发布时间】:2014-08-02 20:38:58
【问题描述】:

有什么方法可以用 python 在网页上找到 javascript 链接?我使用机械化,但找不到我想要的所有链接。我要本站图片上的url:http://500px.com/popular

【问题讨论】:

  • 你能发一个用例吗?
  • 具有预期输出的示例页面会有所帮助。
  • 想要本站图片上的url:500px.com/popular

标签: python beautifulsoup mechanize


【解决方案1】:

只需要 BeautifulSoup 这很容易:

js_links = soup.select('a[href^="javascript:"]')

这会选择所有具有href 属性且值以javascript: 开头的<a> 元素:

>>> from bs4 import BeautifulSoup
>>> soup = BeautifulSoup('''\
... <html><body>
... <a href="http://stackoverflow.com">Not a javascript link</a>
... <a name="target">Not a link, no href</a>
... <a href="javascript:alert('P4wned');">Javascript link (with scary message)</a>
... <a href="javascript:return False">Another javascript link</a>
... </body></html>
... ''')
>>> for link in soup.select('a[href^="javascript:"]'):
...     print link['href'], link.get_text()
... 
javascript:alert('P4wned'); Javascript link (with scary message)
javascript:return False Another javascript link

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2021-12-20
    • 2017-03-17
    • 1970-01-01
    • 2021-09-02
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2020-03-19
    相关资源
    最近更新 更多