【问题标题】:How to get all links from google如何从谷歌获取所有链接
【发布时间】:2015-06-15 06:13:29
【问题描述】:

在您搜索乐队和专辑前,我正在尝试在 google 上获取所有歌曲的链接: https://www.google.com/search?q=disturbed+asylum&ie=utf-8&oe=utf-8

所以我自己尝试了很多。我用过:

File input = new File("/tmp/input.html");
Document doc = Jsoup.parse(input, "UTF-8", "http://example.com/");
Elements links = doc.select("a[href]");

然后打印出所有的链接,但它并没有以这种方式将链接放在一边。然后我尝试获取 html 代码,然后通过那里搜索表格,但由于某种原因它没有拉出表格。有人有什么建议吗?

【问题讨论】:

    标签: java html hyperlink google-search


    【解决方案1】:

    我认为您的问题已在这里提出:java crawlers

    这就是你要找的吗?

    【讨论】:

    • 我已经有了一种获取 html 代码的方法,但由于某种原因,它可能会将 google 的右半部分算作不同的部分,因为表格没有显示在那里并且它没有抓住链接
    • 所以不能提取链接?
    • 我可以得到一个链接列表,但它没有给我我提到的表格中的链接
    • 尝试使用 xpath,您可以在知道其类名的情况下访问您的元素,因此在您的情况下它将是 xpath("//div[@class=\"someclass\""]
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2018-09-04
    • 2023-01-19
    • 1970-01-01
    • 2015-07-27
    • 2021-11-26
    • 2011-07-07
    • 1970-01-01
    相关资源
    最近更新 更多