【问题标题】:Is it possible to get Google search result specifying period via curl or wget?是否可以通过 curl 或 wget 获取 Google 搜索结果指定时间段?
【发布时间】:2016-02-17 10:18:04
【问题描述】:

我知道如何通过 curl 获取谷歌搜索结果,例如:

curl -sA "Chrome" -L 'http://www.google.com/search?hl=en&q=candy&num=100&start=0' -o abc.html

但是,有点好奇,当我指定结果的时间段时,我无法获得有效的搜索结果。

curl -sA "Chrome" -L "https://www.google.com/search?q=candy&num=100&source=lnt&tbs=cdr%3A1%2Ccd_min%3A1%2F1%2F2010%2Ccd_max%3A12%2F31%2F2010&tbm=" -o /mytmp/out.html

我的意思是上面的命令是在浏览器上使用“搜索工具”->“指定 2010/1/1 到 2010/12/31”时的类似查询,如下图所示。但是,通过 curl,指定周期功能不起作用。我确认命令中的 URL 在 Firefox 等普通浏览器上运行良好。

如何通过 curl 或 wget 获取指定时段的谷歌搜索结果?

【问题讨论】:

    标签: curl google-search


    【解决方案1】:

    如果您查看源代码,您会发现日期在那里(我相信它是 javascript 的一部分)。

    Jan 1, 2010 \x26#8211; Dec 31, 2010
    

    当您使用 curl 执行此操作时,您很可能缺少 javascript 库文件(您的浏览器会自动下载该文件)。

    我在你的 curl 请求中使用了 -H "User-Agent: Mozilla/5.0 (Windows NT 6.1; WOW64; rv:44.0) Gecko/20100101 Firefox/44.0"

    【讨论】:

    • 谢谢!有用。通过添加头文件,curl 可以获取缺少的 java 脚本库,不是吗?在发布问题之前,我已经添加了“-A”选项(用户代理)。为什么“-A”选项不能模拟普通浏览器?
    • 你只使用Chrome 我认为它有一个不同的用户代理作为一个整体。我认为对于 Chrome,它是 Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2228.0 Safari/537.36
    猜你喜欢
    • 2015-12-18
    • 2018-11-24
    • 1970-01-01
    • 2022-06-30
    • 1970-01-01
    • 1970-01-01
    • 2019-01-29
    • 2011-06-20
    • 1970-01-01
    相关资源
    最近更新 更多