【问题标题】:jsoup search form results parsingjsoup 搜索表单结果解析
【发布时间】:2014-10-14 21:30:43
【问题描述】:

我想将结果页面放入 doc,但我进入 doc starturl 页面

doc=Jsoup.connect(startUrl).data("search_text", search)
                            .data("charset", "utf-8")
                            .data("top-search-button", "submit")
                            .timeout(0)
                            .post();

搜索表单html:

<div class="b-top-search">
    <form method="post" action="http://startUrl/search/" id="globalSearch" name="globalSearch">
        <div class="b-top-search-box">
            <i class="icon top-search-spinner"></i>
            <input type="text" class="top-search-input unfocus" value="Insert search text" autocomplete="off" id="g-search-input" name="search_text" longdesc="Insert search text">
            <button class="top-search-button" type="submit"><span>Find</span></button>
            <input type="hidden" name="charset" value="utf-8">
        </div>

        <!--Top-search-results-->
        <div class="b-top-search-results" id="g-search-result">
        <ul class="b-top-search-results__list"></ul>
        </div>
        <!--/Top-search-results-->
    </form>
</div>

【问题讨论】:

  • 我的回答有帮助吗?如果是,请接受它,以便可以关闭该主题。如果没有,请提供一些反馈,以便我提供帮助。如果您找到了解决方案,请提供答案并接受它,以便其他用户也可以使用它。

标签: jquery parsing http html-parsing jsoup


【解决方案1】:

不需要data("top-search-button", "submit"),因为top-search-button 是元素的class,而不是name。它没有name,因此它没有任何价值。也许服务器期望一些关于客户端的元数据(用户代理和引荐标头)。试试这个

doc=Jsoup.connect(startUrl).userAgent("Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:25.0) Gecko/20100101 Firefox/25.0")  
                           .referrer("http://www.google.com")   
                           .data("search_text", search)
                           .data("charset", "utf-8")
                           .timeout(0)
                           .post();

【讨论】:

  • 谢谢,我解决了类似这样的问题 'doc=Jsoup.connect(startUrl+"/search/").data("search_text", search) .data("charset", "windows-1251 ") .cookies(cookies) .userAgent("Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/36.0.1985.143 Safari/537.36") .referrer(starturl) .timeout(0) .post();'
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2017-10-14
  • 2013-10-24
相关资源
最近更新 更多