【问题标题】:Using HTMLUnit on a webpage generated by a servlet在 servlet 生成的网页上使用 HTMLUnit
【发布时间】:2011-07-23 03:03:51
【问题描述】:

如何使用 HTMLUnit 从由 java servlet 生成的网页中获取数据。当我尝试阅读网页时,我不断收到错误消息。 /getSurvey 是创建网页的 servlet,但我如何访问从 servlet 生成的 HTML。

最终的 WebClient webClient = new WebClient(); final HtmlPage page = webClient.getPage("http://survey-creator.appspot.com/getSurvey");

【问题讨论】:

  • 你得到的错误是......?
  • 页面是由servlet生成的,对HtmlUnit来说毫无意义。它是一种程序化网络浏览器,可以像任何其他浏览器一样访问网络资源。

标签: java servlets htmlunit


【解决方案1】:

HtmlUnit 并不是真正“只是”一个 HTML 解析器。这是一种程序化的网络浏览器。它旨在使用 Java 语言以编程方式浏览网页和/或填写 Web 表单。如果您的唯一目的是将 HTML 作为字符串获取,请使用真正的 HTML 解析器。我可以为此推荐Jsoup

String html = Jsoup.connect("http://stackoverflow.com").get().html();

就是这样。然而,它可以做的远不止这些,比如selecting elements of interest

另见:

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2020-04-22
    • 1970-01-01
    • 2012-08-20
    • 1970-01-01
    • 2011-02-27
    相关资源
    最近更新 更多