【问题标题】:how to use htmlparsing and curl in JAVA for this task...?如何在 JAVA 中使用 htmlparsing 和 curl 来完成这项任务......?
【发布时间】:2009-07-24 01:41:29
【问题描述】:

我正在尝试编写一个程序,该程序从文本文件中获取公司名称并在搜索引擎网站上搜索它们(SEC 的 Edgar 搜索)。每个搜索通常会出现 1-10 个唯一的搜索结果链接,因此我想使用 curl 单击带有相关公司名称的链接。链接页面有一个简短的摘要,其中包含术语“公司成立状态:”,然后是州名称。我希望解析州名。我无法理解如何使用 HTML 解析和 curl 及其类。我将不胜感激任何可能的帮助,例如步骤的简要概述或任何建议。谢谢。

【问题讨论】:

    标签: java search parsing text curl


    【解决方案1】:

    假设 HTML 相当基本,请使用 Mozilla Java HTML Parser 之类的内容。 getting started guide 将为您提供有关创建 DOM 的更多详细信息。 Java 有 builtin APIs 用于从 Web 下载内容,这些对您来说可能就足够了(而不是使用“curl”)。

    拥有 DOM 后,您可以使用标准 DOM API 导航到所需的链接和项目。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2014-09-22
      • 1970-01-01
      • 1970-01-01
      • 2016-08-13
      • 2021-02-20
      • 2020-12-26
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多