【发布时间】:2009-07-24 01:41:29
【问题描述】:
我正在尝试编写一个程序,该程序从文本文件中获取公司名称并在搜索引擎网站上搜索它们(SEC 的 Edgar 搜索)。每个搜索通常会出现 1-10 个唯一的搜索结果链接,因此我想使用 curl 单击带有相关公司名称的链接。链接页面有一个简短的摘要,其中包含术语“公司成立状态:”,然后是州名称。我希望解析州名。我无法理解如何使用 HTML 解析和 curl 及其类。我将不胜感激任何可能的帮助,例如步骤的简要概述或任何建议。谢谢。
【问题讨论】:
标签: java search parsing text curl