【问题标题】:I need to count all urls on page [duplicate]我需要计算页面上的所有网址 [重复]
【发布时间】:2012-09-12 22:10:50
【问题描述】:

可能重复:
How to use regular expressions to parse HTML in Java?

我需要用 Java 计算页面上的所有 url。我是Java的初学者。我需要关于我应该使用什么技术来计算 url 的建议。我想我可以使用正则表达式来检测 url 并计算 url,但我不舒尔

【问题讨论】:

  • 我会先写一个可以下载页面的程序。你走到那一步了吗?如果您对某些特定内容有问题,请发布一些代码,显示您尝试过的内容。
  • 我们需要更多。请确认:您想要一个打开与 URL 的连接、获取 HTML 内容并计算其中的 <a></a> 标记数的 JAVA 算法吗?
  • @sp00m & km1: user1595557 已经声明了I'm beginer in JavaI need advice in what technology ..,所以我不认为他/她会清楚地理解你们俩的意思(尽管你们提出的问题看起来合乎逻辑),我认为 user1595557 需要一些提示或起点来尝试一些东西。谢谢
  • 对不起,愚蠢的问题。完整的任务是:

标签: java jsp applet


【解决方案1】:

您可以使用传递给小程序的 url 计数吗? jQuery 会很容易地给你这样的: var aCnt = $('a').size(); aCnta 标签的计数。更多信息here.

【讨论】:

  • OP 没有谈论 JavaScript,更不用说 jQuery...
  • 是的,但提到了小程序,也提到了“我需要建议我应该使用什么技术来计算 url。”
【解决方案2】:

看看jsoup:

Document doc = Jsoup.connect("http://www.your-url.com/").get();
Elements links = doc.select("a");
int count = links.size();

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2013-09-04
    • 1970-01-01
    • 2021-05-29
    • 1970-01-01
    • 2018-02-19
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多