【问题标题】:Get all the src (or SRC) URLs Java获取所有 src(或 SRC)URL Java
【发布时间】:2014-04-05 18:48:34
【问题描述】:

我正在尝试获取出现在字节数组中的所有 src(或 SRC)URL,但是,我不知道如何实现字节数组。我现在的代码提取了以 src= 或 SRC= 开头的所有 HTML 部分,并提取了正确的项目。但是,字节数组将如何在其中发挥作用?字节数组是可能包含 src(或 SRC)URL 的字符序列,从 URL 的内容初始化。此外,该函数末尾的向量字符串应该包含在数据中找到的所有 src 属性。我有一个 saveResource 函数,可以将资源保存在文件中,也可以保存在如下所示的字节数组中。

如何将程序提取的 src url 存储到字节数组中?

【问题讨论】:

  • “实现字节数组”是什么意思?当您问“字节数组将如何在其中发挥作用?”你指的是什么字节数组?你在下一句中自己回答这个问题。当您问“如何将程序提取的 src url 存储到字节数组中?”你指的是什么字节数组?
  • @guest 我指的是函数名 public static Vector getSourceUrls(byte[] data) 中包含的 byte[] 数据。我的任务是将 src url 存储到这个字节数组中,但我不知道该怎么做

标签: java url bytearray web-crawler


【解决方案1】:

您似乎在询问如何将Vector<String> 存储在字节数组中。这听起来很奇怪,所以我可能理解错了。

  • Vectors 是可序列化的。您可以使用ObjectOutputStream 将它们写入输出流。
  • ByteArrayOutputStream 实现了一个写入内存的OutputStream。它有一个方法toByteArray(),您可以调用该方法以将其内容作为字节数组获取。

这应该足以解决这个问题。

编辑:如果您需要将它放入 data 参数中,也许还有一些 System.arraycopy... 再次,很奇怪。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2020-05-12
    • 2016-06-09
    • 2015-12-04
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多