【问题标题】:Detect end of file for JPG images检测 JPG 图像的文件结尾
【发布时间】:2011-06-02 21:36:36
【问题描述】:

我通过 TCP 连续不断地从服务器向客户端发送许多图像。

现在在客户端,我应该如何有效地检测到这是一个图像的结尾,以便我可以将其保存到文件系统,然后处理下一个图像等等?

【问题讨论】:

  • “发送”使用什么协议?您的协议不知道文件何时自动结束吗?
  • 为什么不提前发送图片的长度?
  • 这个问题有一个普遍的价值——如果它不是关于你可以控制的协议,而是关于从没有人可以打开的代码的序列化格式中恢复数据,这恰好包含嵌入的 JPG ? “使用协议”不是“检测 JPG 图像中的 EOF”的方法

标签: jpeg


【解决方案1】:

好吧,不能保证您不会在 jpeg 图像中找到 FFD9。找到 jpeg 图像结尾的最好方法是解析它。除了 FFD0 到 FFD9 和 FF01(保留)之外,每个标记后面都会紧跟一个长度说明符,该长度说明符将为您提供该标记段的长度,包括长度说明符,但不包括标记。 FF00 不是标记,但出于您的目的,您可以将其视为没有长度说明符的标记。

长度说明符是两个字节长,它是大端。所以你要做的是搜索 FF,如果后面的字节不是 0x00、0x01 或 0xD0-0xD8 之一,你读取长度说明符并在流中向前跳过,只要长度说明符说减去两个字节。

此外,每个标记都可以在开头填充任意数量的 FF。

当您到达 FFD9 时,您处于流的末尾。

当然,您可以逐字阅读流,如果您想要性能,请搜索 FF,但这留给读者作为练习。 ;-)

【讨论】:

  • 我应该澄清第一句话。很明显,FFD9 位于图像的末尾。但 FFD9 可能嵌入在 JPEG 图像中,而不是 EOI 标记。这就是您必须解析 JPEG 以找到 EOI 标记的原因。
  • 总结:读取 0xFF。阅读标记。读取长度说明符 L 并向前跳 L - 2 个字节。在一个 SOS (0xFFDA) 段(后跟压缩数据)之后,向前跳到第一个 0xFF not,然后是 0x00 或 0xD0-0xD8。从头开始重复,直到遇到 0xFFD9。适用于this multi-scan JPEG
  • 这种方法容易受到损坏的图像(意外剪切的文件或恶意设计的假图像)的影响
  • @Alex 好吧,关键是,您不能只按顺序搜索 FFD9 并期望找到 jpeg 的结尾。我的方法与普通的 jpeg 解码器没有什么不同,所以如果它容易受到攻击,那么每个 jpeg 解码器也是如此。当然你应该知道你的缓冲区有多大,并检查一下,以免你试图读取它之外的内容。
  • 据我所知,在 jpeg(实际数据)的扫描部分中,每个 FF 字节(代表一个像素,而不是 标记)后跟a 00. 完全避免冲突的问题。例如,在我刚刚打开的示例 jpeg 中,FFD9 表示为 FF 00 D9。所以不,可以保证您不会在实际的“像素”部分找到 FFD9。为困惑的人发帖,就像我一样。
【解决方案2】:

快速浏览一下Wikipedia's JPEG article 会给你答案:

  • 字节0xFF,0xD8表示图像开始
  • 字节0xFF,0xD9表示图像结束

【讨论】:

  • 请注意,JPEG 中可能嵌入了 JPEG(例如缩略图),因此您可能会看到 SOI SOI EOI EOI 标记。请务必考虑到这一点。
  • @SB:是的。如果从流中读取未完成,则按顺序扫描 EOI SOI 标记,如果已完成,则扫描 EOI。
  • @NG。缩略图(使用您的示例)包含在包含长度字段的段中 - 您可以使用它来不在段内检查并防止过早检测到 EOI。
【解决方案3】:

如果您通过字节数组发送图像,那么您只需在文件开头之前将图像的文件大小添加为一对字节。
客户端抓取前两个字节以找到指定的字节数(我们将其称为x)并丢弃它们,然后将下一个x 字节数泵入它可以写入文件的缓冲区中。
冲洗并重复所有以下 jpeg。

另一种方法是寻找 FFD9 标记 - 如果我没记错的话,任何压缩值 FF 都将被编码为 FF00(丢弃 00 字节并保留 FF 字节)。
这样做的问题是,您会得到诸如带有自己的 FFD9 标头的缩略图之类的东西,但它们包含在标头的一个段中。这些段在其标记后的两个字节中都有一个长度值,因此您可以直接跳到遇到的任何段的末尾,以避免过早的 eoi 检测。

【讨论】:

    猜你喜欢
    • 2012-04-20
    • 1970-01-01
    • 2012-01-22
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2018-03-29
    • 2013-07-12
    • 1970-01-01
    相关资源
    最近更新 更多