这是一般方法:
- 创建一个新的空白图像以添加组件
- 遍历图像中每个不同的非零值
- 为每个值创建一个掩码(为每个值提供多个 blob)
- 在面具上运行
connectedComponentsWithStats()
- 找到最大区域对应的非零标签
- 创建一个具有最大标签的蒙版,并将该值插入新图像的蒙版位置
这里令人讨厌的是第 5 步,因为 0 的值通常,但并不总是是最大的分量。所以我们需要得到面积最大的非零分量。
这是一些我认为可以实现一切的代码(可以肯定的是一些示例图像):
import cv2
import numpy as np
img = np.array([
[1, 0, 1, 1, 2],
[1, 0, 1, 1, 2],
[1, 0, 1, 1, 2],
[1, 0, 1, 1, 2],
[1, 0, 1, 1, 2]], dtype=np.uint8)
new_img = np.zeros_like(img) # step 1
for val in np.unique(img)[1:]: # step 2
mask = np.uint8(img == val) # step 3
labels, stats = cv2.connectedComponentsWithStats(mask, 4)[1:3] # step 4
largest_label = 1 + np.argmax(stats[1:, cv2.CC_STAT_AREA]) # step 5
new_img[labels == largest_label] = val # step 6
print(new_img)
显示所需的输出:
[[0 0 1 1 2]
[0 0 1 1 2]
[0 0 1 1 2]
[0 0 1 1 2]
[0 0 1 1 2]]
要查看代码,首先我们创建新的标记图像,难以想象地称为new_img,用零填充,稍后由正确的标签填充。然后,np.unique() 找到图像中的唯一值,我将获取除第一个值之外的所有值;请注意,np.unique() 返回一个排序数组,所以 0 将是第一个值,我们不需要找到零的分量。对于每个唯一的 val,创建一个填充有 0 和 1 的掩码,并在此掩码上运行连接的组件。这将用不同的标签标记每个不同的区域。然后我们可以抓取最大的非零标记组件**,为其创建一个遮罩,并将该 val 添加到该位置的新图像中。
** 这是在代码中看起来很奇怪的烦人之处。
largest_label = 1 + np.argmax(stats[1:, cv2.CC_STAT_AREA])
首先,您可以查看您为stats 数组的形状链接的答案,但每一行对应一个标签(因此标签0 将对应于第一行等),并且列已定义由整数 cv2.CC_STAT_AREA (只有 4)。我们需要确保我们正在查看最大的非零标签,所以我只查看第一个之后的行。然后,抓取最大区域对应的索引。由于我们去掉了零行,索引现在对应于label-1,所以加 1 以获得正确的标签。然后我们可以像往常一样屏蔽并插入值。