【发布时间】:2019-06-14 20:49:32
【问题描述】:
我正在尝试使用 PyTorch 执行一些数字识别。我已经实现了大小为 32x32 的滑动窗口的卷积版本。这使我能够在图片中识别此大小范围的数字。
但现在让我们假设我有一个 300x300 大小的图像,其中一个数字占据了整个图像。我永远无法识别它......
我看到有人说图像需要重新缩放和调整大小。这意味着我需要创建初始图像的各种缩放版本,然后向我的网络提供这些“新”图像。
有人知道我该怎么做吗?
这是我的代码的一部分,如果有帮助的话..
# loading dataset
size=200
height=200
width= 300
transformer_svhn_test = transforms.Compose([
transforms.Grayscale(3),
transforms.Resize((height, width)),
transforms.CenterCrop((size, size)),
transforms.ToTensor(),
transforms.Normalize([.5,.5,.5], [.5,.5,.5])
])
SVHN_test = SVHN_(train=False, transform=transformer_svhn_test)
SVHN_test_loader = DataLoader(SVHN_test, batch_size=batch_size, shuffle=False, num_workers=3)
#loading network
model = Network()
model.to(device)
model.load_state_dict(torch.load("digit_classifier_gray_scale_weighted.pth"))
# loading one image and feeding the model with it
image = next(iter(SVHN_test_loader))[0]
image_tensor = image.unsqueeze(0) # creating a single-image batch
image_tensor = image_tensor.to(device)
model.eval()
output = model(image_tensor)
【问题讨论】:
标签: python pytorch object-detection