基于Pytorch的从零开始的目标检测( 三 ) _Pytorch

class BB_model(nn.Module):def __init__(self):super(BB_model, self).__init__()resnet = models.resnet34(pretrained=True)layers = list(resnet.children())[:8]self.features1 = nn.Sequential(*layers[:6])self.features2 = nn.Sequential(*layers[6:])self.classifier = nn.Sequential(nn.BatchNorm1d(512), nn.Linear(512, 4))self.bb = nn.Sequential(nn.BatchNorm1d(512), nn.Linear(512, 4))def forward(self, x):x = self.features1(x)x = self.features2(x)x = F.relu(x)x = nn.AdaptiveAvgPool2d((1,1))(x)x = x.view(x.shape[0], -1)return self.classifier(x), self.bb(x)7.训练对于损失，我们需要同时考虑分类损失和边界框回归损失，因此我们使用交叉熵和 L1 损失（真实值和预测坐标之间的所有绝对差之和）的组合。我已经将 L1 损失缩放了 1000 倍，因为分类和回归损失都在相似的范围内。除此之外，它是一个标准的 PyTorch 训练循环（使用 GPU）：
def update_optimizer(optimizer, lr):for i, param_group in enumerate(optimizer.param_groups):param_group["lr"] = lr def train_epocs(model, optimizer, train_dl, val_dl, epochs=10,C=1000):idx = 0for i in range(epochs):model.train()total = 0sum_loss = 0for x, y_class, y_bb in train_dl:batch = y_class.shape[0]x = x.cuda().float()y_class = y_class.cuda()y_bb = y_bb.cuda().float()out_class, out_bb = model(x)loss_class = F.cross_entropy(out_class, y_class, reduction="sum")loss_bb = F.l1_loss(out_bb, y_bb, reduction="none").sum(1)loss_bb = loss_bb.sum()loss = loss_class + loss_bb/Coptimizer.zero_grad()loss.backward()optimizer.step()idx += 1total += batchsum_loss += loss.item()train_loss = sum_loss/totalval_loss, val_acc = val_metrics(model, valid_dl, C)print("train_loss %.3f val_loss %.3f val_acc %.3f" % (train_loss, val_loss, val_acc))return sum_loss/total def val_metrics(model, valid_dl, C=1000):model.eval()total = 0sum_loss = 0correct = 0for x, y_class, y_bb in valid_dl:batch = y_class.shape[0]x = x.cuda().float()y_class = y_class.cuda()y_bb = y_bb.cuda().float()out_class, out_bb = model(x)loss_class = F.cross_entropy(out_class, y_class, reduction="sum")loss_bb = F.l1_loss(out_bb, y_bb, reduction="none").sum(1)loss_bb = loss_bb.sum()loss = loss_class + loss_bb/C_, pred = torch.max(out_class, 1)correct += pred.eq(y_class).sum().item()sum_loss += loss.item()total += batchreturn sum_loss/total, correct/total model = BB_model().cuda()parameters = filter(lambda p: p.requires_grad, model.parameters())optimizer = torch.optim.Adam(parameters, lr=0.006) train_epocs(model, optimizer, train_dl, valid_dl, epochs=15)8.测试现在我们已经完成了训练，我们可以选择一个随机图像并在上面测试我们的模型。尽管我们只有相当少量的训练图像，但是我们最终在测试图像上得到了一个相当不错的预测。
使用手机拍摄真实照片并测试模型将是一项有趣的练习。另一个有趣的实验是不执行任何数据增强并训练模型并比较两个模型。
# resizing test imageim = read_image('./road_signs/images_resized/road789.png')im = cv2.resize(im, (int(1.49*300), 300))cv2.imwrite('./road_signs/road_signs_test/road789.jpg', cv2.cvtColor(im, cv2.COLOR_RGB2BGR))# test Datasettest_ds = RoadDataset(pd.DataFrame([{'path':'./road_signs/road_signs_test/road789.jpg'}])['path'],pd.DataFrame([{'bb':np.array([0,0,0,0])}])['bb'],pd.DataFrame([{'y':[0]}])['y'])x, y_class, y_bb = test_ds[0] xx = torch.FloatTensor(x[None,])xx.shape # predictionout_class, out_bb = model(xx.cuda())out_class, out_bb

文章插图
总结现在我们已经介绍了目标检测的基本原理，并从头开始实现它，您可以将这些想法扩展到多对象情况，并尝试更复杂的模型，如 RCNN 和 YOLO！

基于Pytorch的从零开始的目标检测( 三 )

推荐阅读

葛荟婕|?葛荟婕爆料汪峰与章子怡交往时，追求过高圆圆，内涵章子怡先上钩！

为啥研究生学生证不享受景点门票优惠自费非公费研究生也不能

不锈钢水槽尺寸不锈钢水槽选购要点

我国能源生产消费逐步回升电力和天然气消费量超去年同期水平

谢霆锋|谢霆锋首次当导演，成龙亲自监制，蔡卓妍加盟，《新警察故事2》能否再创经典？

穿搭|杨颖不愧是模特出身，粉色纱裙穿出礼物感，生图颜值太真实

如何实现交换机不同VLAN、不同网段之间互访？

『TOPWOMEN时髦笔记』穿淡紫针织衫配衬衫裙，温柔似初恋女神，马思纯怒甩肥肉

电动星球News|可惜真粉实在太少，大众CEO迪斯豁出去了！带女儿度假一路直播ID.3

珩珩娱乐场■最小的竟然不是大力，而是她！，爱情公寓主角年龄曝光

中国心理卫生协会妇专委|我们如何自我防护和调整身心状态，疫情期间

王者荣耀|王者荣耀：用数据说话，末世和闪电匕首，如何选择才能收益最大化

小米|消息称MIUI 13正在内测：增加内存扩展技术等

烹饪|一道简单美味的东北家常菜，好吃又实惠！

朋友圈高质量精简短句?适合发朋友圈简单明了的句子

太平洋|“混江龙”李俊当上了暹罗国主错了，是暹罗王

心脏支架术后焦虑症怎么办

桂圆红枣茶的功效与作用有哪些

ZAKER生活|要和曼城利物浦争个高下，切尔西新援：兰帕德说了

红酒可以泡脚吗