Yolov5更换上采样方式( 最近邻 / 双线性 / 双立方 / 三线性 / 转置卷积)

news/2024/7/11 1:39:20 标签: YOLO, 数学建模, 深度学习

原文地址: https://www.iotword.com/3138.html

1. 常用上采样方式介绍

1. 1 最近邻插值(Nearest neighbor interpolation)

在这里插入图片描述

>>> input = torch.arange(1, 5, dtype=torch.float32).view(1, 1, 2, 2)
>>> input
tensor([[[[ 1.,  2.],
          [ 3.,  4.]]]])
          
>>> m = nn.Upsample(scale_factor=2, mode='nearest')
>>> m(input)
tensor([[[[ 1.,  1.,  2.,  2.],
          [ 1.,  1.,  2.,  2.],
          [ 3.,  3.,  4.,  4.],
          [ 3.,  3.,  4.,  4.]]]])

1.2. 双线性插值(Bi-Linear interpolation)

在这里插入图片描述

>>> input = torch.arange(1, 5, dtype=torch.float32).view(1, 1, 2, 2)
>>> input
tensor([[[[ 1.,  2.],
          [ 3.,  4.]]]])
          
>>> m = nn.Upsample(scale_factor=2, mode='bilinear')  # align_corners=False
>>> m(input)
tensor([[[[ 1.0000,  1.2500,  1.7500,  2.0000],
          [ 1.5000,  1.7500,  2.2500,  2.5000],
          [ 2.5000,  2.7500,  3.2500,  3.5000],
          [ 3.0000,  3.2500,  3.7500,  4.0000]]]])
          
>>> m = nn.Upsample(scale_factor=2, mode='bilinear', align_corners=True)
>>> m(input)
tensor([[[[ 1.0000,  1.3333,  1.6667,  2.0000],
          [ 1.6667,  2.0000,  2.3333,  2.6667],
          [ 2.3333,  2.6667,  3.0000,  3.3333],
          [ 3.0000,  3.3333,  3.6667,  4.0000]]]])

1.3. 双立方插值(Bi-Cubic interpolation)

在这里插入图片描述

>>> input = torch.arange(1, 5, dtype=torch.float32).view(1, 1, 2, 2)
>>> input
tensor([[[[ 1.,  2.],
          [ 3.,  4.]]]])
          
>>> m = nn.Upsample(scale_factor=2, mode='bicubic') # align_corners=False
>>> m(input)
tensor([[[[0.6836, 1.0156, 1.5625, 1.8945],
          [1.3477, 1.6797, 2.2266, 2.5586],
          [2.4414, 2.7734, 3.3203, 3.6523],
          [3.1055, 3.4375, 3.9844, 4.3164]]]])

>>> m = nn.Upsample(scale_factor=2, mode='bicubic', align_corners=True)
>>> m(input)
tensor([[[[1.0000, 1.3148, 1.6852, 2.0000],
          [1.6296, 1.9444, 2.3148, 2.6296],
          [2.3704, 2.6852, 3.0556, 3.3704],
          [3.0000, 3.3148, 3.6852, 4.0000]]]])

计算效果:最近邻插值算法 < 双线性插值 < 双三次插值
计算速度:最近邻插值算法 > 双线性插值 > 双三次插值

1.4 三线性插值(Trilinear Interpolation)

在这里插入图片描述
当align_corners = True时,线性插值模式(线性、双线性、双三线性和三线性)不按比例对齐输出和输入像素,因此输出值可以依赖于输入的大小
在这里插入图片描述

1.5. 反池化

在这里插入图片描述

2. 转置卷积

在这里插入图片描述
yolov5默认采用的就是最近邻插值
在这里插入图片描述

2.1 实验结果

这里我将原本的最近邻插值的上采样方式替换为转置卷积;有人通过实验证明了确实涨点,但是我在VOC数据集上测试并没有涨点,mAP0.5大概掉了不到1点
在这里插入图片描述

2.2 修改方式:

  • 第一步;在models/yolo.py添加nn.ConvTranspose2d
    在这里插入图片描述
  • 第二步;models/yolo.py添加如下代码
    在这里插入图片描述
elif m is nn.ConvTranspose2d:
     if len(args) >= 7:
         args[6] = make_divisible(args[6] * gw, 8)
  • 第三步;修改配置文件,以yolov5s.yaml为例
# YOLOv5 🚀 by Ultralytics, GPL-3.0 license

# Parameters
nc: 80  # number of classes
depth_multiple: 0.33  # model depth multiple
width_multiple: 0.50  # layer channel multiple
anchors:
  - [10,13, 16,30, 33,23]  # P3/8
  - [30,61, 62,45, 59,119]  # P4/16
  - [116,90, 156,198, 373,326]  # P5/32

# YOLOv5 v6.0 backbone
backbone:
  # [from, number, module, args]
  [[-1, 1, Conv, [64, 6, 2, 2]],  # 0-P1/2
   [-1, 1, Conv, [128, 3, 2]],  # 1-P2/4
   [-1, 3, C3, [128]],
   [-1, 1, Conv, [256, 3, 2]],  # 3-P3/8
   [-1, 6, C3, [256]],
   [-1, 1, Conv, [512, 3, 2]],  # 5-P4/16
   [-1, 9, C3, [512]],
   [-1, 1, Conv, [1024, 3, 2]],  # 7-P5/32
   [-1, 3, C3, [1024]],
   [-1, 1, SPPF, [1024, 5]],  # 9
  ]


# YOLOv5 v6.0 head
head:
  [[-1, 1, Conv, [512, 1, 1]],
   [-1, 1, nn.ConvTranspose2d, [512, 4, 2, 1, 0, 512]],
   [[-1, 6], 1, Concat, [1]],  # cat backbone P4
   [-1, 3, C3, [512, False]],  # 13

   [-1, 1, Conv, [256, 1, 1]],
   [-1, 1, nn.ConvTranspose2d, [256, 4, 2, 1, 0, 256]],
   [[-1, 4], 1, Concat, [1]],  # cat backbone P3
   [-1, 3, C3, [256, False]],  # 17 (P3/8-small)

   [-1, 1, Conv, [256, 3, 2]],
   [[-1, 14], 1, Concat, [1]],  # cat head P4
   [-1, 3, C3, [512, False]],  # 20 (P4/16-medium)

   [-1, 1, Conv, [512, 3, 2]],
   [[-1, 10], 1, Concat, [1]],  # cat head P5
   [-1, 3, C3, [1024, False]],  # 23 (P5/32-large)

   [[17, 20, 23], 1, Detect, [nc, anchors]],  # Detect(P3, P4, P5)
  ]

出现下面这样子就是运行成功啦
在这里插入图片描述


http://www.niftyadmin.cn/n/408027.html

相关文章

flask+flask_sqlalchemy增删改查

虚拟环境: python3 -m venv venv 激活虚拟环境 source venv/Scripts/activate 使用flask run启动项目 $env:FLASK_APP‘app.py’ 热更新 $env:FLASK_DEBUG1 镜像&#xff1a; 清华&#xff1a;https://pypi.tuna.tsinghua.edu.cn/simple 阿里云&#xff1a;http://mirrors.al…

monkey测试关机/重启问题分析(一)

monkey测试停止、关机、重启问题分析 关机重启流程原因https://blog.csdn.net/a396604593/article/details/125640406 systemui关机dialoghttps://blog.csdn.net/a396604593/article/details/131092232 1、找到最后一行monkey的log。 发现monkey正常下发事件&#xff0c;自身…

Shell脚本攻略:文本三剑客之awk

目录 一、理论 1.awk原理 2.awk打印 3.awk条件判断 4.awk数组与循环 5.awk函数 6.常用命令 二、实验 1.统计磁盘可用容量 2.统计/etc下文件总大小 3.CPU使用率 4.统计内存 5.监控硬盘 一、理论 1.awk原理 &#xff08;1&#xff09;概念 awk由 Aho&#xff0c;W…

4.6 Monitor概念

目录 1、对象头2、原理Monitor3、原理之Synchronized4、原理之Synchronized进阶1&#xff09;轻量级锁2&#xff09;锁膨胀3&#xff09;自旋优化4&#xff09;偏向锁5&#xff09;锁消除 1、对象头 64 位虚拟机 在加锁的过程中&#xff0c;Mark Word中的62位将会指向操作系统…

Vue源码解析

【尚硅谷】Vue源码解析之虚拟DOM和diff算法 【Vue源码】图解 diff算法 与 虚拟DOM-snabbdom-最小量更新原理解析-手写源码-updateChildren] 文章目录 2. snabbdom 简介 及 准备工作2.1 简介2.2 搭建初始环境1. 安装snabbdom2. 安装webpack5并配置3. 复制官方demo Example 3. …

在Linux上安装Redis集群(redis-6.2.5)

记录&#xff1a;441 场景&#xff1a;在CentOS 7.9操作系统上&#xff0c;使用redis-6.2.5版本&#xff0c;在三台机器上&#xff0c;安装Redis集群。 版本&#xff1a;Redis-6.2.5&#xff0c;CentOS 7.9,Linux kernel-5.4.218,gcc 9.3.1。 1.主机规划 目标&#xff1a;使…

【3DsMAX】从零开始建房(5)

目录 1. 制作护栏 2. 制作梯子 3. 制作二层窗户 1. 制作护栏 选中顶部三条边线 点击“利用所选内容创建图形” 选择线性 此时我们就成功的创建了一个二维样条线 选中样条线上其中的一个点&#xff0c;移动点使线条缩短 缩小一点 渲染 同样的方法再制作一根 新建一个圆柱体 …

vue打包优化

性能优化的目的 1、项目启动速度&#xff0c;和性能 2、必要的清理数据 3、减少打包后的体积 性能优化的方向 路由懒加载去除生产版console.log的打印输出开发版使用依赖项&#xff0c;生产版使用在线CDN项目打包及配置 1. 路由懒加载 使用import()函数引用路由组件 impo…