YOLO V1中关于bounding boxs的部分要点

news/2024/7/10 23:53:11 标签: YOLO, 人工智能, 算法

YOLO的核心原理预览

在这里插入图片描述

  • YOLO将输入的图片resize成448 x 448,并且为 S x S(S = 7)个grid,如果物体的中心落入该grid中,那么该grid就需要负责检测该物体。
  • 一次性输出所检测到的目标信息,包括类别位置

  • 对于每一个网格(grid),都会预测出B个bounding boxes(B=2),这个bounding boxes有5个量,分别是物体的中心位置(x,y)和它的高(h)和宽(w),以及这次预测的置信度(confidence score)。

  • 要注意:每个grid产生两个bounding boxs,如下左图中狗的中心点对应两个黄色框,以及自行车后轮外面的图像中心点对应的两个红色框,其中狗的中心点对应的两个bounding boxs(黄色),相对于自行车后轮外面的图像中心点对应的两个bounding boxs(红色)尺寸是不一样的,也说明bounding boxs的尺寸是根据目标自适应的:

  • 每个框还要负责预测这个框中的物体是什么类别的,共预测C个类。
    在这里插入图片描述

  • 综上,S×S 个网格,每个网格要预测 B个bounding box ,还要预测 C 个类。网络输出就是一个 S × S × (5×B+C)。(S x S个网格,每个网格都有B个预测框,每个框又有5个参数,再加上每个网格都有C个预测类)

YOLO-V1的网络架构:


输入图像大小: 448×448×3

过程中的参数含义:


损失函数:


①涉及的预测的位置参数值与对应的损失函数描述:
x, y, w, h :
对应的损失函数要尽量减小预测值与真实值之间的差距。
函数公式中 x, y 是使用 平方差值 来描述,而对于 w, h 使用了根号,是为了检测小物体时候,减小偏移量小的时候对于小物体的的敏感度。


损失函数中的系数,是相应的权重。

②关于置信度的损失函数(与类别有关):
平方置信度与真实值之间的差异(分为不同的情况讨论:前景(要检测的物体)、背景(无目标处))

③分类相关的损失函数:交叉熵损失函数
 

非极大值抑制:


只取出保留 IOU 数值最大的框。
YOLO-V1小结
YOLO-V1 整体网络架构简单,检测速度快。
网络中,每个 cell 只预测一个类别,若物体的位置重合时,检测困难。
每个点只有两个候选框,小物体考虑的少,检测效果一般,多标签检测效果不好。


http://www.niftyadmin.cn/n/5175397.html

相关文章

Clickhouse学习笔记(11)—— 数据一致性

使用合并树引擎时,无论是ReplacingMergeTree还是SummingMergeTree,都只能保证数据的最终一致性,因为数据的去重、聚合等操作会在数据合并的期间进行,而合并会在后台以一个不确定的时间进行,因此无法预先计划&#xff1…

多孔对跨孔电磁波CT联合反演

多孔对跨孔电磁波CT联合反演 前言 针对单一孔对跨孔电磁波CT反演数据拼接剖面不连续,相邻钻孔间吸收系数差异大的问题,采用多孔对跨孔电磁波CT联合反演。 1、多孔对数据拼接 将所有单一剖面连接为多孔剖面,以‘东大北大’的原则编号。 …

设计模式——外观模式(Facade Pattern)+ Spring相关源码

文章目录 一、外观模式定义二、 例子2.1 自定义例子2.1.1 定义服务1、2、3接口2.1.2 定义外观类 ServiceFacade2.2 Spring源码——ProxyFactoryBean2.3 日志门面框架slf4j 三、其他设计模式 一、外观模式定义 别名: 门面模式 类型: 结构型模式 目的&…

前端前沿技术

文章目录 网站静态化PWA - Progressive Web APP, 渐进式 Web 应用PWA 简介解决了哪些问题?PWA 的优势浏览器支持情况参考文档 Weex 是一个可以使用现代化的 Web 技术开发高性能原生应用的框架。高性能跨平台贴近前端生态被大规模的使用 GraphQL[一种用于 API 的查询语言](http…

spring boot集成mybatis

利用mybatis逆向工程生成的mapper文件和对应的配置文件,碰到以下问题 1、Invalid bound statement (not found)报错,可能有以下可能 对mapper.xml文件未加扫描,意思就是整个配置文件都没加载到,这个可以使用mapper类的其他方法&…

讲解人工智能在现代科技中的应用和未来发展趋势。

人工智能是一种能够模拟或复制人类智能的计算机技术。它已经广泛应用于许多领域,包括医疗、金融、交通、制造业、安全等领域。人工智能技术在现代科技中的应用和未来发展趋势如下: 医疗领域的应用:人工智能已经被用于医学影像分析、智能诊断和…

【论文精读】Pose-Free Neural Radiance Fields via Implicit Pose Regularization

今天读的是一篇发表在ICCV 2023上的文章,作者来自NTU。 文章地址:点击前往 文章目录 Abstract1 Intro2 Related Work3 Preliminary4 Proposed Method4.1 Overall Framework4.2 Scene Codebook Construction4.3 Pose-Guided View Reconstruction4.4 Train…

【数据库开发】DataX开发环境的安装部署(Python、Java)

文章目录 1、简介1.1 DataX简介1.2 DataX功能1.3 支持的数据通道 2、DataX安装配置2.1 DataX2.2 Java2.3 Python 3、DataX Web安装配置3.1 mysql3.2 DataX Web3.2.1 简介3.2.2 架构图3.2.3 依赖环境3.2.4 安装 4、入门使用4.1 DataX自带打印示例测试4.2 DataX生成任务模板文件4…