Drone-Yolo:一种高效的无人机图像目标检测神经网络方法

news/2024/7/11 1:56:57 标签: YOLO, 无人机, 目标检测

摘要

https://www.mdpi.com/2504-446X/7/8/526
在各种研究领域中,对无人机的图像进行目标检测是一项有意义的任务。然而,无人机的图像带来了独特的挑战,包括图像尺寸大、检测对象尺寸小、对象密集分布、对象重叠以及光线不足影响目标检测的准确性。本文提出了Drone-YOLO,这是一系列基于YOLOv8模型的多尺度UAV图像目标检测算法,旨在克服与UAV图像目标检测相关的特定挑战。为了解决大场景尺寸和小型检测对象的问题,我们对YOLOv8模型的颈部组件进行了改进。具体来说,我们采用了三层PAFPN结构,并加入了一个针对小尺寸物体量身定制的检测头,使用了大规模的特征图,从而显著提高了算法对小型目标的检测能力。此外,我们将sandwich fusion模块整合到颈部上下分支的每一层中。这种融合机制将网络特征与低级特征相结合,为不同层检测头提供了丰富的空间信息。我们使用depthwise separable evolution实现这种融合,它在参数成本和大的接收域之间达到了平衡。在网络的骨干中,我们采用RepVGG模块作为下采样层,提高了网络学习多尺度特征的能力并超越了传统的卷积层。提出的Drone-YOLO方法已在消融实验中进行评估,并与VisDrone2019数据集上的其他最先进方法进行了比较。结果表明,我们的Drone-YOLO (large) 在目标检测准确性方面优于其他基线方法。与YOLOv8相比,我们的方法在mAP0.5指标上取得了显著改进,在VisDrone2019-test上增加了13.4%,在VisDrone2019-val上增加了17.40%。此外,参数高效的Drone-YOLO (tiny) 仅使用5.25M个参数,在数据集上的表现与使用9.66M个参数的基线方法相当或更好。这些实验验证了Drone-YOLO方法在无人机图像目标检测任务中的有效性。


http://www.niftyadmin.cn/n/5139491.html

相关文章

第18期 | GPTSecurity周报

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预训练 Transformer(GPT)、人工智能生成内容(AIGC)以及大型语言模型(LLM)等安全领域应用的知识。在这里,您可以…

使用opencv的tracking模块跟踪目标

OpenCV跟踪模块算法介绍 OpenCV的tracking模块是一个功能强大的跟踪算法库,包含多种用于跟踪对象的算法。它可以帮助你在连续的视频帧中定位一个物体,例如人脸、眼睛、车辆等。 在OpenCV的tracking模块中,一些主要的跟踪算法包括&#xff1…

约会杭州云栖2023:为了无法计算的价值一起努力

🏆作者简介,黑夜开发者,CSDN领军人物,全栈领域优质创作者✌,CSDN博客专家,阿里云社区专家博主,2023年6月CSDN上海赛道top4。 🏆数年电商行业从业经验,历任核心研发工程师…

Flink1.18新特性生产环境应用的重点解读!

大家好,我是你们的群主王知无呀。 Flink 1.18已经于近期发布了。在这个新版本中新增了很多新的功能和特性。在这些特性中,有一些是生产环境非常重要的能力,大家在使用过程中可以重点参考和了解其中的原理。 算子级别状态保留时间TTL设置 首先…

40+专家齐聚共谋数据未来,StarRocks Summit 2023 议程公布!更多精彩议题等你探索...

数字经济时代,什么才是企业的核心竞争力? 答案是数据。 在过去的一年里,越来越多的企业率先行动起来,加入这场数智化的进程中,探寻最佳的底层数据架构模式和极致的数据分析方案。 作为数据进化的亲历者,Sta…

zip函数用法:解压与打包

解释 在 Python 中,zip 函数可以用于两种情况:打包(压缩)和解压(解包)。 1.打包(压缩): 当传递多个可迭代对象作为参数给 zip 函数时,它会将这些可迭代对象…

信息系统项目管理师教程 第四版【第9章-项目范围管理-思维导图】

信息系统项目管理师教程 第四版【第9章-项目范围管理-思维导图】 课本里章节里所有蓝色字体的思维导图

3.12每日一题(有理函数不定积分)

两种方法: 1、拆项,然后分别加项减项拆,把分母降幂 注: x凑x的平方时前面要乘1/2 分子为x的平方可以分一个x去凑x的平方 2、联想三角有理函数公式,使用三角函数求解 用tant替换x;再通过二倍角公式降幂即可 …