Yolov5创新:NEU-DET钢材表面缺陷检测,优化组合新颖程度较高,CVPR2023 DCNV3和InceptionNeXt,涨点明显

news/2024/7/10 23:58:36 标签: YOLO, 人工智能, 目标检测, python

1.钢铁缺陷数据集介绍

NEU-DET钢材表面缺陷共有六大类,分别为:'crazing','inclusion','patches','pitted_surface','rolled-in_scale','scratches'

每个类别分布为:

训练结果如下:

2.基于yolov5s的训练

map值0.742

 

2.1  Inception-MetaNeXtStage

 

论文地址: https://arxiv.org/pdf/2303.16900.pdf

代码: GitHub - sail-sg/inceptionnext: InceptionNeXt: When Inception Meets ConvNeXt

单位:NUS, Sea AI Lab(颜水成等人)

摘要:受ViT的 long-range 建模能力的启发,大核卷积来扩大感受野用于提升模型性能,比如ConvNeXt了采用7x7深度卷积。虽然这种深度操作符只消耗少量FLOPs,但高内存访问成本,它在很大程度上损害了强大计算设备上的模型效率。为了解决这个问题,我们提出将大核深度卷积分解为沿通道维度的四个并行分支,即小平方内核、两个正交带核和一个恒等映射。通过这种新的Inception深度卷积,我们构建了一系列网络,即IncepitonNeXt,它们不仅具有高吞吐量,而且保持了有竞争力的性能。

       图 1:准确性和训练之间的权衡吞吐量。 所有模型均在 DeiT 训练下进行训练超参数 [61、37、38、69]。 训练吞吐量在批量大小为 128 的 A100 GPU 上测量。ConvNeXt-T/kn 表示具有深度卷积的变体内核大小为 n × n。 InceptionNeXt-T 兼具两者ResNet-50 的速度和 ConvNeXt-T 的准确性。

 

图 2:MetaFormer、MetaNext、ConvNeXt 和 InceptionNeXt 的框图。 

     将Inception的思想和ConvNeXt的设计相结合,从而实现了对大核深度卷积的有效分解。这种分解不仅减少了参数量和计算量,而且保留了大核深度卷积的优势,即扩大了感受野和提高了模型性能。

对应博客:涨点神器:CVPR2023 InceptionNeXt当Inception遇见ConvNeXt,在Yolov5/Yolov7/Yolov8即插即用,小目标检测涨点明显_AI小怪兽的博客-CSDN博客

 2.2 DCNV3

 

论文:https://arxiv.org/abs/2211.05778

代码:GitHub - OpenGVLab/InternImage: [CVPR 2023 Highlight] InternImage: Exploring Large-Scale Vision Foundation Models with Deformable Convolutions

  理论部分参考知乎:CVPR2023 Highlight | 书生模型霸榜COCO目标检测,研究团队解读公开 - 知乎 

      不同于近来聚焦于大核的CNN方案,InternImage以形变卷积作为核心操作(不仅具有下游任务所需的有效感受野,同时具有输入与任务自适应空域聚合能力)。所提方案降低了传统CNN的严格归纳偏置,同时可以学习更强更鲁棒的表达能力。ImageNet、COCO以及ADE20K等任务上的实验验证了所提方案的有效性,值得一提的是:InternImage-H在COCO test-dev上取得了新的记录65.4mAP。 

 

对应博客:

涨点神器:Yolov8引入CVPR2023 InternImage:注入新机制,扩展DCNv3,助力涨点,COCO新纪录65.4mAP!_AI小怪兽的博客-CSDN博客

map为0.757

 

2.3 DCNV3+MetaNeXtStage

map为0.776

3.总结

通过引入CVPR2023 DCNV3和MetaNeXtStage思想,在钢铁缺陷中取得涨点从原始map值0.742提升至0.776,从原始且相比较于发表的一些论文,创新新颖程度好很多,有需要自取可以在自己数据集进行实验,并很有可能发表论文成功哦!!!

源码详见:

基于Yolov5的NEU-DET钢材表面缺陷检测,优化组合新颖程度较高:CVPR2023 DCNV3和InceptionNeXt,涨点明显_AI小怪兽的博客-CSDN博客


http://www.niftyadmin.cn/n/5035163.html

相关文章

C++:new 和 delete

个人主页 : 个人主页 个人专栏 : 《数据结构》 《C语言》《C》 文章目录 前言一、C内存管理1.内置类型2.自定义类型3.delete 与 new不匹配使用问题(VS平台下) 二、operator new 与 operator delete函数三、 new 和delete的实现原理内置类型自定义类型 四…

ChatGLM微调基于P-Tuning/LoRA/Full parameter(上)

1. 准备环境 首先必须有7个G的显存以上,torch >= 1.10 需要根据你的cuda版本 1.1 模型下载 $ git lfs install $ git clone https://huggingface.co/THUDM/chatglm-6b1.2 docker环境搭建 环境搭建 $ sudo docker pull slpcat/chatglm-6b:latest $ sudo docker run -it …

【星戈瑞】FITC-PEG-N3在抗体标记中的应用

​欢迎来到星戈瑞荧光stargraydye!小编带您盘点: FITC-PEG-N3在抗体标记中具有多样性的应用。抗体标记是将荧光染料与抗体结合,以实现对特定抗原的检测和可视化。以下是FITC-PEG-N3在抗体标记中的主要应用方面: 免疫组织化学&…

Steam VR Plugin 2.7.3爬坑指南

因为项目有VR串流的需要,于是就用起了PicoSteam VR串流,真是一把心酸泪,坑还真不少。有些解决了,有些没有,等待后续更新或者有好心人指点一下啊,进入正题。 (1)导入插件之后&#xf…

力扣刷题笔记28——验证回文串/isalnum/逆序string

上一篇:力扣刷题笔记26——最小的k个数/快速排序学习/快排与冒泡的时间复杂度 文章目录 题目:我的方法:isalnum函数逆序string 题目: 如果在将所有大写字符转换为小写字符、并移除所有非字母数字字符之后,短语正着读和…

蓝桥杯2023年第十四届省赛真题-异或和之和--题解

目录 蓝桥杯2023年第十四届省赛真题-异或和之和 题目描述 输入格式 输出格式 样例输入 样例输出 【代码实现】 大家觉得写得可以的话,可以加入QQ群907575059. 蓝桥杯2023年第十四届省赛真题-异或和之和 时间限制: 3s 内存限制: 320MB 提交: 241 解决: 66 …

滨州注册商标材料清单

1、资质材料及身份认证 (1)国内法人或其他组织:应当提交营业执照、法人登记证、事业单位法人证书、社会团体法人证书、律师事务所执业证书、医疗机构执业许可证等有效证件的复印件;办学许可证、期刊证、组织机构代码证等证件不能作…

Elasticsearch RestHighLevelClient 完整的各种查询

​​​​​​Elasticsearch Java High Level Rest Client API 主要分为: 全文查询 api,词项查询 api,特殊查询 api(按照聚合查询 api 和使用生成的建议查询 api 也算少数的特殊查询 api),复合查询 api。 ht…