目标检测数据预处理——部件截图,按一定比例进行外扩

news/2024/7/10 23:42:09 标签: python, YOLO, 深度学习, 计算机视觉, 目标检测

本片是截图的篇的升级版本,简单版本的截图请参考根据目标框外扩一定比例进行截图(连带标签)。

对目标框(类别名称)进行分类,将同一类的目标框进行截图并分类保存在不同的文件夹中。

  1. 在本篇当中,我关注的是对人的不同部位的检测,所以我分为4类部件:头部区域(头、帽子、眼睛、眼睛……)、身体区域(各种工服)、手部区域(手、手套)、脚部区域(靴子、雨鞋、没穿鞋)。
  2. 而截图方式也是跟简单篇一样,保留截图区域内的目标框。
    特别说明,每类部件只会截部件范围的大图,例如头部区域内的眼睛、眼镜之类的不会单独截那么小的图,没有太多的意义,只会对头部帽子等的目标框进行截图,保留其内的眼睛、眼镜等。
  3. 这里相对于简单篇升级的不仅是从一类的截图升级到部件的截图,还有外扩范围也从上下左右外扩固定范围到根据图片大小按比例外扩。本篇的升级版是按随机比例外扩。
python">'''
cut 4 part in [head, body, hand, foot]
generate small pic of some rate extend
and generate corresponding json
'''
from copy import deepcopy
import cv2
import json
import os

img_path = "/data/weardata/images"
json_path = "/data/weardata/json"
save_path = "/data/weardata/save"
head_save = os.path.join(save_path, "head")
body_save = os.path.join(save_path, "body")
hand_save = os.path.join(save_path, "hand")
foot_save = os.path.join(save_path, "foot")

# 4部件分类
head_label = ["head", "hat", "workhat", "helmet"]
body_label = ["blueworkclothes", "cloth", "refvest", "apron", "whiteworkclothes"]
hand_label = ["glove", "inglove", "hand"]
foot_label = ["shoes", "inshoes", "noshoes"]

# 只需要创建好存放图片、json、截图后文件的三个路径即可,其余部件路径自己创建
save_path = [head_save, body_save, hand_save, foot_save]
for s_p in save_path:
    if not os.path.exists(s_p):
        os.mkdir(s_p)

def cut_part(json_data, part_label, save_path, img_file, img_h, img_w, x_e, y_e):
    i = 0
    for shape in json_data["shapes"]:
        [x_extend, y_extend] = [x_e, y_e]
        json_data_1 = deepcopy(json_data)
        if shape["label"] in part_label:
            img_save = os.path.join(save_path, os.path.splitext(os.path.split(img_file)[-1])[0] + ".jpg")
            json_save = save_path + "/" + file
            if os.path.exists(json_save):
                json_save = save_path + "/" + str(i) + file
                img_save = save_path + "/" + str(i) + os.path.splitext(os.path.split(img_file)[-1])[0] + ".jpg"
                json_data_1["imagePath"] = str(i) + os.path.splitext(os.path.split(img_file)[-1])[0] + ".jpg"
                i += 1
            print("-----------------------------")
            p = shape["points"]
            print(p)
            print(x_extend, y_extend)
            x_extend = int(abs(p[1][0] - p[0][0]) * x_e)
            y_extend = int(abs(p[1][1] - p[0][1]) * y_e)
            print(x_extend, y_extend)
            x1 = int(min(p[0][0], p[1][0])) - x_extend
            y1 = int(min(p[0][1], p[1][1])) - y_extend
            x2 = int(max(p[0][0], p[1][0])) + x_extend
            y2 = int(max(p[0][1], p[1][1])) + y_extend
            # 判断截图是否超过范围
            if x1 < 0:
                x1 = 0
            if y1 < 0:
                y1 = 0
            if x2 > img_w:
                x2 = img_w
            if y2 > img_h:
                y2 = img_h
            print(x1, y1, x2, y2, p[0][0], p[0][1], p[1][0], p[1][1])
            print("-----------------------------")
            inpart_label = []
            for shape1 in json_data_1["shapes"]:
                m_p = shape1["points"]
                m_x1 = int(min(m_p[0][0], m_p[1][0]))
                m_y1 = int(min(m_p[0][1], m_p[1][1]))
                m_x2 = int(max(m_p[0][0], m_p[1][0]))
                m_y2 = int(max(m_p[0][1], m_p[1][1]))
                m_p[0][0] = m_x1
                m_p[0][1] = m_y1
                m_p[1][0] = m_x2
                m_p[1][1] = m_y2

                # 过滤哪些目标框留住
                if shape1["label"] == "other" and ((x1 < m_x1 < x2 or x1 < m_x2 < x2)\
                    and (y1 < m_y1 < y2 or y1 < m_y2 < y2)):
                    inpart_label.append(shape1)
                if x1 < (m_x1 + m_x2)/2 < x2 and y1 < (m_y1 + m_y2)/2 <y2:
                    if part_label == hand_label:
                        if shape1["label"] in hand_label:
                            inpart_label.append(shape1)
                    else:
                        inpart_label.append(shape1)
                else:
                    continue
                # print(m_x1, m_y1, m_x2, m_y2)
            img = cv2.imread(img_file)
            try:
                img = img[y1:y2, x1:x2, :]
            except TypeError:
                print(img_file, shape["label"])
                input()
            json_data_1["shapes"] = []
            for p_label in inpart_label:
                m_p = p_label["points"]
                m_p[0][0] = m_p[0][0] - x1
                m_p[0][1] = m_p[0][1] - y1
                m_p[1][0] = m_p[1][0] - x1
                m_p[1][1] = m_p[1][1] - y1
                # 判断目标框是否超出范围
                if m_p[0][0] < 0:
                    m_p[0][0] = 0
                if m_p[0][1] < 0:
                    m_p[0][1] = 0
                if m_p[1][0] > x2 - x1:
                    m_p[1][0] = x2 - x1
                if m_p[1][1] > y2 - y1:
                    m_p[1][1] = y2 - y1
                json_data_1["shapes"].append(p_label)
            json_data_1["imageHeight"] = y2 - y1
            json_data_1["imageWidth"] = x2 -x1
            json.dump(json_data_1, open(json_save, "w"), ensure_ascii=False, indent=2)
            cv2.imwrite(img_save, img)

files = os.listdir(json_path)
for file in files:
    if os.path.splitext(file)[-1] != ".json":
        continue
    
    # 指定各种图片格式,若还有别的格式的图片可以自己添加
    img_file = os.path.join(img_path, file.split(".json")[0] + ".jpg")
    if not os.path.exists(img_file):
        img_file = os.path.join(img_path, file.split(".json")[0] + ".png")
        if not os.path.exists(img_file):
            img_file = os.path.join(img_path, file.split(".json")[0] + ".jpeg")
    json_file = os.path.join(json_path, file)
    json_data = json.load(open(json_file))
    img_h = json_data["imageHeight"]
    img_w = json_data["imageWidth"]

    # 根据一定的比例进行外扩
    cut_part(json_data, head_label, head_save, img_file, img_h, img_w, 0.3, 0.2) # head
    cut_part(json_data, body_label, body_save, img_file, img_h, img_w, 0.25, 0.05) # body
    cut_part(json_data, hand_label, hand_save, img_file, img_h, img_w, 0.3, 0.2) # hand
    cut_part(json_data, foot_label, foot_save, img_file, img_h, img_w, 0.2, 0.2) # foot
  1. 这里的外扩比例是左右一个比例,上下一个比例,可以自己调。比如我的body部件的区域比较长,所以上下的比例会比较小。
  2. 截图后保留的目标框有以下两个过滤条件:
    a.中心点没有落入截图区域内不留(没有超过一般),除了“other”标签(特征有歧义的涂黑标签);
    b.手部区域的非本类部件的类别不留。因为手部区域很大概率在body区域之内,中心点很可能落入其中,若是把body的框保留再根据目标框不超过截图范围,则整个截图的范围都是body框,但手部区域相对body区域小很多所以保留的body框的特征基本上全被破坏。
  3. 这里有两处范围判断:一处是截图时截图范围不能超过原图范围;二是目标框范围不能超过截图范围。都是超过最大按最大、低于最小按最小的方式处理。

截图前:

第1张图片有head、hand、foot这三个部件的目标框。
在这里插入图片描述
第2张图片有head、hand、body这三个部件的目标框。
在这里插入图片描述

截图后:

自己生成4个部件的保存路径。在这里插入图片描述

1.搜索第1张图的截图效果

1)搜索第1张图内的head区域

a.截取的图片:
在这里插入图片描述
b.选取其中一张labelme打开:
在这里插入图片描述

2)搜索第1张图内的hand区域

a.截取的图片:
在这里插入图片描述

b.选取其中一张labelme打开:
在这里插入图片描述

3)搜索第1张图内的foot区域

a.截取的图片:
在这里插入图片描述
b.选取其中一张labelme打开:
在这里插入图片描述

2.搜索第2张图的截图效果

1)搜索第2张图内的head区域

a.截取的图片:
在这里插入图片描述
b.选取其中一张labelme打开:
在这里插入图片描述

2)搜索第2张图内的body区域

a.截取的图片:
在这里插入图片描述
b.选取其中一张labelme打开:
在这里插入图片描述

3)搜索第2张图内的hand区域

a.截取的图片:
在这里插入图片描述
b.选取其中一张labelme打开:
在这里插入图片描述


http://www.niftyadmin.cn/n/347708.html

相关文章

docker是怎么决定容器内容存储到哪个目录的?(存储驱动决定的)(乱七八糟的)(df -Th查看目录文件系统类型、查看文件系统类型)

文章目录 docker是怎么决定容器内容存储到哪个目录的&#xff1f;docker对我/var这个目录有没有什么要求&#xff0c;比如要求它的文件系统是指定的类型如果我Docker的默认存储驱动是overlay2&#xff0c;但是我/var目录的文件系统不是overlay2&#xff0c;这没影响吗&#xff…

001. 为啥用IDEA反编译没有擦除泛型?

你好&#xff0c;我是YourBatman&#xff1a;一个俗人&#xff0c;贪财好色。 &#x1f4da;前言 Java泛型是进阶高级开发必备技能之一&#xff0c;了解实现泛型的基本原理&#xff0c;有助于写出更优质的代码。 众所周知&#xff0c;Java是伪泛型&#xff0c;是通过类型擦除…

Android和iOS双端赞奇超级云盘APP公测版正式上线!

赞奇云工作站自发布以来&#xff0c;经过层层迭代和升级&#xff0c;以云工作站、赞奇超级云盘、软件中心、云渲染等功能&#xff0c;更高效地整合打通各行设计业务全流程&#xff0c;实现云上数字内容创作的完美呈现&#xff0c;取得了广大用户的喜爱和认可。 现在&#xff0…

软件测试被00后整顿职场了?

00后带来的压力 公司一位工作3年的老油条工资还没有刚来的00后高&#xff0c;她心中不平&#xff0c;对这件事情有不小的怨气&#xff0c;她觉得自己来公司三年了&#xff0c;三年内迟到次数都不超过5次&#xff0c;每天勤勤恳恳&#xff0c;要加班的时候也愿意加班&#xff0…

数据分析与预处理常用的图和代码

1.训练集和测试集统计数据描述之间的差异作图&#xff1a; def diff_color(x):color red if x<0 else (green if x > 0 else black)return fcolor: {color}(train.describe() - test.describe())[features].T.iloc[:,1:].style\.bar(subset[mean, std], alignmid, colo…

Cam APP-HAL流程追踪之demo梳理

一、基础知识 1、Google官网的Cam流程如下图1 2、Cam的预览、拍照、录像是分开的 Cam的预览、拍照、录像是各自独立的-换句话说可以不开启预览拍照或者录像–后面代码会详细介绍&#xff1b;市场上的成品Cam应用&#xff0c;打开Cam后直接打开了预览&#xff0c;然后可以拍照…

测试跳槽一次涨4k,我5年跳了3次...

最近有人说&#xff0c;现在测试岗位初始工资太低了&#xff0c;有些刚刚入行的程序员朋友说自己工资连5位数都没有.....干了好几年也没怎么涨。看看别人动辄月薪1.5到2万&#xff0c;其实我想说也没那么难。 说下如何高效地拿到2万的工资&#xff0c;总体来说&#xff0c;就靠…

2023ACP世界大赛中国总决赛|让世界再多一个微笑

5月21日&#xff0c;正值第三十三次全国助残日&#xff0c;作为公益推行的一份子&#xff0c;恒利联创也呈现出了“仁者爱人”的文化内核。 恒利联创携手微笑明天慈善基金会合作同行&#xff0c;旨在推动公益&#xff0c;促进残疾人事业的全面发展。在前行的道路上&#xff0c…