【1】构建图像分类数据集

2024/7/5 图像分类

【1】构建图像分类数据集


# 前言

主要简述图像采集与整理、可视化采集图像、划分训练集验证集、统计各类别图像数量

代码存放库


# 一、图像采集与整理

# 1.1. 图像采集

三叶青块根图片主要是通过自己拍照来采集的

具体信息,请参考【8】相关补充——三叶青实验记录

未知类别照片

将这些照片充当未知类别,另外还将本地相册中的照片也作为未知类别。(有点建议:或许我要挑选一些与三叶青块根相似的其它药材作为未知类别,这样更能区分出三叶青块根)

# 1.2. 图片数据集的处理

前面获得了三叶青块根照片和其它任意图片的数据集。 但是数据集的格式、图片大小并未统一。

包括:

  1. 复制原始图片,生成图片的标签文件
  2. 根据labels.csv文件整理为labels_2.csv或labels_5.csv或lebels_未知.csv
  3. 图片压缩为统一尺寸

# 1.3. 图片数据集的混合

将三叶青的块根照片与未知照片混合

# 1.4.测试集划分

设置自定义的划分比例,这里为0.2

# 二、可视化采集图像

随机读取一定数量的图片并可视化

在这里插入图片描述

# 三、划分训练集验证集

将之前剩下的图片划分为训练集和验证集,按8:2比例

在这里插入图片描述

# 四、统计各类别图像数量

将各类别图像数量表格可视化为柱状图

在这里插入图片描述


# 总结

本文主要介绍了如何构建我的图像分类数据集,数据集的构建是比较重要的,这里数据集图像的获取也不知道合不合格,这一步或许有点问题,考虑再完善。

2024/6/12

十一年前南渡客,四千里外北归人。

评 论:

冬眠
司南