官方swin-transformer目前只支持训练imageNet,其次加载预训练有点东西,想要训练自己的数据集需要稍微改改代码,为了方便使用,我将改好的上传到github,大家仅需要自己修改参数即可使用。github: https://github.com/sunanlin13174/Image-train-Swin-transformer
我的数据集是图案比较丰富的,但是部分类或者数据集本身数据不多,因此在官方已有数据增强:亮度、对比度、饱和度变化、mixup、裁剪等基础上,添加了上下左右中心裁剪并翻转,生成更多的数据,然后以0.5的概率将其转为灰度图(r=g=b),这部分代码可在data/build.py中修改,后期使用flask部署到服务器端运行。
其次,主要讲一下如何使用这份代码。
- 适配swin-transformer环境,根据官方github操作即可,当然在安装apex时可能会遇到坑,基本是torch.verson.cuda版本与本机安装的cuda版本不一致导致,可调整torch的版本适应本机的cuda版本。
2 . 准备数据集,代码使用的是ImageFolder函数生成dataloader,因此,你的数据集应该有如下格式:
data / class_1
class_2
class_3
.......
相关文章
【CV】SwinIR:使用 Swin Transformer 进行图像恢复
论文名称:SwinIR: Image Restoration Using Swin Transformer 论文下载:https://arxiv.org/abs/2108.10257 论文年份:ICC...
没有NVIDIA控制面板,在cmd中使用nvidia-smi命令不显示CUDA Version的解决方案
系列文章目录 Environment_set 没有NVIDIA控制面板,在cmd中使用nvidia-smi命令不显示CUDA Version的解决方案 系列文章目录 前言 一、没有NVIDIA控制面板...
kaldi nnet模型的decode流程解析
文章目录 前言 1、特征提取 * 1-1 filter bank特征计算 1-2 cmvn处理 1-3 拼帧 2、nnet-forward 3、解码生成词图(lattice) 前言 前面的文章中讲过n...
Keras和Tensorflow以及Pytorch版本对应关系
FrameworkEnv name (--env parameter)DescriptionDocker ImagePackages and Nvidia SettingsTensorFlow 2.2...
LSTM股票价格预测
ID:399899 注: 这里使用的数据源是Tushare LSTM股票价格预测实验 实验介绍 使用LSTM进行股票价格的预测,用到的框架主要包括:TensorFlow2.0,主要用于深度学习算法的构...
安装NCCLmpirunhorovodnvidia-tensorflow(3090Ti)
本文目录 前提:环境说明 horovod介绍 1. NCCL安装 2. mpirun安装 * 查看版本 3. nvidia-tensorflow安装 * 3090欢乐时刻——支持gpu 4. horo...
【OpenCV图像处理10】图像直方图
文章目录 十、图象直方图 * 1、图像直方图的基本概念 2、使用OpenCV统计直方图 3、使用OpenCV绘制直方图 4、使用掩膜的直方图 5、直方图均衡化 十、图象直方图 1、图像直方图的基本概念...
Opencv c++(图像处理)
目录 一、图像读取与显示 二、图像预处理 高斯模糊的原理与算法 Canny边缘检测 三、图像裁剪 四、绘制形状和添加文本 五、透视变换 六、颜色检测 七、形状检测和轮廓检测 八、人脸识别 一、图像读取...
ResNet网络结构详解(Tensorflow2.6.0实现网络结构)
文章目录 * - 1.ResNetX网络结构表 - + (1)论文地址: + (2)ResNet18网络结构: + (3)ResNet34网络结构: - 2.卷积神经网络的发展 - + (1).卷积神...
Tensorflow各种推理格式转换以及代码
使用 tf.train.saver()保存模型时会产生多个文件,会把计算图的结构和图上参数取值分成了不同的文件存储。这种方法是在TensorFlow中是最常用的保存方式。例如:下面的代码运行后,会在s...
瑞芯微-交叉编译环境搭建-opencv环境搭建(基于RV1109-1126)-(基于ubuntu18.04)
本文主要介绍基于RV1109与RV1126板子编译opencv,并在其运行方法,若编译其它算法,基本也遵循该方法。 为此,我将记录详细过程供读者参考: 一.交叉编译 我们在 x86 平台上,编写程序并...
openvino的入门–c++部署的图像分类为例
ooenvino的安装可参考openvino2022版安装配置与C++SDK开发详解 1.什么是openvino? 概念: OpenVINO是英特尔基于自身现有的硬件平台开发的一种可以加快高性能计算机...
pytorch框架下的数据可视化模块visdom安装使用
1、visdom是什么?? visdom是facebook开发的一款可视化工具,使用pytorch训练神经网络时,可以使用visdom来实时对数据可视化。 2、安装 pip install visdo...
自然语言处理(NLP)和语音识别(ASR)的区别
一、两者的概念 ASR:语音识别。通俗的来讲,就是将语音信号转化成文字文本,并加以输出(显示在屏幕上面)。 这个过程,机器并不知道你说的是什么,可以说就是单单的实现了两种信号的转化。而且概念本身就已经...
YS-LDV7语音识别模块使用手册
一、 模块参数 型号:YS-LDV7 名称:一体化语音识别模块 规格:43*29.7MM 供电电压:5V (内部工作电压 3.3V) 待机电流:30MA 识别时电流:45MA IO 口输出:高电平为 ...