当前位置：首页 > news >正文

专业网站建站费用网络技术就业方向

news 2025/11/14 18:43:19

专业网站建站费用,网络技术就业方向,网站开发岗位需求分析,前端做网站一般用什么框架案例4#xff1a;脑部MRI图像分割相关知识点#xff1a;语义分割、医学图像处理#xff08;skimage, medpy#xff09;、可视化#xff08;matplotlib#xff09; 1 任务目标 1.1 任务简介本次案例将使用深度学习技术来完成脑部MRI(磁共振)图像分割任务#xff0c…案例4脑部MRI图像分割相关知识点语义分割、医学图像处理skimage, medpy、可视化matplotlib 1 任务目标 1.1 任务简介本次案例将使用深度学习技术来完成脑部MRI(磁共振)图像分割任务即对于处理好的一张MRI图像通过神经网络分割出其中病变的区域。本次案例使用的数据集来自Kaggle[1]共包含110位病人的MRI数据每位病人对应多张通道数为3的.tif格式图像其对应的分割结果为单通道黑白图像(白色为病变区域)示例如下。第一行: MRI图像第二行: 对应的分割标签更详细的背景介绍请参考文献[2]. 1.2 参考程序本次案例提供了完整、可供运行的参考程序来源于Kaggle[3]和GitHub[4]建议在参考程序的基础上进行修改来完成本案例。各个程序简介如下 train.ipynb用来完成模型训练 inference.ipynb用来对训练后的模型进行推理 unet.py定义了U-Net网络结构参考资料[5] loss.py定义了损失函数(Dice Loss)参考资料[6] dataset.py用来定义和读取数据集 transform.py用来预处理数据 utils.py定义了若干辅助函数 logger.py用来记录训练过程(使用TensorBoard[7]功能)包括损失函数曲线等参考程序对运行环境的要求如下请自行调整环境至适配否则可能无法运行 torch2.0.* torchvision0.15.* ipykernel6.26.* matplotlib3.8.* medpy0.4.* scipy1.11.* numpy1.23.* (1.24版本无法运行需要先降级) scikit-image0.22.* imageio2.31.* tensorboard2.15.* tqdm4.* 其它细节以及示例运行结果可直接参考Kaggle[3]和GitHub[4]。 1.3 要求和建议在参考程序的基础上使用深度学习技术尝试提升该模型在脑部MRI图像上的分割效果以程序最终输出的validation mean DSC值作为评价标准(参考程序约为90%)。可从网络结构(替换U-Net)、损失函数(替换Dice Loss)、训练过程(如优化器)等角度尝试改进还可参考通用图像分割的一些技巧[8]。 1.4 注意事项提交所有代码和一份案例报告案例报告应详细介绍所有改进尝试及对应的结果(包括DSC值和若干分割结果示例)无论是否成功提升模型效果并对结果作出分析禁止任何形式的抄袭借鉴开源程序务必加以说明。 1.5 参考资料 [1] Brain MRI数据集: https://www.kaggle.com/mateuszbuda/lgg-mri-segmentation [2] Buda et al. Association of genomic subtypes of lower-grade gliomas with shape features automatically extracted by a deep learning algorithm. Computers in Biology and Medicine 2019. [3] 示例程序: https://www.kaggle.com/mateuszbuda/brain-segmentation-pytorch [4] 示例程序: https://github.com/mateuszbuda/brain-segmentation-pytorch [5] Ronneberger et al. U-Net: Convolutional Networks for Biomedical Image Segmentation. MICCAI 2015. [6] Dice Loss: https://zhuanlan.zhihu.com/p/86704421 [7] TensorBoard参考资料https://www.tensorflow.org/tensorboard [8] Minaee et al. Image Segmentation Using Deep Learning: A Survey. arXiv 2020. 2 通过云平台训练基础代码本次实验由于运行时间较长占用内存较大所以选择了用学堂在线的和鲸云平台来进行训练。下面介绍是如何使用云平台训练基础代码的。 2.1 云平台环境配置数据集接入本次实验采用Brain MRI数据集该数据集已被上传到了云平台的共享数据中可以直接调用。项目创建此处没有采用直接fork作业中的文件因为作业中的文件与本地有所不同经对比采用从学堂在线下载文件训练效果更好。在我的空间里点击新建创建项目输入项目名称选择数据源完成项目的创建。环境配置创建完成后点击右上角齿轮按钮配置项目环境。选择 T4 GPU 基础环境选择 Pytorch 2.0.1 Cuda11.7 Python3.10 的版本。点击运行完成基础环境配置。然后导入从学堂在线下载的实验四文件。按照其中 train.ipynb 的内容安装其他依赖库。即在notebook里的代码格输入以下内容注意前面要加 ! 。 !pip install ipykernel6.26.* matplotlib3.8.* medpy0.4.* scipy1.11.* numpy1.23.* scikit-image0.22.* imageio2.31.* tensorboard2.15.* tqdm4.* -i https://pypi.tuna.tsinghua.edu.cn/simple2.2 云平台项目训练云平台支持在线训练和离线训练两种方式其中在线训练要求网络保持通畅不能断网离线训练最好在在线训练跑通后再进行训练。在线训练首先需要修改数据集地址不然无法训练。在 train.ipynb 的 args 中将 images 的路径替换成如下内容。 images ../input/02039681/utf-8kaggle_3m/kaggle_3m默认训练轮次是100轮实际上训练100轮太多了20轮足矣。所以我选择将轮次更改成20轮。 epochs 20,在配置好后在 train.ipynb 界面点击任务栏的运行所有键开始U-net模型的训练。训练过程训练结束后会在 project 栏中生成 log文件夹存储训练日志可以用TensorBoard查看训练过程有loss、val_dsc、val_loss以下三个图表。可以看到20轮训练有点欠拟合不过训练结果还算不错。训练结果训练结束后在最后会显示 Best validation mean DSC 值。可以看到经过20轮的训练在测试集得到最好的DSC达到了0.913458。离线训练离线训练首先需要将配置好的环境保存成私有镜像。点击任务栏的镜像 →保存当前环境等待配置后保存成功当前环境。然后点击任务栏中的离线任务选择刚才配置好的镜像即可进行离线训练。离线训练时可以从云平台侧边栏的离线任务中查看离线任务的运行状态包括内存、CPU占用等。离线任务运行结束后若运行的没有问题则可以保存回原文件得到在线任务提到的两个文件夹。 2.3 云平台项目测试在训练结束后选择 inference.ipynb 文件进行测试按训练项目中的步骤替换数据集路径。点击运行所有完成项目的测试。在测试结束后可以得到一个 dsc.png 图片记录了不同类别图像的DSC迪斯相似系数值。图中的红线为所有DSC值的均值绿线为DSC值的中值。 Dice Similarity Coefficient (DSC) 是通过比较模型预测的分割结果与地面真实分割的重叠部分来衡量相似度的指标。它的计算公式如下 D S C 2 × ∣ Intersection ∣ ∣ Prediction ∣ ∣ Ground Truth ∣ DSC \frac{2 \times | \text{Intersection} |}{ | \text{Prediction} | | \text{Ground Truth} |} DSC∣Prediction∣∣Ground Truth∣2×∣Intersection∣ 其中 $ \text{Intersection} $ 表示模型预测和背景真实分割的交集部分。$ | \text{Prediction} | $ 表示模型预测的分割的总像素数。$ | \text{Ground Truth} | $ 表示背景真实分割的总像素数。并得到一个 predictions 文件夹存储预测的一系列脑部MRI图像其中红色为预测框绿色为真实框。云平台图片不能批量下载只能一张一张下载查看图片结果并不直观。 3 本地训练基础代码由于云平台编辑代码不方便图片需要下载才能查看等弊端于是我又选择在本地训练。 3.1 本地环境配置根据 train.ipynb 的步骤安装环境。新建python 3.10环境 conda create -n hw4 python3.10 -y conda activate hw4安装torch注意cuda版本适配 pip install torch2.0.* torchvision0.15.* --index-url https://download.pytorch.org/whl/cu117安装其他依赖库 pip install ipykernel6.26.* matplotlib3.8.* medpy0.4.* scipy1.11.* numpy1.23.* scikit-image0.22.* imageio2.31.* tensorboard2.15.* tqdm4.* -i https://pypi.tuna.tsinghua.edu.cn/simple3.2 本地项目训练修改数据集路径将 images 数据集路径修改为你的路径。 images ./archive/kaggle_3m,项目训练全部运行 train.ipynb 本次训练训练100个epoch最优结果如下。 100%|██████████| 208/208 [01:1900:00, 2.62it/s] 100%|██████████| 21/21 [00:0700:00, 2.78it/s] epoch 100 | val_loss: 0.21832050595964705 epoch 100 | val_dsc: 0.9073074088508986 Best validation mean DSC: 0.914025在100轮的训练后最佳DSC值为0.914025。训练结果模型训练结束得到训练日志通过Tensorboard打开得到结果如下。由上图可知100轮训练后训练集和测试集的loss逐步降低测试集精度逐步上升训练结果还算不错。 3.3 本地项目测试项目测试修改好数据集路径后全部运行 inference.ipynb 。 ...70%|███████ | 7/10 [00:0500:02, 1.07it/s]C:\Users\Administrator\AppData\Local\Temp\ipykernel_15188\1157483797.py:12: UserWarning: ./predictions\kaggle_3m\TCGA_DU_5851_19950428-34.png is a low contrast imageimsave(filepath, image) 100%|██████████| 10/10 [00:0600:00, 1.52it/s]DSC测试在测试结束后会生成一张DSC图片。由上图可知除了 TCGA_HT_717 文件其他的测试DSC值都达到了0.9及以上测试结果还算不错。预测图片本地运行后可以得到一个 predictions 文件夹存储所有预测图片。可以通过以下代码将同一系列的图片转换为gif图片可以更直观的查看测试效果。 from PIL import Image import osdef create_gif(image_folder, output_gif_path, prefix):images []# 获取文件夹中所有以 prefix 开头的图片文件image_files [file for file in os.listdir(image_folder) if file.startswith(prefix)]image_files.sort() # 按名称排序for image_file in image_files:image_path os.path.join(image_folder, image_file)img Image.open(image_path)images.append(img)# 保存为 GIF 图片images[0].save(output_gif_pathimage_prefix.gif, save_allTrue, append_imagesimages[1:], duration100, loop0)通过代码可以得到以下GIF图片。 TCGA_DU_6404 通过DSC测试可知该样本脑部MRI图像测试结果最好如下图所示绿色与红色框几乎重合。 TCGA_CS_4944 通过DSC测试可知该样本脑部MRI图像测试结果较为不错如下图所示绿色与红色框差异不大。 TCGA_HT_7616 通过DSC测试可知该样本脑部MRI图像测试结果最差如下图所示绿色与红色框差异较大。 4 代码解析本次实验采用U-Net架构实现对脑部MRI图像的图像分割。 4.1 U-Net架构 U-Net 是一种用于图像分割的卷积神经网络它由编码器和解码器两部分组成形状类似字母 U因此得名。 U-Net 的主要特点包括编码器-解码器结构U-Net 由两部分组成一个收缩路径编码器和一个对称的扩展路径解码器。编码器通过卷积和池化操作逐步减小特征图的尺寸同时捕获图像的上下文信息。解码器通过上采样和卷积操作逐步恢复特征图的尺寸同时保留和增强重要的空间信息。跳跃连接在编码器和解码器之间U-Net 使用了跳跃连接也称为长距离连接或残差连接将编码阶段的特征图与解码阶段的对应特征图进行拼接。这种连接有助于解码器恢复更多的空间细节从而提高分割精度。上采样在解码阶段U-Net 使用了上采样操作如转置卷积或上采样层来逐步增大特征图的尺寸。这有助于恢复原始图像的分辨率使得网络能够输出与输入图像尺寸相同的分割图。多尺度特征融合由于跳跃连接和编码器-解码器结构的结合U-Net 能够有效地融合多尺度的特征信息。这对于处理具有不同尺寸和形状的目标非常重要。轻量级和高效尽管 U-Net 结构相对简单但它在许多图像分割任务中表现出了出色的性能。此外由于其轻量级的特性U-Net 可以在有限的计算资源上实现高效的训练和推理。 4.2 U-Net代码解析代码定义了一个UNet类具体内容如下。构造函数__init__接受三个参数 in_channels输入通道的数量默认为3适用于RGB图像。out_channels输出通道的数量默认为1用于二元分割。init_features初始特征的数量默认为32。 def __init__(self, in_channels3, out_channels1, init_features32):super(UNet, self).__init__()编码器架构 U-Net的编码器部分由四个块enc1到enc4组成每个块包含两个卷积层、批归一化和ReLU激活。在每个编码器块后应用最大池化层pool1到pool4以减小空间维度。 features init_featuresself.encoder1 UNet._block(in_channels, features, nameenc1)self.pool1 nn.MaxPool2d(kernel_size2, stride2)self.encoder2 UNet._block(features, features * 2, nameenc2)self.pool2 nn.MaxPool2d(kernel_size2, stride2)self.encoder3 UNet._block(features * 2, features * 4, nameenc3)self.pool3 nn.MaxPool2d(kernel_size2, stride2)self.encoder4 UNet._block(features * 4, features * 8, nameenc4)self.pool4 nn.MaxPool2d(kernel_size2, stride2)中间层瓶颈块bottleneck是另一组包含两个卷积层、批归一化和ReLU激活的层表示U-Net的中央层。 self.bottleneck UNet._block(features * 8, features * 16, namebottleneck)解码器结构解码器部分包含四个块dec4到dec1每个块包含两个卷积层、批归一化和ReLU激活。在每个解码器块后应用转置卷积upconv4到upconv1以上采样特征图。 self.upconv4 nn.ConvTranspose2d(features * 16, features * 8, kernel_size2, stride2)self.decoder4 UNet._block((features * 8) * 2, features * 8, namedec4)self.upconv3 nn.ConvTranspose2d(features * 8, features * 4, kernel_size2, stride2)self.decoder3 UNet._block((features * 4) * 2, features * 4, namedec3)self.upconv2 nn.ConvTranspose2d(features * 4, features * 2, kernel_size2, stride2)self.decoder2 UNet._block((features * 2) * 2, features * 2, namedec2)self.upconv1 nn.ConvTranspose2d(features * 2, features, kernel_size2, stride2)self.decoder1 UNet._block(features * 2, features, namedec1)前向传播输入x通过编码器块和池化层。 def forward(self, x):enc1 self.encoder1(x)enc2 self.encoder2(self.pool1(enc1))enc3 self.encoder3(self.pool2(enc2))enc4 self.encoder4(self.pool3(enc3))瓶颈应用于下采样的特征图。 bottleneck self.bottleneck(self.pool4(enc4))解码器块和转置卷积用于通过跳跃连接 ( torch.cat ) 上采样特征。 dec4 self.upconv4(bottleneck)dec4 torch.cat((dec4, enc4), dim1)dec4 self.decoder4(dec4)dec3 self.upconv3(dec4)dec3 torch.cat((dec3, enc3), dim1)dec3 self.decoder3(dec3)dec2 self.upconv2(dec3)dec2 torch.cat((dec2, enc2), dim1)dec2 self.decoder2(dec2)dec1 self.upconv1(dec2)dec1 torch.cat((dec1, enc1), dim1)dec1 self.decoder1(dec1)最后一层应用Sigmoid激活进行二元分割。 return torch.sigmoid(self.conv(dec1))辅助方法 _block 定义了一个静态方法_block用于创建包含两个卷积层、批归一化和ReLU激活的基本块。该块被返回为nn.Sequential模块。 staticmethoddef _block(in_channels, features, name):return nn.Sequential(OrderedDict([(name conv1,nn.Conv2d(in_channelsin_channels,out_channelsfeatures,kernel_size3,padding1,biasFalse,),),(name norm1, nn.BatchNorm2d(num_featuresfeatures)),(name relu1, nn.ReLU(inplaceTrue)),(name conv2,nn.Conv2d(in_channelsfeatures,out_channelsfeatures,kernel_size3,padding1,biasFalse,),),(name norm2, nn.BatchNorm2d(num_featuresfeatures)),(name relu2, nn.ReLU(inplaceTrue)),]))4.3 训练函数代码训练超参数 args SimpleNamespace(device cuda:0,batch_size 16,epochs 100,lr 0.0001,workers 0,vis_images 200,vis_freq 10,weights ./weights,logs ./logs,images ./archive/kaggle_3m,image_size 256,aug_scale 0.05,aug_angle 15, )device: 指定模型训练的设备这里设置为 cuda:0表示使用第一个 GPU。如果没有可用的 GPU可以将其设置为 cpu。batch_size: 每个训练批次中包含的样本数量这里设置为 16。epochs: 训练的总轮数这里设置为 100。lr: 学习率即模型在每个训练步骤中权重更新的大小这里设置为 0.0001。workers: 数据加载时的并行工作数这里设置为 0表示不使用多线程加载数据。vis_images: 每次可视化的图像数量这里设置为 200。vis_freq: 可视化的频率即每训练多少个批次可视化一次这里设置为 10。weights: 模型权重的保存路径这里设置为 ./weights。logs: 训练日志的保存路径这里设置为 ./logs。images: 存储图像数据的路径这里设置为 ./archive/kaggle_3m。image_size: 输入图像的大小这里设置为 256。aug_scale: 数据增强的缩放参数这里设置为 0.05。aug_angle: 数据增强的旋转角度参数这里设置为 15。读取数据 worker_init 函数这是一个用于多线程数据加载的初始化函数确保每个线程有相同的随机种子。这里使用 np.random.seed 来设置随机种子。 # 读取数据 def worker_init(worker_id):np.random.seed(42 worker_id)data_loaders 函数该函数用于创建训练和验证数据加载器并返回训练和验证数据集的对象。 dataset_train, dataset_valid datasets(args) 调用 datasets 函数获取训练和验证数据集。然后使用 DataLoader 创建两个数据加载器 loader_train 和 loader_valid分别用于训练和验证。这些加载器将数据集划分为批次可以在模型训练时使用。worker_init_fnworker_init 用于设置每个数据加载线程的随机种子。 def data_loaders(args):dataset_train, dataset_valid datasets(args)loader_train DataLoader(dataset_train,batch_sizeargs.batch_size,shuffleTrue,drop_lastTrue,num_workersargs.workers,worker_init_fnworker_init,)loader_valid DataLoader(dataset_valid,batch_sizeargs.batch_size,drop_lastFalse,num_workersargs.workers,worker_init_fnworker_init,)return dataset_train, dataset_valid, loader_train, loader_valid数据集定义 datasets 函数该函数用于定义训练和验证数据集并返回它们的对象。调用 Dataset 类来创建训练和验证数据集传递了一些参数如 images_dir、subset、image_size、transform等。 # 数据集定义 def datasets(args):train Dataset(images_dirargs.images,subsettrain,image_sizeargs.image_size,transformtransforms(scaleargs.aug_scale, angleargs.aug_angle, flip_prob0.5),)valid Dataset(images_dirargs.images,subsetvalidation,image_sizeargs.image_size,random_samplingFalse,)return train, valid数据处理 dsc_per_volume 函数这是一个用于计算 Dice Similarity CoefficientDSC的函数其中 validation_pred 是预测的分割结果validation_true 是真实的分割结果patient_slice_index 是患者每个切片的索引。该函数对每个样本计算 DSC并将结果存储在 dsc_list 中返回。 def dsc_per_volume(validation_pred, validation_true, patient_slice_index):dsc_list []num_slices np.bincount([p[0] for p in patient_slice_index])index 0for p in range(len(num_slices)):y_pred np.array(validation_pred[index : index num_slices[p]])y_true np.array(validation_true[index : index num_slices[p]])dsc_list.append(dsc(y_pred, y_true))index num_slices[p]return dsc_listlog_loss_summary 函数该函数用于记录损失值到日志中通常用于可视化和监控训练过程。这里使用了 logger.scalar_summary 函数来记录损失值。 def log_loss_summary(logger, loss, step, prefix):logger.scalar_summary(prefix loss, np.mean(loss), step)makedirs 函数用于创建存储模型权重和日志的目录。调用 os.makedirs 函数来创建目录如果目录已存在则不会报错。 def makedirs(args):os.makedirs(args.weights, exist_okTrue)os.makedirs(args.logs, exist_okTrue)snapshotargs 函数该函数用于保存实验参数到一个 JSON 文件中这样可以在后续的实验中追溯实验的设置。调用 json.dump 将参数写入 JSON 文件。 def snapshotargs(args):args_file os.path.join(args.logs, args.json)with open(args_file, w) as fp:json.dump(vars(args), fp)加载数据集根据上面的函数建立数据集与训练日志加载数据集并对数据集内容进行预处理。 makedirs(args) snapshotargs(args) device torch.device(cpu if not torch.cuda.is_available() else args.device)dataset_train, dataset_valid, loader_train, loader_valid data_loaders(args) loaders {train: loader_train, valid: loader_valid}初始化Unet模型 UNet模型初始化 unet UNet(in_channelsDataset.in_channels, out_channelsDataset.out_channels) unet.to(device)Dice Loss初始化创建了一个Dice Loss的实例 dsc_loss用于度量分割模型的性能。 dsc_loss DiceLoss() best_validation_dsc 0.0定义优化器创建了一个Adam优化器用于更新UNet模型的参数。 optimizer optim.Adam(unet.parameters(), lrargs.lr)日志记录器初始化创建了一个日志记录器 logger用于记录训练过程中的信息如训练和验证损失。 logger Logger(args.logs)训练参数初始化初始化训练和验证损失列表创建了两个空列表 loss_train 和 loss_valid用于存储每个训练和验证步骤的损失值。初始化训练步数用于跟踪训练过程中的步数。 loss_train [] loss_valid []step 0模型训练循环训练两个嵌套的循环外层循环迭代训练的轮数内层循环迭代训练和验证阶段。 for epoch in range(args.epochs):for phase in [train, valid]:# ...模型模式设置根据当前阶段训练或验证设置模型的模式对于训练模式启用 Batch Normalization 和 Dropout 等层的训练行为对于验证模式关闭这些层的训练行为以避免随机性。 if phase train:unet.train() else:unet.eval()损失和优化器初始化初始化 Adam 优化器和 Dice Loss 损失函数。 optimizer optim.Adam(unet.parameters(), lrargs.lr) dsc_loss DiceLoss() best_validation_dsc 0.0数据加载和处理通过 loaders 加载训练或验证数据并将数据移动到指定的计算设备。 for i, data in enumerate(tqdm.tqdm(loaders[phase])):x, y_true datax, y_true x.to(device), y_true.to(device)模型前向传播和损失计算使用 UNet 模型进行前向传播计算预测结果 y_pred 并计算 Dice Loss。 y_pred unet(x) loss dsc_loss(y_pred, y_true)反向传播和优化如果是训练阶段则执行反向传播和参数优化更新。 if phase train:loss_train.append(loss.item())loss.backward()optimizer.step()验证阶段损失和性能评估在验证阶段记录验证集的损失计算 Dice 相似性系数并保存模型权重如果当前性能更好。 if phase valid:loss_valid.append(loss.item())# ...可视化和日志记录 if (epoch % args.vis_freq 0) or (epoch args.epochs - 1):# ...性能指标记录和保存最佳模型如果当前验证性能更好则保存当前的 UNet 模型权重。 if mean_dsc best_validation_dsc:best_validation_dsc mean_dsctorch.save(unet.state_dict(), os.path.join(args.weights, unet.pt))最终输出在训练完成后输出最佳验证集 Dice 相似性系数。 print(Best validation mean DSC: {:4f}.format(best_validation_dsc))5 代码优化 5.1 优化loss 我分别采用 SoftIoULoss 和 Calc Loss 来替代 Dice Loss结果如下。 SoftIoULoss SoftIoULoss 是一种用于语义分割任务的损失函数它是在 IoU(Intersection over Union) 的基础上进行了平滑处理以便更好地优化训练过程。IoU是一种常用的指标用于衡量预测结果和真实标签之间的相似度。 SoftIoULoss 1 − ∑ i 1 N pred i target i ϵ ∑ i 1 N pred i ∑ i 1 N target i − ∑ i 1 N pred i target i ϵ \text{SoftIoULoss} 1 - \frac{\sum_{i1}^N \text{pred}_i \text{target}_i \epsilon}{\sum_{i1}^N \text{pred}_i \sum_{i1}^N \text{target}_i - \sum_{i1}^N \text{pred}_i \text{target}_i \epsilon} SoftIoULoss1−∑i1Npredi∑i1Ntargeti−∑i1Npreditargetiϵ∑i1Npreditargetiϵ 其中 N N N 是像素的总数 pred i \text{pred}_i predi和 target i \text{target}_i targeti分别是第 i i i个像素的预测值和真实值 ϵ \epsilon ϵ是一个很小的正数用于避免除零错误。下面是SoftIoULoss的代码实现 def SoftIoULoss(pred, target, epsilon1e-6):# 将预测值缩放到0到1之间pred torch.sigmoid(pred)# 设置一个平滑因子避免除零错误smooth epsilon# 计算预测值和真实值之间的交集intersection pred * target# 计算预测值和真实值之间的并集union pred target - intersection# 计算IoUiou (intersection.sum() smooth) / (union.sum() smooth)# 计算SoftIoULossloss 1 - iou.mean()return loss采用 SoftIoULoss 作为损失函数最终训练结果如下DSC值有所下降说明该损失函数表现不如Dice Loss。 Best validation mean DSC: 0.874558各样本测试得到的DSC图如下所示。与基于Dice Loss训练集上的Loss曲线验证集上的DSC、Loss曲线对比结果如下所示。由图可知基于 SoftIoULoss 训练的Unet模型训练集和测试集的loss基本没有降低测试集的DSC曲线始终在基于 Dice Loss 训练的下方。说明该任务不适合使用 SoftIoULoss 进行训练。 calc loss calc loss 是一种用于计算图像分割任务的损失函数它结合了二元交叉熵损失(BCE Loss) 和 Dice损失(Dice Loss) 。BCE Loss用于衡量预测值和真实值之间的逐像素的差异Dice Loss用于衡量预测值和真实值之间的重叠区域的比例。bce_weight是一个超参数用于控制两种损失的权重。 calc loss可以同时考虑像素级别和区域级别的分割性能提高分割的准确性和鲁棒性。其计算公式如下 calc loss BCE Loss ∗ bce weight Dice Loss ∗ ( 1 − bce weight ) \text{calc loss} \text{BCE Loss} * \text{bce weight} \text{Dice Loss} * (1 - \text{bce weight}) calc lossBCE Loss∗bce weightDice Loss∗(1−bce weight) 其中BCE Loss和Dice Loss的计算公式分别为 $$ \text{BCE Loss} -\frac {1} {N} \sum_ {i1}^ {N} \left [y_ {i} \log p_ {i} (1 - y_ {i}) \log (1 - p_ {i})\right]\ \text{Dice Loss} 1 - \frac {2 \sum_ {i1}^ {N} y_ {i} p_ {i} \epsilon} {\sum_ {i1}^ {N} y_ {i} \sum_ {i1}^ {N} p_ {i} \epsilon} $$ 其中 N N N是像素的总数 y i y_ {i} yi和 p i p_ {i} pi分别是第 i i i个像素的真实值和预测值 ϵ \epsilon ϵ是一个很小的正数用于避免除零错误。下面是calc loss的代码实现 def calc_loss(prediction, target, bce_weight0.5):# 计算BCE Loss使用logits作为输入避免重复计算sigmoidbce F.binary_cross_entropy_with_logits(prediction, target)# 计算sigmoid将logits转换为概率prediction F.sigmoid(prediction)# 计算Dice Loss使用自定义的dice_loss函数dice dice_loss(prediction, target)# 计算总的损失根据bce_weight的值进行加权loss bce * bce_weight dice * (1 - bce_weight)return loss采用 calc loss 作为损失函数最终训练结果如下DSC值有细微提升说明该损失函数表现比 Dice Loss略有提升。 Best validation mean DSC: 0.915542各样本测试得到的DSC图如下所示。与基于Dice Loss训练集上的Loss曲线验证集上的DSC、Loss曲线对比结果如下所示。由图可知基于 Calc Loss 的loss曲线在训练集和测试集上都收敛在了一个较大的值但是从测试集上DSC曲线来看模型效果与 Dice Loss 不相上下。 5.2 添加注意力机制(Attention) 我在Unet的每个解码器模块添加了注意力模块基于注意力机制的 U-Net 网络旨在通过 Attention Gate 帮助模型更有效地聚焦于图像中的重要区域提高图像分割的性能。基于注意力机制的Unet网络基于注意力机制的Unet网络是一种用于图像分割的深度学习模型它在经典的Unet网络的基础上增加了注意力门Attention Gate模块用于自动学习在不同尺度上关注哪些特征。注意力门模块的作用是根据输入的两个特征图生成一个注意力权重图用于对其中一个特征图进行加权从而突出目标区域抑制背景区域。注意力门模块可以嵌入到Unet网络的上采样路径中与下采样路径中的特征图进行融合提高分割的精度和鲁棒性。代码设计以下是AttentionGate类的代码它包含一个卷积层和 Sigmoid 激活函数。通过对两个输入张量执行卷积然后使用双线性插值将结果上采样到与第二个输入张量相同的大小最后通过 Sigmoid 激活函数产生一个介于 0 到 1 之间的权重。通过将这个权重应用于第二个输入张量产生了加强的特征图这有助于模型更好地关注感兴趣的区域。 class AttentionGate(nn.Module):def __init__(self, in_channels, out_channels):super(AttentionGate, self).__init__()self.conv nn.Conv2d(in_channels, out_channels, kernel_size1, stride1, padding0)self.sigmoid nn.Sigmoid()def forward(self, x1, x2):g self.conv(x1)g F.interpolate(g, sizex2.size()[2:], modebilinear, align_cornersFalse)x x2 * self.sigmoid(g)return x以下是解码器模块代码在每个解码器块中通过使用 AttentionGate 增强的特征图与对应的编码器块的特征图进行连接。这种连接方式旨在使解码器能够更好地利用编码器中学到的信息。 def __init__(self, in_channels3, out_channels1, init_features32):...# Attention Gatesself.attention_gate1 AttentionGate(features, features)self.attention_gate2 AttentionGate(features * 2, features * 2)self.attention_gate3 AttentionGate(features * 4, features * 4)self.attention_gate4 AttentionGate(features * 8, features * 8)...def forward(self, x):...# Attention gatesdec4 self.upconv4(bottleneck)dec4 self.attention_gate4(enc4, dec4)dec4 torch.cat((dec4, enc4), dim1)dec4 self.decoder4(dec4)...dec1 self.upconv1(dec2)dec1 self.attention_gate1(enc1, dec1)dec1 torch.cat((dec1, enc1), dim1)dec1 self.decoder1(dec1)...性能分析训练结束后基于Attention的Unet网络得到的Best mean DSC值如下比Unet网络较好。 Best validation mean DSC: 0.914510各样本测试得到的DSC图如下所示。与Unet网络在训练集上的Loss曲线验证集上的DSC、Loss曲线对比结果如下所示。由上图可知添加注意力机制后的模型收敛速度更快在收敛后测试集测试DSC值更稳定效果更好。 5.3 ResUnet 我创建了一个基于 ResNet34 架构的 U-Net 模型采用了预训练的ResNet34模型作为编码器结合了 ResNet34 的强大特征提取能力和 U-Net 结构的特征融合机制通过上采样和特征图融合操作进行细化用于图像分割任务。 ResNet34 ResNet34 包含34层卷积层和全连接层相对于传统的网络结构其深度相对较大属于残差网络Residual Network简称 ResNet系列之一。通过引入残差块Residual Blocks的概念成功地解决了深层神经网络训练过程中的梯度消失和梯度爆炸问题使得训练非常深的网络变得可行。代码设计编码器架构使用预训练的 ResNet34 模型将其前卷积层conv1、批归一化层bn1、ReLU 激活层relu、最大池化层maxpool以及四个残差块layer1到layer4作为编码器部分。 Encoder 的输出是具有不同尺寸的特征图其中 e1 是第一个残差块的输出e2 是第二个残差块的输出以此类推。 filters [64, 128, 256, 512] resnet models.resnet34(pretrainedpretrained) self.firstconv resnet.conv1 self.firstbn resnet.bn1 self.firstrelu resnet.relu self.firstmaxpool resnet.maxpool self.encoder1 resnet.layer1 self.encoder2 resnet.layer2 self.encoder3 resnet.layer3 self.encoder4 resnet.layer4解码器架构使用自定义的 DecoderBlock 类来构建解码器部分。每个解码器块都包括上采样操作和特征图融合操作其中上采样使用 nn.ConvTranspose2d 实现。将解码器块按照从深层到浅层的顺序进行连接最终得到 d4d3d2 和 d1分别对应不同层次的解码器块的输出。 self.decoder4 DecoderBlock(512, filters[2]) self.decoder3 DecoderBlock(filters[2], filters[1]) self.decoder2 DecoderBlock(filters[1], filters[0]) self.decoder1 DecoderBlock(filters[0], filters[0])性能分析训练结束后基于ResNet34的Unet网络得到的Best mean DSC值如下与Unet网络相近。 Best validation mean DSC: 0.911739各样本测试得到的DSC图如下所示。与Unet网络在训练集上的Loss曲线验证集上的DSC、Loss曲线对比结果如下所示。由上图可以看出基于ResNet34的UNet网络的收敛速度非常快在训练集和测试集的loss都比UNet网络的要低且测试集上该网络的DSC值也收敛更快更平稳但峰值与Unet相似。 5.3 Unet 最后我尝试了采用结构比较复杂的Unet进行训练。 Unet UnetNeted Unet是对传统U-Net架构的扩展和改进旨在提高分割任务的性能。UNet 在U-Net的基础上引入了密集和多尺度的连接以便更好地融合不同层次的特征。这包括从浅层到深层的连接以及在同一层级上的多个分支。 UNet 的核心思想是将多个U-Net结构嵌套在一起形成一个金字塔状的结构。每个U-Net结构被视为一个“子网”并且每个子网都有自己的编码器和解码器它们通过特征金字塔连接进行信息交换。在UNet中通过每个子网的解码器部分将来自其他子网的信息集成到当前子网中。这种集成机制有助于更好地利用不同层次和尺度的信息提高模型的表达能力。代码设计初始化函数 __init__ 函数定义了 UNet_Nested 类的初始化包括输入通道数in_channels、输出类别数n_classes、特征缩放比例feature_scale、是否使用反卷积is_deconv、是否使用批归一化is_batchnorm以及是否使用密集连接is_ds等参数。 class UNet_Nested(nn.Module):def __init__(self, in_channels1, n_classes2, feature_scale2, is_deconvTrue, is_batchnormTrue, is_dsTrue):super(UNet_Nested, self).__init__()self.in_channels in_channelsself.feature_scale feature_scaleself.is_deconv is_deconvself.is_batchnorm is_batchnormself.is_ds is_ds特征缩放和网络结构定义在初始化函数中首先根据特征缩放比例计算每个层级的特征通道数。 filters [64, 128, 256, 512, 1024]filters [int(x / self.feature_scale) for x in filters]然后定义下采样操作。 # downsamplingself.maxpool nn.MaxPool2d(kernel_size2)self.conv00 unetConv2(self.in_channels, filters[0], self.is_batchnorm)self.conv10 unetConv2(filters[0], filters[1], self.is_batchnorm)self.conv20 unetConv2(filters[1], filters[2], self.is_batchnorm)self.conv30 unetConv2(filters[2], filters[3], self.is_batchnorm)self.conv40 unetConv2(filters[3], filters[4], self.is_batchnorm)定义上采样操作。 # upsamplingself.up_concat01 unetUp(filters[1], filters[0], self.is_deconv)self.up_concat11 unetUp(filters[2], filters[1], self.is_deconv)self.up_concat21 unetUp(filters[3], filters[2], self.is_deconv)self.up_concat31 unetUp(filters[4], filters[3], self.is_deconv)self.up_concat02 unetUp(filters[1], filters[0], self.is_deconv, 3)self.up_concat12 unetUp(filters[2], filters[1], self.is_deconv, 3)self.up_concat22 unetUp(filters[3], filters[2], self.is_deconv, 3)self.up_concat03 unetUp(filters[1], filters[0], self.is_deconv, 4)self.up_concat13 unetUp(filters[2], filters[1], self.is_deconv, 4)self.up_concat04 unetUp(filters[1], filters[0], self.is_deconv, 5)前向传播函数 forward 函数定义了整个网络的前向传播过程。在前向传播中通过一系列的卷积和上采样操作将输入的特征图经过多个列的特征提取和上采样连接最终得到分割的结果。每个列内的特征上采样与相邻列的特征进行连接实现了多层次的特征融合有助于提高网络对不同尺度和层级的信息的捕获能力。 def forward(self, inputs):# column : 0X_00 self.conv00(inputs) # 16*512*512maxpool0 self.maxpool(X_00) # 16*256*256X_10 self.conv10(maxpool0) # 32*256*256maxpool1 self.maxpool(X_10) # 32*128*128X_20 self.conv20(maxpool1) # 64*128*128maxpool2 self.maxpool(X_20) # 64*64*64X_30 self.conv30(maxpool2) # 128*64*64maxpool3 self.maxpool(X_30) # 128*32*32X_40 self.conv40(maxpool3) # 256*32*32# column : 1X_01 self.up_concat01(X_10,X_00)X_11 self.up_concat11(X_20,X_10)X_21 self.up_concat21(X_30,X_20)X_31 self.up_concat31(X_40,X_30)# column : 2X_02 self.up_concat02(X_11,X_00,X_01)X_12 self.up_concat12(X_21,X_10,X_11)X_22 self.up_concat22(X_31,X_20,X_21)# column : 3X_03 self.up_concat03(X_12,X_00,X_01,X_02)X_13 self.up_concat13(X_22,X_10,X_11,X_12)# column : 4X_04 self.up_concat04(X_13,X_00,X_01,X_02,X_03)最终输出最终输出通过四个独立的卷积层final_1到final_4进行然后这些输出通过相加平均得到 final作为最终的分割结果。 # final layerfinal_1 self.final_1(X_01)final_2 self.final_2(X_02)final_3 self.final_3(X_03)final_4 self.final_4(X_04)final (final_1final_2final_3final_4)/4密集连接 is_ds 参数控制是否使用密集连接Dense Connection即每个上采样层都使用前面所有层的特征图。 if self.is_ds:return finalelse:return final_4性能分析 Unet网络训练处来效果很差训练100epoch得到最佳的DSC值只有0.024。 Best validation mean DSC: 0.024353各样本测试得到的DSC图如下所示。可以看出每个类别训练出的效果都非常差查看具体预测出的图像发现学习出来预测的图片却只在病灶区域边缘圈出了几个点而不是圈出了整个区域。 CS_4944样本预测图像 HT_7692样本预测图像。与Unet网络在训练集上的Loss曲线验证集上的DSC、Loss曲线对比结果如下所示。可以看出Unet的Loss值在训练集和测试集上都比UNet的低很多但是训练未能使得其在测试集的DSC表现有任何变好。通过询问助教得知这样的结果可能是因为模型参数过多训练时并没有把所有参数都学习收敛因此模型性能就会比较差。 6 总结对比所有模型结果的训练、测试的loss曲线与测试集上的DSC曲线结果如下。实验可知通过添加注意力机制、采用CalcLoss可以提高提取特征能力。采用ResNet34预训练模型可以加快训练收敛速度。SoftIoULoss不适合该项目的训练而UNet因为模型过于复杂也不适合该项目的训练。参考研习U-Net - 知乎 (zhihu.com) Unet-Segmentation-Pytorch-Nest-of-Unets/Models.py at master · bigmb/Unet-Segmentation-Pytorch-Nest-of-Unets (github.com) ShawnBIT/UNet-family: Paper and implementation of UNet-related model. (github.com) Andy-zhujunwen/UNET-ZOO: including unet,unet,attention-unet,r2unet,cenet,segnet ,fcn. (github.com)

查看全文

http://www.zqtcl.cn/news/909046/