培训网站欣赏,怎么做网站的分类目录,方维网站建设,局网站建设意见这是对FCBFormer的改进#xff0c;我的关于FCBFormer的论文阅读笔记#xff1a;论文阅读FCN-Transformer Feature Fusion for PolypSegmentation-CSDN博客
1#xff0c;整体结构
依然是一个双分支结构#xff0c;总体结构如下#xff1a; 其中一个是全卷积分支#xff…这是对FCBFormer的改进我的关于FCBFormer的论文阅读笔记论文阅读FCN-Transformer Feature Fusion for PolypSegmentation-CSDN博客
1整体结构
依然是一个双分支结构总体结构如下 其中一个是全卷积分支一个是Transformer分支。
和FCBFormer不同的是对两个分支都做了一些修改。
2FCB分支
本文没有画FCB分支的整体结构我们借用一下FCBFormer的结构图看一下 相比FCBFormerFCB-SwinV2 Transformer模型中的FCB分支进行了以下主要改进
1通道维度增加FCB分支的通道维度被增加以匹配从SwinV2 Transformer-UNET分支输出的通道维度数量。这样做是为了确保两个分支的输出可以在合并之前具有相同的维度从而更有效地结合两种架构的优势。
2组归一化顺序调整在FCB分支的残差块RB中组归一化GN的顺序被调整以适应SwinV2 Transformer中的残差后归一化residual post normalization方法。RB模块的调整如下 左边为原来的RB模块右边是本文用的RB模块。主要是把先归一化再卷积调整为先卷积再做归一化。
3残差块改进残差块的设计受到了SwinV2 Transformer中残差后归一化方法的启发。在FCB-SwinV2 Transformer中残差块的归一化步骤被放置在卷积层之后这与原始FCBFormer中的顺序不同。
3TB分支
TB模块采用了SwinV2 Transformer作为其核心SwinV2 Transformer通过引入“残差后归一化”residual post normalization和修改注意力机制来优化原始的Swin Transformer。
解码器模块scse如下 scse模块由cse和sse两个子模块构成。
1CSEChannel Squeeze and Excitation模块是一种注意力机制它通过显式地建模通道间的依赖关系来增强网络的特征表示能力。
CSE整体结构
输入特征图: F
1. 通道全局平均池化: G Global_Average_Pooling(F)
2. 卷积和激活: H Activation(Conv(G))
3. 逐元素乘法: Output H * F
2SSESpatial Squeeze and Excitation模块是一种用于增强特征图中空间特征的注意力机制。
SSE整体结构
输入特征图: F
1. 通道压缩: G Conv(F) # 使用1x1卷积核
2. 空间激励: H Activation(G)
3. 逐元素乘法: Output H * F
把编码器和解码器按照UNET的结构组合起来就是TB分支。
4实验结果