网站如何做电脑和手机app,上海专业做网站较好的公司,cosy主题wordpress,php网站打开慢背景
医学图像数据集的增长#xff1a;随着公开的医学图像数据集数量的增加#xff0c;自动化器官分割和肿瘤检测技术得到了显著发展。数据集的局限性#xff1a;尽管数据集数量增加#xff0c;但每个数据集通常规模较小#xff0c;且存在部分标注问题。这意味着不是所有…背景
医学图像数据集的增长随着公开的医学图像数据集数量的增加自动化器官分割和肿瘤检测技术得到了显著发展。数据集的局限性尽管数据集数量增加但每个数据集通常规模较小且存在部分标注问题。这意味着不是所有的图像都有完整的标注信息这对于训练全面的AI模型构成了挑战。肿瘤类型的多样性现有模型通常只能处理特定类型的器官或肿瘤缺乏对不同类型肿瘤的广泛研究。模型的泛化能力现有模型往往只能处理特定数据集中的特定任务缺乏跨数据集、跨领域的泛化能力。
要解决的问题
标签不一致性不同数据集之间存在标签索引、名称和背景不一致的问题这使得将它们合并用于训练变得复杂。标签正交性传统的one-hot标签编码方式忽略了类别之间的语义关系这对于需要理解器官和肿瘤之间复杂关系的医学图像分割任务来说是不足的。模型的扩展性需要一个能够适应不同网络结构、不同医院的CT扫描数据并能够迁移到新任务的通用模型。计算效率现有模型在处理速度上可能不够快影响了它们在临床实践中的应用。性能提升需要提高模型在器官分割和肿瘤检测任务上的性能减少假阳性提高检测的敏感性和特异性。
详解框架
CLIP-Driven Universal Model的框架结合了文本和图像信息以提高医学图像分割和肿瘤检测的准确性和泛化能力。
1. 框架组成
文本分支Text Branch
预训练文本编码器使用CLIP模型的预训练文本编码器来处理与医学图像相关的文本描述如器官或肿瘤的名称生成文本嵌入。医学提示Medical Prompts将文本描述格式化为特定的提示模板例如“一个[类别]的计算机断层扫描图像”其中[类别]是具体的器官或肿瘤名称。文本嵌入生成通过预训练的文本编码器和医学提示为每个器官和肿瘤生成文本嵌入这些嵌入捕获了文本描述的语义信息。
视觉分支Vision Branch
图像预处理对CT扫描图像进行标准化处理包括调整方向、体素大小标准化以及强度归一化。视觉编码器使用如Swin UNETR这样的网络结构作为视觉编码器提取图像特征。特征处理通过一系列卷积层进一步处理视觉编码器提取的特征。
2. 特征融合与分割
特征对齐将文本嵌入与图像特征进行对齐通过连接操作实现以便模型能够同时考虑文本和图像信息。参数生成使用多层感知机MLP将对齐的特征转换为分割任务的参数。分割掩码预测使用文本驱动的分割器如1×1×1卷积层来预测每个像素点属于特定器官或肿瘤的概率形成分割掩码。
3. 训练与优化
损失函数使用二元交叉熵BCE损失函数进行监督学习并通过掩码反向传播技术只对有标注的类别进行损失计算和反向传播。优化器使用AdamW等优化器进行模型参数的优化。
4. 泛化与迁移能力
多数据集训练模型在多个数据集上进行训练以提高其泛化能力。迁移学习模型可以在新任务上进行微调以利用在大规模数据集上预训练得到的特征表示。
5. 性能评估
评估指标使用Dice相似系数DSC、归一化表面距离NSD、敏感性、特异性等指标来评估模型性能。跨数据集验证在多个外部数据集上进行测试以验证模型的泛化能力。
6. 开源框架支持
MONAI集成模型开发和实验过程中使用了MONAI框架这是一个为医学成像研究提供标准化、用户友好、可复现的深度学习工具的开源项目。
怎么解决这些问题 整合CLIP文本嵌入 利用CLIP预训练模型生成的文本嵌入来编码器官和肿瘤的标签这些嵌入能够捕捉图像和文本之间的语义关系从而克服了传统one-hot编码的局限性。 构建通用模型框架 提出了一个可以从多个部分标注的数据集中学习的通用模型这个模型不仅能够处理特定的器官或肿瘤分割任务还能够泛化到新的领域和任务。 解决标签不一致性 通过统一不同数据集中的标签索引将不同数据集的标注标准化使得模型能够在合并的数据集上进行训练。 掩码反向传播技术 为了解决部分标签问题提出了一种掩码反向传播技术该技术只对那些在数据集中有标注的类别进行损失计算和反向传播从而优化模型参数。
实验
数据集和评估指标
训练数据集使用了14个公开的CT扫描数据集共计3410个扫描图像。测试数据集在3个额外的数据集上进行评估包括6162个外部CT扫描图像。评估指标使用了Dice Similarity Coefficient (DSC) 和 Normalized Surface Distance (NSD) 来评估器官/肿瘤分割的效果使用Sensitivity敏感性和Specificity特异性来评估肿瘤检测的性能。
实施细节
数据增强包括改变CT扫描的方向、使用等间距重新切片每个扫描以统一体素大小以及强度截断和归一化。网络结构详细描述了文本分支和视觉分支的网络结构包括使用的预训练模型和自定义的网络层。损失函数和优化器使用了二元交叉熵损失函数并采用AdamW优化器进行训练。
性能比较
MSD和BTCV挑战模型在Medical Segmentation Decathlon (MSD) 和Beyond The Cranial Vault (BTCV) 挑战中的表现。与其他模型的比较与现有的SwinUNETR模型之前在MSD排行榜上排名第一进行了性能比较。
器官分割性能
MSD任务提供了5折交叉验证的结果并展示了在MSD各个任务上的DSC分数。BTCV任务在BTCV验证集上与其他方法进行了比较并提供了详细的DSC分数。
肿瘤检测性能
五个数据集上的肿瘤检测在包含肝脏、肾脏和胰腺肿瘤的数据集上评估了模型的肿瘤检测性能并提供了敏感性和特异性的调和平均值。
CLIP嵌入的有效性
嵌入空间的可视化通过t-SNE可视化展示了使用CLIP嵌入与one-hot编码相比如何更好地捕捉特征之间的聚类和解剖结构关系。不同提示模板的效果评估了不同文本提示模板对CLIP嵌入性能的影响。
模型的临床相关特性
效率比较了模型的计算效率使用FLOPs浮点运算次数作为指标。扩展性展示了模型可以扩展到不同的网络骨干如CNN和Transformer。泛化能力在多个外部数据集上评估了模型的泛化能力。迁移学习能力评估了模型在不同下游任务上的迁移学习能力。
指标 Dice相似系数DSC DSC是一个统计量用于比较两个样本集合的相似度通常用于评估图像分割任务中预测的分割掩码与真实标注之间的一致性。它的计算公式为 DSC 2 ∣ X ∩ Y ∣ ∣ X ∣ ∣ Y ∣ \text{DSC} \frac{2 |X \cap Y|}{|X| |Y|} DSC∣X∣∣Y∣2∣X∩Y∣ 其中 X X X 是预测的分割掩码 Y Y Y 是真实的分割掩码 ∣ X ∩ Y ∣ |X \cap Y| ∣X∩Y∣ 是两者交集的体积 ∣ X ∣ |X| ∣X∣ 和 ∣ Y ∣ |Y| ∣Y∣ 分别是预测和真实分割掩码的体积。DSC的值范围从0到1值越高表示预测的分割与真实标注越相似。 归一化表面距离NSD NSD是衡量两个表面之间距离的指标通常用于评估图像分割任务中预测的分割边界与真实边界之间的接近程度。它的计算公式为 NSD 1 N ∑ i 1 N d i 2 spacing \text{NSD} \frac{\sqrt{\frac{1}{N} \sum_{i1}^{N} d_i^2}}{\text{spacing}} NSDspacingN1∑i1Ndi2 其中 d i d_i di 是预测表面和真实表面之间的距离 N N N 是表面点的数量 spacing \text{spacing} spacing 是图像的体素间距。NSD的值越小表示预测的分割边界与真实边界越接近。
复现
复现模型在xx数据集的表现论文提到的
我选用的是MSD的task 09 Spleen
下载好模型权重和数据集并放置在对应的文件夹下再运行validation.py即可同时获得DSC分数