当前位置: 首页 > news >正文

胶南网站建设价格监控网站模版

胶南网站建设价格,监控网站模版,关于网站建设的标语,电脑怎么做网站之——介绍与数据集 杂谈 语义分割#xff0c;语义分割(Semantic Segmentation)方法-CSDN博客#xff1a; 语义分割是计算机视觉领域的一项重要任务#xff0c;旨在将图像中的每个像素分配到其对应的语义类别中。与物体检测或图像分类不同#xff0c;语义分割不仅要识别图像…之——介绍与数据集 杂谈 语义分割语义分割(Semantic Segmentation)方法-CSDN博客 语义分割是计算机视觉领域的一项重要任务旨在将图像中的每个像素分配到其对应的语义类别中。与物体检测或图像分类不同语义分割不仅要识别图像中的对象还要为每个像素标注其语义类别实现对图像的细粒度理解。         在语义分割中每个像素都被赋予一个标签表示该像素属于图像中的哪个语义类别例如人、车、道路、树等。这使得语义分割成为深度学习在医学图像分析、自动驾驶、农业图像处理等领域中的关键技术之一。         常见的语义分割方法包括基于卷积神经网络CNN的深度学习方法。这些方法通常使用编码器-解码器结构通过学习图像的高级特征来实现像素级别的分类。语义分割在许多应用中都有广泛的用途如交通场景理解、医学图像分析、卫星图像解释等。 正文 1.语义分割 像素级的分割 一般的分割只是对类似样式像素进行聚类而语义分割在此基础上还加入了对这个类别的理解。 2.应用 背景虚化 道路分割 另外还有一个进化版在语义分割上升级为对每个实例都有区分 3.数据集 Pascal VOC2012数据集 d2l.DATA_HUB[voc2012] (d2l.DATA_URL VOCtrainval_11-May-2012.tar,4e443f8a2eca6b1dac8a6c57641b67dd40621a49)voc_dir d2l.download_extract(voc2012, VOCdevkit/VOC2012) 读取依次把图片和对应的标号读进来 def read_voc_images(voc_dir, is_trainTrue):读取所有VOC图像并标注txt_fname os.path.join(voc_dir, ImageSets, Segmentation,train.txt if is_train else val.txt)mode torchvision.io.image.ImageReadMode.RGBwith open(txt_fname, r) as f:images f.read().split()features, labels [], []for i, fname in enumerate(images):features.append(torchvision.io.read_image(os.path.join(voc_dir, JPEGImages, f{fname}.jpg)))labels.append(torchvision.io.read_image(os.path.join(voc_dir, SegmentationClass ,f{fname}.png), mode))return features, labelstrain_features, train_labels read_voc_images(voc_dir, True) 展示 n 5 imgs train_features[0:n] train_labels[0:n] imgs [img.permute(1,2,0) for img in imgs] d2l.show_images(imgs, 2, n);列举颜色和类别名 VOC_COLORMAP [[0, 0, 0], [128, 0, 0], [0, 128, 0], [128, 128, 0],[0, 0, 128], [128, 0, 128], [0, 128, 128], [128, 128, 128],[64, 0, 0], [192, 0, 0], [64, 128, 0], [192, 128, 0],[64, 0, 128], [192, 0, 128], [64, 128, 128], [192, 128, 128],[0, 64, 0], [128, 64, 0], [0, 192, 0], [128, 192, 0],[0, 64, 128]]#save VOC_CLASSES [background, aeroplane, bicycle, bird, boat,bottle, bus, car, cat, chair, cow,diningtable, dog, horse, motorbike, person,potted plant, sheep, sofa, train, tv/monitor] 通过以上定义的两个常量可以方便地查找标签中每个像素的类索引。 通过创造个colormap可能的颜色组合就是256^3然后进行三通道颜色的融合计算与类别数一一映射上 def voc_colormap2label():构建从RGB到VOC类别索引的映射colormap2label torch.zeros(256 ** 3, dtypetorch.long)for i, colormap in enumerate(VOC_COLORMAP):colormap2label[(colormap[0] * 256 colormap[1]) * 256 colormap[2]] ireturn colormap2labeldef voc_label_indices(colormap, colormap2label):将VOC标签中的RGB值映射到它们的类别索引colormap colormap.permute(1, 2, 0).numpy().astype(int32)idx ((colormap[:, :, 0] * 256 colormap[:, :, 1]) * 256 colormap[:, :, 2])return colormap2label[idx] 这样就把分割颜色转换为了类别 y voc_label_indices(train_labels[1], voc_colormap2label()) y[190:200, 190:200], VOC_CLASSES[20] 可见 VOC_CLASSES 和数字挂上了钩 随机裁剪图像 def voc_rand_crop(feature, label, height, width):随机裁剪特征和标签图像rect torchvision.transforms.RandomCrop.get_params(feature, (height, width))feature torchvision.transforms.functional.crop(feature, *rect)label torchvision.transforms.functional.crop(label, *rect)return feature, labelimgs [] for _ in range(n):imgs voc_rand_crop(train_features[0], train_labels[0], 200, 300)imgs [img.permute(1, 2, 0) for img in imgs]d2l.show_images(imgs[::2] imgs[1::2], 2, n); 自定义语义分割数据集 class VOCSegDataset(torch.utils.data.Dataset):一个用于加载VOC数据集的自定义数据集def __init__(self, is_train, crop_size, voc_dir):self.transform torchvision.transforms.Normalize(mean[0.485, 0.456, 0.406], std[0.229, 0.224, 0.225])self.crop_size crop_sizefeatures, labels read_voc_images(voc_dir, is_trainis_train)self.features [self.normalize_image(feature)for feature in self.filter(features)]self.labels self.filter(labels)self.colormap2label voc_colormap2label()print(read str(len(self.features)) examples)def normalize_image(self, img):return self.transform(img.float() / 255)def filter(self, imgs):return [img for img in imgs if (img.shape[1] self.crop_size[0] andimg.shape[2] self.crop_size[1])]def __getitem__(self, idx):feature, label voc_rand_crop(self.features[idx], self.labels[idx],*self.crop_size)return (feature, voc_label_indices(label, self.colormap2label))def __len__(self):return len(self.features) 拓展 语义分割的算法和技术在不断发展以下是一些常见的算法和技术 全卷积网络Fully Convolutional NetworksFCN这是语义分割领域中的里程碑之一。FCN将传统的卷积神经网络中的全连接层替换为全卷积层允许输入图像尺寸与输出分割结果尺寸不同。通过上采样和跳跃连接FCN能够生成像素级别的语义分割。 U-NetU-Net结构由编码器收缩路径和解码器扩展路径组成通过特征提取和逐步上采样能够在保留空间信息的同时进行语义分割尤其在医学图像分割中应用广泛。 DeepLabDeepLab系列模型利用空洞卷积或称为膨胀卷积来扩大卷积操作的感受野有助于捕获更广阔的上下文信息。DeepLab模型还使用了空间金字塔池化Spatial Pyramid Pooling等技术来处理多尺度信息。 Mask R-CNN这是一种结合了目标检测和语义分割的方法。它在Faster R-CNN的基础上增加了分割分支可以同时检测和分割图像中的对象。 图卷积网络Graph Convolutional NetworkGCN针对具有图结构的数据如社交网络或分子结构GCN可用于图像语义分割。它能够处理像素之间的关联信息有助于更好地理解图像中像素之间的联系。 实例分割Instance Segmentation与语义分割类似但不仅对像素进行语义标注还能区分不同实例。Mask R-CNN是其中一个流行的实例分割方法。         这些算法和技术的不断发展使得语义分割在医学影像、自动驾驶、农业图像处理、地理信息系统等领域中有着广泛的应用和进展。同时结合了深度学习和传统计算机视觉技术的组合也在不断涌现为语义分割领域带来了新的创新。 关于yolo的分割 YOLOv3 及其后续版本也包含了一定程度的语义分割功能。         虽然 YOLO 主要是用于目标检测但YOLOv3及后续版本提供了一种称为“预测像素级别标签”的功能。这种功能允许 YOLO 模型输出对图像进行分割的结果。虽然它并不是专门用于像素级别的语义分割但这种预测可以提供较为粗略的分割效果。
http://www.zqtcl.cn/news/978043/

相关文章:

  • 上传网站图片处理画册设计多少钱一页
  • 网站做标签页新公司网站建设都有哪些优势
  • 上门做指甲哪个网站百度搜索榜
  • 西安网站seo优化商城域名注册管理机构
  • 凡客网站目录优化服装网站建设论文
  • 自助网站搭建哈尔滨seo优化
  • 做网站和软件的团队网页设计与网页制作的实验报告
  • 广州网站建设很棒 乐云践新wordpress搬家 登录报错
  • 顺的网站建设案例如何上传网站
  • 网站管理和建设工作职责中国建设银行卖狗年纪念币官方网站
  • 如何快速开发一个网站干洗店投资多少钱可以营业了
  • 哪些分类网站WordPress商用收费吗
  • 南开网站建设优化seo福建凭祥建设工程有限公司网站
  • 建设工程消防设计备案凭证查询网站网站建设课程设计目的和内容
  • 网站开发要花多少钱wordpress网站邀请码
  • 社旗网站设计小程序制作用华网天下优惠
  • 建设产品网站代理注册企业邮箱
  • 购物网站建设费用珠海本地网站
  • 做电商网站前期做什么工作网站后台jsp怎么做分页
  • 百家利网站开发搜索引擎分哪三类
  • 安徽集团网站建设深圳最新通告今天
  • 公司网站主机流量30g每月够用吗攀枝花网站网站建设
  • 淘宝做图片的网站手机网站北京
  • 重庆网站首页排名公司网站公众号小程序开发公司
  • 河源网站制作1993seo福州室内设计公司排名
  • 哪里有做装修网站网站开发总出现出现404
  • 做a漫画在线观看网站策划营销型网站
  • 怎么 从头开始建设一个网站临沂高端网站建设
  • 网页设计制作网站素材传奇代理平台
  • 公司建站网站软文营销方案