当前位置: 首页 > news >正文

网站官网建设注意vps网站目录是灰色的

网站官网建设注意,vps网站目录是灰色的,上海市建设厅网站查询,大连百度seo前言#xff1a;Hello大家好#xff0c;我是小哥谈。目标检测是计算机视觉领域中的一项任务#xff0c;旨在自动识别和定位图像或视频中的特定目标#xff0c;目标可以是人、车辆、动物、物体等。目标检测的目标是从输入图像中确定目标的位置#xff0c;并使用边界框将其标… 前言Hello大家好我是小哥谈。目标检测是计算机视觉领域中的一项任务旨在自动识别和定位图像或视频中的特定目标目标可以是人、车辆、动物、物体等。目标检测的目标是从输入图像中确定目标的位置并使用边界框将其标记出来。为了让大家能够牢固地掌握目标检测基础知识本系列文章就对目标检测进行详细介绍希望大家学习之后能够有所收获  目录 1.简介 1.1 什么是目标检测 1.2 目标检测算法难点 1.3 目标检测主流目标检测技术 1.4 目标检测算法未来趋势 1.5 目标检测算法应用 2.目标检测发展历程与现状 2.1 目标检测算法发展历程 2.2 目标检测算法分类 3.目标检测原理 3.1 候选区域产生 3.2 数据表示 3.3 效果评估 3.4 非极大值抑制 4.目标检测常用的数据集 4.1 PASCAL VOC 4.2 MS COCO 4.3 Google Open Image 4.4 ImageNet 4.5 DOTA 5.目标检测常用标注工具 5.1 LabelImg 5.2 labelme 5.3 Labelbox 5.4 RectLabel 5.5 CVAT 5.6 VIA 5.7 其他标注工具 6.目标检测常用术语表 1.简介 1.1 什么是目标检测 目标检测是计算机视觉领域中的一个任务其目的是在图像或视频中确定和定位感兴趣的物体。目标检测模型不仅可以识别物体的类别还能够提供每个物体的边界框位置。由于各类物体有不同的外观、形状和姿态加上成像时光照、遮挡等因素的干扰目标检测⼀直是计算机视觉领域最具有挑战性的问题。目标检测通常涉及两个主要步骤分类判断物体类别和定位确定边界框位置。 目标检测的位置信息一般由两种格式以图片左上角为原点(0,0) 1极坐标表示(xmin, ymin, xmax, ymax) xminyminx,y坐标的最小值xminyminx,y坐标的最大值 2中心点坐标(x_center, y_center, w, h) x_centery_center目标检测框的中心点坐标wh目标检测框的宽、高 在深度学习领域目标检测通常使用卷积神经网络CNN模型来实现。常见的目标检测方法包括 R-CNN系列包括R-CNN、Fast R-CNN、Faster R-CNN等这些方法使用候选区域提取技术如选择性搜索来生成感兴趣区域然后通过分类器和回归器对这些区域进行分类和定位。 YOLO系列包括YOLO、YOLOv2、YOLOv3等这些方法将目标检测问题转化为一个回归问题并将物体位置和类别同时预测出来具有较快的速度和较高的精度。 SSDSingle Shot MultiBox DetectorSSD将目标检测问题转化为一个多尺度检测问题通过在不同层次上预测不同尺度的边界框和类别信息来实现目标检测。 等等...... 计算机视觉中关于图像识别有四大类任务 分类-Classification解决“是什么”的问题即给定⼀张图⽚或⼀段视频判断里面包含什么类别的目标。 定位-Location解决“在哪里”的问题即定位出这个目标的的位置。 检测-Detection解决“是什么在哪里”的问题即定位出这个⽬标的的位置并且知道目标物是什么。 分割-Segmentation分为实例的分割Instance-level和场景分割Scene-level解决“每⼀个像素属于哪个目标物或场景”的问题。 除了图像分类之外目标检测要解决的核心问题是 目标可能出现在图像的任何位置。 目标有各种不同的大小。目标可能有各种不同的形状。 1.2 目标检测算法难点 目标检测算法的主要难点和挑战 待检测目标尺寸很小导致占比小检测难度大。待检测目标尺度变化大网络难以提取出高效特征。待检测目标所在背景复杂噪音干扰严重检测难度大。待检测目标与背景颜色对比度低网络难以提取出具有判别性的特征。各待检测目标之间数量极度不均衡导致样本不均衡。检测算法的速度与精度难以取得良好平衡。 等等...... 1.3 目标检测主流目标检测技术 目前国内主流的目标检测技术 YOLOX由中国的旷视科技研发是目前国际上运行速度最快的一种深度学习模型。YOLOV1-V5Yolov1-yolov3由Joseph Redmon研发yolov4-yolov5则是由yolo团队内部成员完成的。Transformer原来是做为语音识别的一个模型现在用在图像的目标识别上面也有不俗的表现。ViT当考虑预训练模型的计算成本时ViT的性能非常好以较低的预训练成本在大多数识别基准上达到了最先进的水平。 等等...... 1.4 目标检测算法未来趋势 随着技术的发展和成熟应用目标检测算法未来的发展趋势主要有 轻量型目标检测与AutoML结合的目标检测领域自适应的目标检测弱监督目标检测小目标检测视频检测信息融合目标检测 等等...... 1.5 目标检测算法应用 目标检测具有巨大的实⽤价值和应⽤前景。 1人脸检测 智能门控员工考勤签到智慧超市人脸支付车站、机场实名认证公共安全逃犯抓捕、走失人员检测 2行人检测 智能辅助驾驶智能监控暴恐检测根据面相识别暴恐倾向移动侦测、区域入侵检测、安全帽/安全带检测 3车辆检测 自动驾驶违章查询、关键通道检测广告检测检测广告中的车辆类型弹出链接 4遥感检测 大地遥感如土地使用、公路、水渠、河流监控农作物监控军事检测 2.目标检测发展历程与现状 2.1 目标检测算法发展历程 过去的 20 年目标检测的发展历程大致经历了两个历史时期传统的目标检测时期2014 年以前和基于深度学习的检测时期2014 年以后。 传统的目标检测算法可以概括为以下几个步骤 首先采取滑动窗口的方式遍历整张图像产生一定数量的候选框 其次提取候选框的特征 最后利用支持向量机SVM等分类方法对提取到的特征进行分类进而得到结果。 由于当时缺乏有效的图像表示人们只能设计复杂的特征表示并通过各种加速技能来充分利用有限的计算资源。该时期主要的检测方法有 Viola Jones检测器 Viola Jones检测器由三个核心步骤组成即Haar特征和积分图、Adaboost分类器以及级联分类器。HOG检测器HOG检测器利用了方向梯度直方图HOG特征描述子通过计算和统计局部区域的梯度方向直方图来构建特征。HOG特征与SVM分类器算法的结合在行人检测任务中应用广泛且效果显著。然而HOG检测器的缺点是始终需要保持检测窗口的大小不变如果待检测目标的大小不一那么HOG检测器需要多次缩放输入图像。基于部件的可变形模型DPMDPM所遵循的思想是“分而治之”训练过程中学习的是如何将目标物体进行正确地分解而推理时则是将不同的部件组合到一起。比如说检测“汽车”问题可以分解为检测“车窗”、“车身”和“车轮”等。 早期的目标检测任务提取特征时主要的方式是人工提取具有一定的局限性手工特征的性能也趋于饱和。2012 年起卷积神经网络的广泛应用使得目标检测也开启了新的征程。2014年R-CNN算法横空出世目标检测开始以前所未有的速度快速发展。深度学习时代目标检测算法根据检测思想的不同通常可以分为两大类别两阶段two-stage检测和一阶段one-stage检测。 两阶段检测算法基于提议的候选框是一个“由粗到细”的过程。首先产生区域候选框其次提取每个候选框的特征最后产生位置框并预测对应的类别特点是精度高但速度慢。最早期的R-CNN算法利用“选择性搜索”方法产生候选框、卷积神经网络提取特征、支持向量机分类器进行分类和预测。虽然R-CNN算法具有一定的开创性但生成的候选框大量重叠存在计算冗余的问题。 2014年提出的SPPNet算法利用空间金字塔池化层对不同尺度的特征图进行池化并生成固定长度的特征表示减少反复缩放图像对检测结果造成的影响。然而SPPNet的缺点是模型的训练仍然是分多步的SPPNet很难对SPP层之前的网络进行参数微调导致效率降低。2015 年提出的Fast R-CNN算法对R-CNN与SPPNet算法做出进一步改进提出感兴趣区域池化层ROI使得检测的速度和精度大大提升。随后又出现的Faster R-CNN算法实现了端到端地训练用RPN网络代替选择性搜索大大减少了训练和测试的时间。 一阶段检测算法基于边界框的回归是一个“一步到位”的过程。一阶段检测网络在产生候选框的同时进行分类和边界框回归特点是速度快但精度稍逊。2016年YOLO算法提出该算法将图像分割成 S×S 个网格基于每个网格对应的包围框直接预测类别概率和回归位置信息。随后有出现了SSD 算法该算法借鉴YOLO算法的思想并利用多尺度特征图进行预测。 2.2 目标检测算法分类 基于深度学习的⽬标检测算法主要分为两类 1Two stage目标检测算法 先进行区域生成region proposalRP⼀个有可能包含待检物体的预选框再通过卷积神经网络进行样本分类。 任务特征提取—生成RP—分类/定位回归。 常见的two stage目标检测算法有R-CNN、SPP-Net、Fast R-CNN、Faster R-CNN和R-FCN等。✅ 2One stage目标检测算法 不用RP直接在网络中提取特征来预测物体分类和位置。 任务特征提取—分类/定位回归。 常见的one stage目标检测算法有OverFeat、YOLOv1、YOLOv2、YOLOv3、SSD和RetinaNet等。✅ 两阶段算法和一阶段算法对比 算法类别机制优势局限性适用场景两阶段算法先生成候选区再对候选区进行分类和回归。算法精确度高实时性差检测小目标效果差。高精度目标检测一阶段算法不生成候选区直接进行分类和回归实时性高成群目标和小目标检测精度低实时目标检测 3.目标检测原理 目标检测主要分为两大系列——RCNN系列和YOLO系列RCNN系列是基于区域检测的代表性算法YOLO是基于区域提取的代表性算法。 3.1 候选区域产生 很多目标检测技术都会涉及候选框bounding boxes的生成物体候选框获取当前主要使用图像分割与区域生长技术。区域生长(合并)主要由于检测图像中存在的物体具有局部区域相似性(颜色、纹理等)。目标识别与图像分割技术的发展进一步推动有效提取图像中信息。 1滑动窗口 通过滑窗法流程图可以很清晰理解其主要思路首先对输入图像进行不同窗口大小的滑窗进行从左往右、从上到下的滑动。每次滑动时候对当前窗口执行分类器(分类器是事先训练好的)。如果当前窗口得到较高的分类概率则认为检测到了物体。对每个不同窗口大小的滑窗都进行检测后会得到不同窗口检测到的物体标记这些窗口大小会存在重复较高的部分最后采用非极大值抑制(Non-Maximum Suppression, NMS)的方法进行筛选。最终经过NMS筛选后获得检测到的物体。 滑窗法简单易于理解但是不同窗口大小进行图像全局搜索导致效率低下而且设计窗口大小时候还需要考虑物体的长宽比。所以对于实时性要求较高的分类器不推荐使用滑窗法。 说明♨️♨️♨️ 滑动窗口法中事先规定一个固定大小的窗口使用这个窗口在原图中滑动滑动到每个位置那么窗口与图像重合的部分就是一个候选区域候选区域用来后续的检测任务滑动窗口法类似于卷积神经网络中的卷积过程。如果图片尺寸很大会导致一张图片就能产生数量极多的候选区域。滑动窗口的尺寸设置需要与物体的尺寸相匹配才能带来好的效果因此对于检测任务来说滑动窗口法效率很低并且性能不优。 2选择性搜索 滑窗法类似穷举进行图像子区域搜索但是一般情况下图像中大部分子区域是没有物体的。学者们自然而然想到只对图像中最有可能包含物体的区域进行搜索以此来提高计算效率。选择搜索selective search简称SS方法是当下最为熟知的图像bounding boxes提取算法由Koen E.A于2011年提出。 选择搜索算法的主要思想图像中物体可能存在的区域应该是有某些相似性或者连续性区域的。因此选择搜索基于上面这一想法采用子区域合并的方法进行提取bounding boxes。 首先对输入图像进行分割算法产生许多小的子区域。 其次根据这些子区域之间相似性(相似性标准主要有颜色、纹理、大小等等)进行区域合并不断的进行区域迭代合并。每次迭代过程中对这些合并的子区域做bounding boxes(外切矩形)这些子区域外切矩形就是通常所说的候选框。 选择性搜索流程 step0生成区域集Rstep1计算区域集R里每个相邻区域的相似度S{s1, s2,…}step2找出相似度最高的两个区域将其合并为新集添加进Rstep3从S中移除所有与step2中有关的子集step4计算新集与所有子集的相似度step5跳至step2直至S为空 选择性搜索优点 计算效率优于滑窗法由于采用子区域合并策略所以可以包含各种大小的疑似物体框。合并区域相似的指标多样性提高了检测物体的概率。 3.2 数据表示 经过标记后的样本数据如下所示 预测输出可以表示为 其中为预测结果的置信概率为边框坐标为属于某个类别的概率。通过预测结果、实际结果构建损失函数。 3.3 效果评估 使用IoUIntersection over Union交并比来判断模型的好坏。所谓交并比是指预测边框、实际边框交集和并集的比率一般约定0.5为一个可以接收的值。 3.4 非极大值抑制 预测结果中可能多个预测结果间存在重叠部分需要保留交并比最大的、去掉非最大的预测结果这就是非极大值抑制Non-Maximum Suppression简写作NMS。 如下图所示对同一个物体预测结果包含三个概率0.8/0.9/0.95经过非极大值抑制后仅保留概率最大的预测结果。 说明♨️♨️♨️ 置信度置信度是介于0-1或100%之间的数字它描述模型认为此预测边界框包含某类别目标的概率。 IoUIntersection over UnionIoU即两个边界框相交面积与相并面积的比值边界框的准确度可以用IoU进行表示一般约定在检测中IOU0.5则认为检测正确一般阈值设为0.5。 总结就是置信度和IoU一起用来计算精确率。 4.目标检测常用的数据集 4.1 PASCAL VOC VOC数据集是⽬标检测经常⽤的⼀个数据集⾃2005年起每年举办⼀次⽐赛最开始只有4类到2007年扩充 为20个类共有两个常⽤的版本2007和2012。 学术界常⽤5k的train/val 2007和16k的train/val 2012作为训练集test 2007作为测试集⽤10k的train/val 2007test 2007和16k的train/val 2012作为训练集test2012作为测试集分别汇报结果。 4.2 MS COCO COCO数据集是微软团队发布的⼀个可以⽤来图像recognitionsegmentationcaptioning 数据集该数据集收集了⼤量包含常见物体的⽇常场景图⽚并提供像素级的实例标注以更精确地评估检测和分割算法的效果致⼒于推动场景理解的研究进展。依托这⼀数据集每年举办⼀次⽐赛现已涵盖检测、分割、关键点识别、注释等机器视觉的中⼼任务是继ImageNet Chanllenge以来最有影响⼒的学术竞赛之⼀。 相⽐ImageNetCOCO更加偏好⽬标与其场景共同出现的图⽚即non-iconic images。这样的图⽚能够反映视觉上的语义更符合图像理解的任务要求⽽相对的iconic images则更适合浅语义的图像分类等任务。 COCO的检测任务共含有80个类在2014年发布的数据规模分train/val/test分别为80k/40k/40k学术界较为通⽤的划分是使⽤train和35k的val⼦集作为训练集trainval35k使⽤剩余的val作为测试集minival同时向官⽅的evaluation server提交结果test-dev。除此之外COCO官⽅也保留⼀部分test数据作为⽐赛的评测集。 4.3 Google Open Image Open Image是⾕歌团队发布的数据集。最新发布的Open Images V4包含190万图像、600个种类1540万个 bounding-box标注是当前最⼤的带物体位置标注信息的数据集。这些边界框⼤部分都是由专业注释⼈员⼿动绘制的确保了它们的准确性和⼀致性。另外这些图像是⾮常多样化的并且通常包含有多个对象的复杂场景平均每个图像 8 个。 4.4 ImageNet ImageNet是⼀个计算机视觉系统识别项⽬是⽬前世界上图像识别最⼤的数据库。ImageNet是美国斯坦福的计算机科学家模拟⼈类的识别系统建⽴的。能够从图⽚识别物体。Imagenet数据集⽂档详细有专门的团队维护使⽤⾮常⽅便在计算机视觉领域研究论⽂中应⽤⾮常⼴⼏乎成为了⽬前深度学习图像领域算法性能 检验的“标准”数据集。Imagenet数据集有1400多万幅图⽚涵盖2万多个类别其中有超过百万的图⽚有明确的类别标注和图像中物体位置的标注。 4.5 DOTA DOTA是遥感航空图像检测的常⽤数据集包含2806张航空图像尺⼨⼤约为4kx4k包含15个类别共计188282个实例其中14个主类small vehicle 和 large vehicle都是vehicle的⼦类。其标注⽅式为四点确定的任意形状和⽅向的四边形。航空图像区别于传统数据集有其⾃⼰的特点如尺度变化性更⼤密集的⼩物体 检测检测⽬标的不确定性。数据划分为1/6验证集1/3测试集1/2训练集。⽬前发布了训练集和验证集图像尺⼨从800x800到4000x4000不等。 5.目标检测常用标注工具 5.1 LabelImg LabelImg 是⼀款开源的图像标注⼯具标签可⽤于分类和⽬标检测它是⽤ Python 编写的并使⽤Qt作为其图形界⾯简单好⽤。注释以 PASCAL VOC 格式保存为 XML ⽂件这是 ImageNet 使⽤的格式。 此外它还⽀持 COCO 数据集格式。 5.2 labelme labelme 是⼀款开源的图像/视频标注⼯具标签可⽤于⽬标检测、分割和分类。灵感是来⾃于 MIT 开源的⼀ 款标注⼯具 LabelMe。 labelme 具有的特点是 ⽀持图像的标注的组件有矩形框多边形圆线点rectangle, polygons, circle, lines, points ⽀持视频标注 GUI ⾃定义 ⽀持导出 VOC 格式⽤于 semantic/instance segmentation ⽀出导出 COCO 格式⽤于 instance segmentation 5.3 Labelbox Labelbox 是⼀家为机器学习应⽤程序创建、管理和维护数据集的服务提供商其中包含⼀款部分免费的数据标签⼯具包含图像分类和分割⽂本⾳频和视频注释的接⼝其中图像视频标注具有的功能如下 可⽤于标注的组件有矩形框多边形线点画笔超像素等bounding box, polygons, lines, pointsbrush, subpixels 标签可⽤于分类分割⽬标检测等 以 JSON / CSV / WKT / COCO / Pascal VOC 等格式导出数据 ⽀持 Tiled Imagery (Maps) ⽀持视频标注 快要更新 5.4 RectLabel RectLabel 是⼀款在线免费图像标注⼯具标签可⽤于⽬标检测、分割和分类。具有的功能或特点 可⽤的组件矩形框多边形三次贝塞尔曲线直线和点画笔超像素 可只标记整张图像⽽不绘制 可使⽤画笔和超像素 导出为YOLOKITTICOCO JSON和CSV格式 以PASCAL VOC XML格式读写 使⽤Core ML模型⾃动标记图像 将视频转换为图像帧 5.5 CVAT CVAT 是⼀款开源的基于⽹络的交互式视频/图像标注⼯具是对加州视频标注⼯具Video Annotation Tool 项⽬的重新设计和实现。OpenCV团队正在使⽤该⼯具来标注不同属性的数百万个对象许多 UI 和 UX 的决策 都基于专业数据标注团队的反馈。具有的功能 关键帧之间的边界框插值 ⾃动标注使⽤TensorFlow OD API 和 Intel OpenVINO IR格式的深度学习模型 5.6 VIA VGG Image AnnotatorVIA是⼀款简单独⽴的⼿动注释软件适⽤于图像、⾳频和视频。 VIA 在 Web 浏览 器中运⾏不需要任何安装或设置。页⾯可在⼤多数现代Web浏览器中作为离线应⽤程序运⾏。 ⽀持标注的区域组件有矩形圆形椭圆形多边形点和折线 5.7 其他标注工具 liblabel⼀个⽤ MATLAB 写的轻量级语义/⽰例(semantic/instance) 标注⼯具。 ImageTagger⼀个开源的图 像标注平台。 Anno-Mage⼀个利⽤深度学习模型半⾃动图像标注⼯具预训练模型是基于MS COCO数据 集⽤ RetinaNet 训练的。 当然还有⼀些数据标注公司可能包含更多标注功能例如对三维⽬标检测的标注3D Bounding box Labelling激光雷达点云的标注LIDAR 3D Point Cloud Labeling等。 6.目标检测常用术语表 英文全写英文简写中文名称one stage—一阶段检测two stage—两阶段检测region proposalRP候选区域一个有可能包含待检物体的预选框bounding boxesbb候选框Non-Maximum SuppressionNMS非极大值抑制selective searchSS选择搜索Regions with CNN featuresR-CNN—You Only Look OnceYOLO—region of interestRoI感兴趣区域候选区域frame per secondfps帧/每秒High Resolution Classifier—高分辨率分类器Batch NormalizationBN批量正则化Mean Average PrecisionmAP平均精度均值Intersection over UnionIoU交并比“预测的边框” 和 “真实的边框” 的交集和并集的比值Fine-Grained Features—细粒度特征Feature Pyramid NetworkFPN特征金字塔网络
http://www.zqtcl.cn/news/241339/

相关文章:

  • 网站建设评比文章上海手机网站建设价格
  • 微信手机网站三合一建筑工程网络计划方法
  • 网站上文章分享的代码怎么做的建在线教育网站需要多少钱
  • 如何自己弄网站怎么用手机做网站服务器
  • 如果我的网站被百度收录了_以后如何做更新争取更多收录有做不锈钢工程的网站
  • 适合做公司网站的cms东莞阳光网站投诉平台
  • 建设一个网站的意义印刷东莞网站建设技术支持
  • 80端口被封怎么做网站个人网站做支付接口
  • 如何区分网站开发语言建设网站地图素材
  • 建网站的流程怎么投稿各大媒体网站
  • 品牌推广的步骤和技巧专业seo培训学校
  • 新网站上线怎么做seo网站建设语言什么语言
  • 山东省住房城乡和建设厅网站黄页网站推广下载免费
  • 网站建设与运营的论文的范本百度秒收录蜘蛛池
  • asp.net做音乐网站wordpress伪静态规则iis
  • seo 网站优化2021给个最新网站
  • 做废铝的关注哪个网站好seo推广优化的方法
  • 广州活动网站设计电影网站建设策划书
  • 4a景区网站建设标准网站建设排名优化公司
  • 闲置服务器做网站简单做图网站
  • 网站建设制作软件叫啥网盟推广是什么
  • 常州市住房建设局网站大连设计网站的公司
  • 通用wap网站生成系统wordpress 安装旧版本
  • 做网站用的产品展示横幅手机app开发技术
  • 学校网站模板 中文版沈阳seo博客
  • seo策划方案整站优化服务
  • 灵芝产品网站建设方案wordpress登录开发
  • 企业网站软件开发部署php网站
  • 云服务器怎么搭建网站网站制作软件是什么
  • 网站建设的结尾官网网站设计