当前位置: 首页 > news >正文

网站前期设计网站开发需求文件

网站前期设计,网站开发需求文件,网页设计素材电影,软件工程好找工作吗Stacked Hourglass Networks for Human Pose Estimation 用于人体姿态估计的堆叠沙漏网络 这是一篇关于人体姿态估计的研究论文#xff0c;标题为“Stacked Hourglass Networks for Human Pose Estimation”#xff0c;作者是 Alejandro Newell, Kaiyu Yang, 和 Jia Deng标题为“Stacked Hourglass Networks for Human Pose Estimation”作者是 Alejandro Newell, Kaiyu Yang, 和 Jia Deng来自密歇根大学。论文介绍了一种新颖的卷积神经网络架构用于人体姿态估计任务。 论文地址https://arxiv.org/pdf/1603.06937.pdf 源码链接http://www-personal.umich.edu/~alnewell/pose 本文主要是介绍了一个在当时是新的姿态估计的网络结构。由于本人在研究自动驾驶领域中车道线识别[注] 时使用到此网络结构故这里主要是对整个网络的结构和思想进行一个梳理可以进一步明白后序一些基于此网络结构的工作不涉及到 姿态估计领域 的一些见解和讨论所以本文主要引出和介绍 hourglass 网络。 注 《Key Points Estimation and Point Instance Segmentation Approach for Lane Detection》 论文https://arxiv.org/abs/2002.06604 代码https://github.com/koyeongmin/PINet 这项工作介绍了一种用于人类姿态估计任务的新颖卷积网络架构。特征在所有尺度上进行处理和整合以最好地捕捉与身体相关的各种空间关系。此论文展示了自下而上、自上而下的重复处理与中间监督相结合对于提高网络性能至关重要。作者将该架构称为“堆叠沙漏”网络hourglass该网络基于池化和上采样的连续步骤以产生最终的一组预测。在FLIC和MPII基准测试中取得了最先进的结果超过了所有关于人体姿态估计领域的方法。 堆叠的沙漏模块组成 作为视觉领域一个公认的问题多年来姿态估计一直困扰着研究人员面临着各种艰巨的挑战。一个好的姿态估计系统必须对遮挡和严重变形具有鲁棒性在罕见和新颖的姿势上取得成功并且对由于服装和照明等因素导致的外观变化不变。早期的工作使用强大的图像特征和复杂的结构化预测来解决这些困难前者用于产生局部解释而后者用于推断全局一致的姿势。 在卷积神经网络ConvNets概念的提出以及使用下其极大地重塑了这种传统的赛道这是许多计算机视觉任务性能爆炸性增长的主要驱动力。最近的姿态估计系统普遍采用 ConvNets 作为其主要构建块在很大程度上取代了手工制作的特征和图形模型;这种策略在标准基准上产生了巨大的改进。 此论文作者继续沿着这条轨迹前进引入了一种新颖的“堆叠沙漏”网络设计来预测人体姿势。该网络捕获并整合图像所有比例的信息。作者将该设计称为沙漏基于对池化步骤的可视化以及用于获得网络最终输出的后续上采样。与许多产生像素级输出的卷积方法一样沙漏网络池化到非常低的分辨率然后上采样并组合多个分辨率的特征。另一方面沙漏与以前的设计不同主要在于其更对称的拓扑结构。 作者通过将多个沙漏模块端到端连续放置在一起来扩展单个沙漏。这允许跨尺度重复自下而上、自上而下的推理。结合使用中间监督重复的双向推理对于网络的最终性能至关重要。最终的网络架构在两个标准姿态估计基准FLIC 和 MPII 人体姿态 的最新技术基础上实现了重大改进。在MPII上所有关节的平均精度提高了2%以上膝盖和脚踝等更困难的关节提高了4-5%。 示例输出和示例热图 堆叠前沙漏模块与全卷积网络和其他设计紧密相连这些设计在多个尺度上处理空间信息以进行密集预测。沙漏模块与其他设计的不同之处主要在于自下而上的处理从高分辨率到低分辨率和自上而下的处理从低分辨率到高分辨率之间的容量分布更对称。例如完全卷积网络 和整体嵌套架构在自下而上的处理中都很重但在自上而下的处理中很轻它只包括跨多个尺度的预测的加权合并。作者不使用解池层或解卷层。取而代之的是依靠简单的最近邻上采样和跳过连接进行自上而下的处理另一个主要区别是通过堆叠多个沙漏来执行重复的自下而上、自上而下的推理。 单个“沙漏”模块的图示 “hourglass” 结构很像 FCN结构最大的不同点就是更加对称的容量分布包括特征从高分辨率到低分辨率从低分辨率到高分辨率FCN 或者 holistically-nested 结构都是高分辨率到低分辨率(down-top)容量比较大、结构较复杂低分辨率到高分辨率top-down结构较为简单。 这里的结构也与一些做分割样本生成去噪自编码器监督/半监督特征学习等的结构很像但是操作的本质不同 hourglass 没有使用 unpooling 操作或者是解卷积层而是使用了最简单的最近邻上采样和跨层连接来做 top-down上采样。还有一个不一样的点是本文工作堆叠了多个 “hourglass” 的结构来构建整个网络。 hourglass网络架构 Hourglass Design沙漏结构设计 作者选择使用带有跳过图层的单个管道来保留每个分辨率的空间信息。该网络达到 4x4 像素的最低分辨率允许应用较小的空间过滤器来比较图像整个空间的特征。 沙漏的设置如下卷积和最大池化层用于处理分辨率非常低的特征。在每个最大池化步骤中网络都会分支并以原始预池化分辨率应用更多卷积。在达到最低分辨率后网络开始自上而下的上采样序列和跨尺度的特征组合。为了将两个相邻分辨率的信息汇集在一起对较低分辨率进行最近邻上采样然后逐元素添加两组特征。沙漏的拓扑结构是对称的因此对于下降过程中存在的每一层都有一个相应的上升层。 top-down 采用卷积层 maxpooling down-top 采用最近邻上采样 跨层连接 在达到网络的输出分辨率后应用连续两轮 1x1 卷积以产生最终的网络预测。网络的输出是一组热图其中对于给定的热图网络预测每个像素处关节存在的概率。 Layer Implementation层的实现 作者设计大量使用了残余模块。从不使用大于 3x3 的筛选器并且瓶颈限制了每层的参数总数从而减少了总内存使用量。网络中使用的模块如图所示。 Stacked Hourglass with Intermediate Supervision 这种通过端到端堆叠多个沙漏来进一步发展的网络架构将一个沙漏的输出作为输入馈送到下一个沙漏中。为网络提供了一种重复自下而上、自上而下的推理机制允许重新评估整个图像的初始估计和特征。这种方法的关键是预测可以应用损失的中间热图。预测是在通过每个沙漏后生成的其中网络有机会处理本地和全局上下文中的特征。随后的沙漏模块允许再次处理这些高级特征以进一步评估和重新评估更高阶的空间关系。这与其他姿态估计方法类似这些方法在多个迭代阶段和中间监督下表现出强大的性能。 通过将中间预测映射到具有额外 1x1 卷积的更多通道将它们重新集成回特征空间。这些特征与前一个沙漏阶段输出的特征一起被加回沙漏的中间特征中。生成的输出直接用作生成另一组预测的下一个沙漏模块的输入。在最终的网络设计中使用了八个沙漏。需要注意的是权重不会在沙漏模块之间共享并且使用相同的基本事实对所有沙漏的预测应用损失。 训练结果 此网络在两个基准数据集上进行评估即 FLIC 和 MPII Human Pose 。FLIC 由从电影中拍摄的 5003 张图像3987 张训练1016 张测试组成。这些图像在上半身进行了注释大多数人物都直视相机。MPII Human Pose 由大约 25k 张图像组成带有多人的注释提供 40k 注释样本28k 训练11k 测试。没有提供测试注释因此在所有的实验中训练图像的子集上进行训练同时在大约 3000 个样本的保留验证集上进行评估。MPII由从各种人类活动中拍摄的图像组成并具有一系列具有挑战性的广泛表达的全身姿势。 示例输出 FLIC结果、MPII上的PCKh比较 、MPII人体姿势的结果 在 MPII 人体姿势数据集上的所有关节上都取得了最先进的结果。所有数字都可以在表中看到PCK 曲线也可以在图中看到。在手腕、肘部、膝盖和脚踝等困难的关节上比最新的最新结果平均提高了 3.5% 平均错误率从 16.3% 下降到 12.8%。最终肘部准确率为91.2%手腕准确率为87.1%。网络对MPII所做的预测示例如图所示。 堆叠沙漏网络的视觉应用 堆叠沙漏网络架构最初是为了人体姿态估计任务而设计的但由于其能够有效地捕捉不同尺度的空间信息并在多个分辨率上进行特征整合这种架构在其他计算机视觉任务中也显示出了潜力和应用价值。 例如在目标检测和识别领域由于堆叠沙漏网络能够生成高分辨率的输出它可以用来检测和识别图像中的物体。特别是在需要精确定位物体边界的情况下这种网络架构可以提供有用的特征。 其次在语义分割任务中需要对图像中的每个像素进行分类。堆叠沙漏网络通过自底向上和自顶向下的路径能够有效地整合局部和全局信息这对于提高分割的准确性是非常有帮助的。 堆叠沙漏网络的改进与优化 网络剪枝         通过移除网络中不重要的权重和神经元来减少网络的复杂性。网络剪枝可以显著减少计算量同时尽量保持网络性能。量化         将浮点数权重和激活值转换为低精度表示如int8或int16以减少模型大小和加快计算速度。量化后的模型可以在不显著降低性能的情况下加速推理过程。多尺度检测         优化网络的多尺度检测策略减少在不同尺度上的重复计算。可以通过共享特征图或使用更有效的金字塔池化层来实现。使用更高效的层         替换网络中的一些层为更高效的实现。例如使用深度可分离卷积depthwise separable convolutions代替标准卷积可以减少计算量。模型并行化         利用多GPU或多核CPU进行模型的并行计算以加速前向传播和反向传播过程。优化的采样策略         在训练过程中使用更有效的采样策略如随机采样或分层采样以减少不必要的计算。轻量化设计         设计轻量级的堆叠沙漏网络版本通过减少层数、通道数和滤波器大小来降低模型复杂度。
http://www.zqtcl.cn/news/742201/

相关文章:

  • 卖建材的网站有哪些跨境电商工具类产品的网站
  • 做毕业网站的周记网站开发项目书
  • 门户网站价格仿站工具下载后咋做网站
  • 国外优秀ui设计网站常州网站建设电话
  • 大连手机网站建设做外贸无网站如何做
  • 做旅游门票网站需要什么材料人工智能培训机构哪个好
  • 免费的网站程序个人网站可以做论坛么
  • ps中网站页面做多大的wordpress cdn 阿里
  • 深圳整站创意设计方法有哪些
  • 浙江做网站多少钱江门市网站开发
  • 保定建站价格dw软件免费安装
  • 在建设部网站上的举报凡科网怎么建网站
  • wordpress做小说网站工作期间员工花钱做的网站
  • 婚介网站方案小说网站架构
  • 英文在线购物网站建设湖北建设厅举报网站
  • 漯河网络推广哪家好宁波网站seo公司
  • 网站设计ppt案例做物流用哪个网站好
  • 做网站官网需多少钱天元建设集团有限公司财务分析
  • 一般网站建设用什么语言网络规划设计师历年考点
  • 做网站卖菜刀需要什么手续江苏网站优化
  • 花生壳内网穿透网站如何做seo优化鞍山58同城网
  • 怎么为一个网站做外链跨境电商app
  • 医疗网站不备案seo技巧课程
  • 网页和网站有什么区别湖南省郴州市邮编
  • 公考在哪个网站上做试题武威做网站的公司
  • 河南如何做网站常州网站建设价位
  • 昆山网站建设培训班成都百度
  • 兰山网站建设郑州最好的网站建设
  • 手机网站后台源码枣庄市建设局网站
  • 网站建设傲鸿wordpress 获取分类下的文章