当前位置: 首页 > news >正文

中信建设官方网站软件下载深圳网站设计制作

中信建设官方网站软件下载,深圳网站设计制作,比价网站模板,充值代理平台代码#xff1a;https://github.com/nie-lang/DeepRectangling 链接#xff1a;https://arxiv.org/abs/2203.03831 概览 目前图像拼接的一个问题是拼接后会产生不规则的边界#xff0c;如下图1 b所示。目前解决这类问题主要是通过图像矩形化方法#xff0c;并且通常是分…代码https://github.com/nie-lang/DeepRectangling 链接https://arxiv.org/abs/2203.03831 概览 目前图像拼接的一个问题是拼接后会产生不规则的边界如下图1 b所示。目前解决这类问题主要是通过图像矩形化方法并且通常是分为两个阶段第一阶段搜索初始网格第二阶段优化网格来完成网格变形然后 warp 输入的拼接图像来生成矩形图像不过这类方案只适合处理具有丰富线性结构的图像对于带有非线性结构的人物和风景会有明显失真的情况。 本文通过提出第一个图像矩形的深度学习解决方案来解决这些问题。具体来说我们预先定义了一个刚性目标网格并且只估计一个初始网格以形成网格变形从而有助于一个紧凑的单阶段解决方案。使用具有残差渐进回归策略的全卷积网络预测初始网格。为了获得具有高内容保真度的结果提出了一个综合目标函数以同时鼓励边界矩形、网格形状保持和内容感知自然。此外我们构建了第一个图像拼接矩形数据集在不规则边界和场景中具有很大的多样性。实验证明了我们在数量和质量上都优于传统方法。 主旨 作者想解决什么问题 由于图像拼接的时候目前大多数方法主要重点优化全局或者局部 warp 来对其不同图像的重叠区域而非重叠区域会受到不规则边界的影响。 作者通过什么理论/模型来解决这个问题 图像矩形化 作者给出的答案是什么 提出一种一阶段的图像矩形化方法具体来说就是设计了一个简单但有效的全卷积网络以使用残差渐进回归策略从拼接图像中估计内容感知初始网格然后使用预定义的刚性目标网格进行高效并行计算。此外提出了一个由边界项、网格项和内容项组成的综合目标函数以同时鼓励边界矩形、网格形状保持和内容感知自然。 作者为什么研究这个课题 不规则的边界会影响观感 目前采用的图像矩形化仅适合具有丰富线性结构的图像对带非线性结构的人物和风景会有明显失真情况 目前这个课题的研究进行到哪一个阶段 对于不规则边界的处理目前有这几种方法 通过裁剪方法来处理但是裁剪会降低拼接图像的 FOV这和图像拼接的目的矛盾 采用图像补全来将缺失区域合成为矩形图像但目前还没有相关工作为不规则边界设计掩码并且 SOTA 的图像补全工作对图像拼接的处理效果也不让人满意并且可能添加一些看起来和谐但是和现实不同的内容这在自动驾驶等高安全性应用中是不可靠的 而图像矩形化方法主要是通过网格变形来将拼接图像 warp 为矩形但它们只能保留具有线性结构比如建筑物、盒子、柱子等对非线性结构比如肖像、风景都会产生失真另外就是它们采用两阶段并不好实现并行加速 研究方法 提出了第一阶段学习基线即我们预定义了一个刚性目标网格并仅预测一个初始网格。具体来说我们设计了一个简单但有效的全卷积网络以使用残差渐进回归策略从拼接图像中估计内容感知初始网格。此外提出了一个由边界项、网格项和内容项组成的综合目标函数以同时鼓励边界矩形、网格形状保持和内容感知自然。与现有方法相比由于我们的内容约束中的有效语义感知我们的内容保存能力更通用不限于线性结构和更健壮。 Traditional Baseline 对于一个经典的传统方法一般是分为两阶段的局部阶段和全局阶段如下图2 a 所示). Stage 1:局部阶段。首先在拼接图像中插入丰富的接缝使用接缝雕刻算法 [1] 得到初步的矩形图像。然后在初始矩形图像上放置一个规则网格并移除所有接缝以获得具有不规则边界的拼接图像的初始网格。 Stage 2全局阶段。此阶段通过优化能量函数来解决最佳目标网格以保留有限的感知属性例如直线。 他们通过将拼接图像从初始网格扭曲到目标网格来生成矩形图像。 Learning Baseline 正如上图 b 所示本文提出的学习基线是一种一阶段方法。 给定拼接图像我们的解决方案只需要通过神经网络预测内容感知的初始网格。至于目标网格我们将其预定义为刚性形状。此外刚性网格形状可以很容易地使用矩阵计算来加速后向插值。通过将拼接图像从预测的初始网格扭曲到预定义的目标网格可以获得矩形图像。 与传统的基线相比学习基线由于是一阶段的管道效率更高。内容保留能力使我们的矩形结果在感知上更加自然。 网络结构 与图像补全任务类似缝合掩码也包含在建议网络的输入中。如下图所示我们将通道维度上的拼接图像 I 和掩码 M 连接起来作为输入。输出是预测的网格运动。 特征提取器。我们堆叠简单的卷积池块以从输入中提取高级语义特征。形式上采用 8 个卷积层其滤波器数量分别设置为 64、64、64、64、128、128、128 和 128。在第 2、第 4 和第 6 卷积层之后使用最大池化层。 网格运动回归器。在特征提取之后使用自适应池化层来固定特征图的分辨率。随后我们设计了一个全卷积结构作为网格运动回归器以基于常规网格预测每个顶点的水平和垂直运动。假设网格分辨率为 U × V 输出体积的大小为 (U 1) × (V 1) × 2。 残差渐进回归。观察到扭曲的结果可以再次被视为网络输入我们设计了一种残差渐进回归策略通过渐进的方式估计准确的网格运动。首先我们不直接使用扭曲图像作为新网络的输入因为这会使计算复杂度加倍。相反我们扭曲了中间特征图在计算量略有增加的情况下提高了性能。然后我们设计了两个具有相同结构的回归器来分别预测初级网格运动和残差网格运动。尽管它们共享相同的结构但由于不同的输入特征它们被指定用于不同的任务。 目标函数 我们采用包含三个损失函数的综合目标函数来优化网络参数。优化目标如下所示 其中 分别表示边界项、网格项和内容项。 内容项 传统方法 [7, 14] 通过保留直线/测地线的角度来保留图像内容无法处理其他非线性结构。为了克服它我们建议从两个不同的角度学习内容保存能力。 外观损失 。给定预测的主网格 和最终网格 我们强制矩形结果在外观上接近矩形标签 R如下所示 其中 W 表示 warp 操作。 感知损失。为了让结果感知上更加自然我们在高级语义感知中最小化矩形结果和标签之间的 L2 距离如等式3 其中 φ(·) 表示从 VGG19 [25] 的“conv4 2”层提取特征的操作。以这种方式可以感知各种感知特性不限于线性结构。 总之内容损失是通过同时强调外观和语义感知的相似性形成的如下所示 其中 分别表示两个损失的权重。 网格项 为了防止矩形图像中的内容失真预测的网格不应过度变形。因此我们设计了一个网格内约束和一个网格间约束来保持变形网格的形状。 网格内约束。在网格中我们对网格边缘的大小和方向施加约束。如下图a所示我们鼓励每个水平边缘 的水平投影方向向右连同其范数大于阈值 α假设拼接图像的分辨率为H×W。我们使用惩罚 来描述这个约束如下 其中 i 是指向右侧的水平单位向量。对于每个网格中的垂直边 我们施加类似的惩罚 如下所示 其中 j 是指向底部的垂直单位向量。网格内约束损失如下式所示它可以有效防止网格内形状变形。 网格间约束。我们还采用网格间约束来鼓励相邻网格一致地变换。如上图b所示两个连续的变形网格边缘 { }被鼓励共线. 我们如上所述制定网格间网格损失其中 N 是网格中两个连续边的元组数。 总之总的网格项总结如下 边界项 至于边界项我们约束掩码而不是预测网格。给定拼接图像的 0-1 蒙版如图 3 所示我们扭曲蒙版并将扭曲蒙版约束为接近全一矩阵 E如下所示 数据准备 为了训练深度图像矩形网络我们构建了一个图像矩形数据集DIR-D其中每个样本都是由拼接图像I、掩码M和矩形标签R组成的三元组。我们通过以下步骤准备此数据集 第1 步采用 ELA [16] 拼接来自 UDISD 数据集 [24] 的图像以收集大量真实拼接图像。然后我们忽略那些外推面积小于整个图像 10% 的图像。 第 2 步使用 He 等人 [7]的算法从这些真实拼接图像中生成丰富的不同网格变形 ()如图 5右所示。 第 3 步应用网格变形的逆向()将真实矩形图像来自 MS-COCO [20] 和收集的视频帧扭曲到合成拼接图像如下图 5左所示。可以通过扭曲全为一的矩阵来获得掩码。然后我们得到真实矩形图像 ®、合成拼接图像 (I) 和扭曲矩阵 (M) 的三元组。 第 4 步手动消除三元组中 I 有失真的数据。每次手动操作需要 5-20 秒。形式上我们将这个过程重复三个时期并从 60,000 多个样本中保留 5,705 个三元组。 第 5 步将真实拼接图像混合到我们的训练集以增加泛化能力。具体来说我们在步骤 2 中从 5000 多个样本中过滤掉了 653 个 R 没有失真的样本。 总之我们准备了具有广泛不规则边界和场景的 DIR-D 数据集其中包括 5,839 个用于训练的样本和 519 个用于测试的样本。数据集中的每张图像的分辨率为 512 × 384。 实验结果 实验配置 网络的优化方法采用 Adam 优化器学习率初始值为 并采用指数衰减的学习率下降策略总共迭代次数是 100k。Batch 大小为 4激活函数采用 RELU但回归器的最后一层不采用激活函数。分别设置为 1以及 0.125。UXV 设置为 8x6并且采用 Tensorflow 实现。采用一个NVIDIA RTX 2080 Ti 的 GPU来完成训练和推理过程。 处理一张 10 兆像素的图像只需不到 0.4 秒。与 [7] 的实验配置类似输入图像将首先被下采样到 1 兆像素并以下采样分辨率解决网格变形。然后网格变形将被上采样并且可以通过使用该上采样变形扭曲全分辨率输入图像来获得矩形结果。运行时间主要是扭曲插值全分辨率图像。 比较结果 定量比较 我们将我们的解决方案与 He 等人 [7] 在 DIR-D 上的方法进行了比较其中每种方法测试了 519 个样本。我们用标签计算平均 FID [9]、SSIM 和 PSNR 来评估这些解决方案。定量结果如表 1 所示其中‘Reference’以拼接图像作为矩形结果供参考。 从这个表中可以看出在 DIR-D 的每个指标中所提出的学习解决方案都明显优于传统解决方案。这种显着的改进归功于我们可以保留线性和非线性结构的内容保留属性。此外当矩形结果中物体的位置稍有变化时它看起来也很自然但度量可能会有所不同这使得定量实验不能完全令人信服。因此我们进一步进行了盲图像质量评估的比较。如表 2 所示我们采用 BIQUE [29] 和 NIQE [22] 作为“无参考”评估指标我们的解决方案可以产生更高质量的结果。这些评估方法是无意识的方法试图在不需要任何训练数据的情况下量化失真。我们添加了“标签”的评估以供参考这表明了性能的上限。 定性比较 为了全面比较定性结果我们将测试集分为两部分。第一部分包含丰富的线性结构适合传统的基线而第二部分包含大量的非线性结构例如肖像。 从图 7 的结果中我们可以观察到我们的方法在两个场景中明显优于传统解决方案。我们的优势在于能够保持网格形状保持和内容感知自然的内容保留能力。由于线检测能力有限传统解决方案在具有线性结构的场景中表现不佳。失败发生在具有非线性对象的肖像中因为非线性属性不包括在其优化的能量中。 用户研究 图像矩形的动机是用户对拼接图像中不规则的边界不满意。因此我们的目标是制作让大多数用户满意的矩形图像。 我们对视觉偏好进行用户研究。形式上我们将 He 等人的算法与我们的初级矩形和最终矩形如图 3 所示一一进行比较。每次三个图像都显示在一个屏幕上输入、He 等人的矩形和我们的主要或最终。我们每次都打乱不同方法的顺序。用户可以放大图像并且需要选择哪个结果是优选的。在这项研究中我们邀请了 10 名参与者其中包括 5 名具有计算机视觉背景的研究人员/学生和 5 名社区以外的志愿者。结果如图6所示我们的解决方案受到更多用户的青睐。 跨数据集比较 在跨数据集评估中我们采用 DIR-D 数据集训练模型然后用其他数据集进行测试。 形式上我们采用不同的图像拼接方法SPW [18]、LCP [10] 和 UDIS [24]来拼接经典图像拼接数据集 [4,5,10,30]。然后使用不同的算法将拼接的图像用于矩形。结果如图 8a 所示我们的解决方案在矩形结果中产生的失真更少。 为了展示我们在更一般的场景中的有效性其中没有消除伪影和投影失真我们展示了图像拼接失败案例的矩形结果。如图 8b 所示我们的方法仍然有效。 消融实验 本文提出的方法简单但有效。我们在 DIR-D 上验证每个模块的有效性。 损失函数。我们将残差回归器作为基线结构并评估目标函数中不同约束项的有效性。如表 3 的实验 1-3 所示内容项和网格项都可以显着提高我们的性能。 网格分辨率。我们测试了 4×3、8×6 和 16×12 的不同网格分辨率。如表 3 的实验 3-5 所示4×3 网格降低了矩形性能而 8×6 网格和 16×12 网格给出了相似的结果。然而16 × 12 网格带来了更多的计算成本因此我们在实现中采用了 8 × 6 网格。 残差渐进回归。我们在表 3 的实验 6-7 中验证了我们的残差渐进回归策略的有效性其中残差回归器继续基于主回归器细化矩形结果。尽管对 DIR-D 数据集的改进很小但这种策略增强了我们的泛化能力以避免其他数据集的边界不均匀如图 9 所示。 推荐阅读的学习笔记 11.神经网络不收敛怎么办看看是不是这些原因 12. 7 个有用的 PyTorch 技巧 目标检测入门学习笔记 公众号后台回复这些关键词可以获得相应的资料 回复”入门书籍“获取机器学习入门资源包括书籍、视频以及 python 入门书籍 回复”数据结构“获取数据结构算法书籍和 leetcode 题解 回复”多标签“获取使用 keras 实现的多标签图像分类代码和数据集 回复“pytorch 迁移学习”获取 pytorch 的迁移学习教程代码 回复“py_ml获取初学者的机器学习入门教程代码和数据集 如果想评论可以点击阅读原文进行评论互动谢谢
http://www.zqtcl.cn/news/582572/

相关文章:

  • 免费做封面的网站哈尔滨网页制作要多少钱
  • html免费网页素材网站优化教程
  • 百度关键词网站排名优化软件seo服务 收费
  • 中英文切换网站网站建设的关键问题
  • 5款免费网站管理系统wordpress 本地
  • 企业网站制作公司盈利百度云搜索
  • 微云影视自助建站系统大理州建设局网站门户网
  • 构建网站需要会什么意思辽宁省朝阳网站建设
  • 网站建设捌金手指专业1公司域名邮箱注册
  • 建设工程协会网站建设工程合同属于专属管辖吗
  • 网站建设费可分摊几年电子商务网站建设基础
  • wordpress api 发贴北京网站优化seo
  • 青岛网站制作服务商wordpress红包
  • 网站响应式设计如何提高网站文章收录
  • 网站 橙色如何做自己网站的seo
  • 网上商城网站建设公司兰州网站制作公司怎么样
  • 网站的动态图怎么做的获取网站访客qq
  • 黑龙江网站建站建设知名品牌形象设计公司
  • 网站建设去哪可接单怎么做微信小程序平台
  • 做外贸重新设计网站兰州网站建设慕枫
  • 服装销售 网站建设论文搭建企业网站需要什么
  • cnnic网站备案html网站建设代码
  • 金华网站建设明细报价表c苏宁网站开发
  • 在手机上怎么做微电影网站湖南人工智能建站系统软件
  • 网站做的一样算侵权吗站群建站系统
  • 骨干专业建设验收网站xueui wordpress
  • 宁波高质量品牌网站设计厂家世界上有php应用的网站
  • 网站平台建设的重要性响应式网站切图
  • 近期做网站需要什么软件网站制作常见的问题
  • vs做的本地网站甘肃省建设厅门户网站