网站有什么优势,外贸营销方式有哪些,友山建站优化,企业全称网站全世界有3.14 % 的人已经关注了爆炸吧知识来源#xff1a;机器之心参与#xff1a;魔王、杜伟有了这个工具#xff0c;我们终于能够看到马赛克下的那张脸了。给出一张高糊人脸照片#xff0c;你能用它做什么#xff1f;杜克大学近期的一项研究可以将高糊人脸照片转换成清晰… 全世界有3.14 % 的人已经关注了爆炸吧知识来源机器之心参与魔王、杜伟有了这个工具我们终于能够看到马赛克下的那张脸了。给出一张高糊人脸照片你能用它做什么杜克大学近期的一项研究可以将高糊人脸照片转换成清晰的面部图像而且你完全看不出来图像中的人并非真人而是计算机生成的人脸。此外这个名为 PULSE 的方法还可以「有来有往」生成的高分辨率照片可以再次降级回到高糊状态。在具体实现方面该方法使用了 StyleGAN 来生成高分辨率图像。看起来PULSE 方法与其他方法相比展示出了更好的生成效果清晰度更高细节也更加丰富。不过AI 方法「看到」的面部图像和我们猜测的似乎存在差别。该项目提供了 Colab 环境众多网友试用后发现了一些效果不太好的例子。比如超级马里奥在 PULSE 眼里成了这样我有点不敢玩这款游戏了……奥巴马似乎变年轻了好像也变白了但这还是奥巴马吗?表情包界王者也突然变了模样 想必此时表情包主角的内心是有网友质疑该方法生成结果存在偏见尤其是对黑人图像的处理效果并不好。对此项目作者给出了回应PULSE 生成白人面部图像的频率确实要高于有色人种的面部图像。这一偏见很可能来自于 StyleGAN 的训练数据集可能还有其他未知因素。我们意识到偏见是机器学习和计算机视觉领域的重要问题并就此问题联系了 StyleGAN 和 FFHQ 数据集的创建者。我们希望这能够促进不具备此类偏见行为的方法的诞生。此外PULSE 作者强调该方法最后输出的高分辨率图像并非真人。因此该方法无法用于识别或重建原始图像大家无需担心该方法会对现实中的人造成困扰。那么这个新方法到底是怎么做的呢我们来细看下。论文地址https://arxiv.org/abs/2003.03808GitHub 地址https://github.com/adamian98/pulse网站地址http://pulse.cs.duke.edu/Colab 地址https://colab.research.google.com/github/tg-bomze/Face-Depixelizer/blob/master/Face_Depixelizer_Eng.ipynbPULSE 开启图像超分辨率新范式单图像超分辨率任务即基于低分辨率LR输入生成高分辨率HR图像。之前的方法通常是监督式的其训练目标通常是度量超分辨率SR和高分辨率图像之间的像素级平均距离。而对此类度量指标的优化往往导致模糊尤其是高方差区域的模糊。杜克大学将超分辨率问题重构为如何创建可以准确降级回去的逼真 SR 图像。这提供了图像超分辨率的新范式。具体来说研究者提出一种新型超分辨率算法 PULSE (Photo Upsampling via Latent Space Exploration)该算法可以生成高分辨率的逼真图像分辨率之高超过之前的方法。此外PULSE 是以完全自监督的方式进行的且不受限于训练期间使用的特定降级算子degradation operator这与之前的方法有所不同。PULSE 不从 LR 图像开始缓慢地添加细节而是遍历高分辨率自然图像流形搜索可以降级至原始 LR 图像的高分辨率图像。这一过程通过「降尺度损失」downscaling loss完成它指引着在生成模型潜在空间中的探索。此外研究者利用高维高斯的特性限制搜索空间使其保证输出结果是逼真的。因此PULSE 得以生成既逼真又能进行恰当分辨率降级的超分辨率图像。该研究进行了大量实验表明 PULSE 方法在人脸超分辨率领域中的效果。该方法以更高的分辨率和缩放因子scale factor超过了当前最优方法的感知质量。具体而言PULSE 可以在几秒钟内将 16x16 像素图像转换为 1024 x 1024 像素图像添加了一百万像素。此外它还可以将低分辨率图像中无法看清的毛孔、皱纹、头发等转换得清晰。研究者请 40 个人对 PULSE 和其他五种方法生成的 1440 张图像进行评分1-5 分结果表明 PULSE 分数最高接近真人的高质量图像。PULSE 如何实现最优效果研究者首先定义了超分辨率问题的术语。假设低分辨率图像为 I_LR超分辨率方法即学习一个条件生成函数 G把 G 应用于 I_LR 时可以得到超分辨率图像 I_SR。形式上I_LR ∈ R^m×n。期望函数 SR 是 R^m×n → R^M×N 的映射M m, N n。于是超分辨率图像 I_SR ∈ R^M×N 可被定义为传统的超分辨率方法认为低分辨率图像可以表示与理论上高分辨率图像 I_HR ∈ R^M×N 相同的信息。然后此类方法试图基于 I_LR 恢复特定 I_HR从而将超分辨率问题简化为优化任务拟合函数 SR使下式最小化然而在实践中即使得到了正确的训练这些算法仍无法提升高方差区域的细节。让我们通过修复低分辨率图像 I_LR来探究其背后的原因。假设 M 是 R^M×N 中的自然图像流形即 R^M×N 的这一子集类似自然逼真图像假设 P 是基于 M 的概率分布用于描述数据集中某张图像出现的概率假设 R 是分辨率恰当降低后的图像集合即 R {I ∈ R^N×M : DS(I) I_LR}。则随着数据集规模趋向于无穷大算法输出修复图像 I_SR 的期望损失是当 I_SR 是 I_HRM ∩ R的 l_p 平均时损失得到最小化。事实上当 p 2 时损失最小化即因此最优 I_SR 是分辨率恰当降低的高分辨率图像集合的像素级加权平均值。因此这些算法缺乏细节仅仅是因为无法通过改变网络架构来恢复 l_p 范数。杜克大学对该问题进行了重新定义他们提出一种新型单图像超分辨率框架。对于 LR 图像 I_LR ∈ R^m×n 且 ϵ 0杜克大学研究者旨在找到符合下列条件的图像 I_SR ∈ M具体而言令 R_ϵ ⊂ R^N×M 表示分辨率恰当降低的图像集合即然后寻找图像 ISR ∈ M∩R_ϵ。M∩ R_ϵ 是可行解的集合因为如果得到解的分辨率无法恰当降低或者不够逼真则它并非可行解。有趣的是M∩R_ϵ的交集尤其是 M ∩ R_0) 不能为空因为它们必须包含原始高分辨率图像即传统方法旨在重建的图像。PULSE 的实验效果如何研究者通过多项实验对该算法进行评估并将重点放在了人脸幻觉face hallucination这一热点问题上。具体来说研究者利用了 Karras 等人在 Flickr Face HQ (FFHQ) 数据集上预训练的 Face StyleGAN。对于每个实验他们从随机初始化开始进行了 100 次学习率为 0.4 的球面梯度下降迭代。因此该方法使用单个英伟达 V100 GPU 生成每张图像的时间约为 5 秒。不同方法的视觉效果下图 5 展示了不同方法生成图像的视觉质量图 5PULSE 与双三次升尺度bicubic upscaling、FSRNet 和 FSRGAN 方法的效果对比。在第一张图像中PULSE 在头发里添加了一个 messy 图像块以匹配 LR 图像放大后中间可见的两个黑色对角线像素值。定量结果研究者进行了感知超分辨率文献中常用的 MOS 分数评估如下表所示表 1PULSE 与其他几种方法在 128×128 分辨率上的 MOS 分数其中分数越高效果越好。可以看到PULSE 的分数最高。为了提供另一种感知质量度量研究者还对感知超分辨率问题常用的自然图像质量评价Naturalness Image Quality Evaluator, NIQE分数进行了评估。具体来说他们对每种方法在 1024×1024 分辨率上的 NIQE 分数进行了评估其中输入分辨率为 16×16缩放因子为 64。表 2每种方法在 1024×1024 分辨率上的 NIQE 分数分数越低效果越好。可以看到PULSE 的 NIQE 分数最低。鲁棒性最后研究者对 PULSE 算法的鲁棒性进行了评估。该算法的主要目的是利用已知的降尺度算子来执行感知逼真的超分辨率任务。研究者发现即使对于各种未知的降尺度算子该方法都可以使用双三次降尺度bicubic downscaling实现充分的降级具体如下图 6 所示图 6研究者证实了利用不同降级算子时 PULSE 的鲁棒性。版权归原作者所有转载仅供学习使用不用于任何商业用途如有侵权请留言联系删除感谢合作。