当前位置: 首页 > news >正文

做网站推广广告如何找网站制作

做网站推广广告,如何找网站制作,wordpress主题 关键字代码,中国体育新闻文章链接#xff1a;https://arxiv.org/pdf/2403.17694 github链接#xff1a;https://github.com/Zejun-Yang/AniPortrait 本文提出了AniPortrait#xff0c;一个新颖的框架#xff0c;用于生成由音频和参考肖像驱动的高质量动画。方法分为两个阶段。首先#xff0c;从音… 文章链接https://arxiv.org/pdf/2403.17694 github链接https://github.com/Zejun-Yang/AniPortrait 本文提出了AniPortrait一个新颖的框架用于生成由音频和参考肖像驱动的高质量动画。方法分为两个阶段。首先从音频中提取3D中间表示并将它们投影到一系列2D面部关键点上。随后采用了一个强大的扩散模型结合一个运动模块将关键点序列转换为逼真且时间上连贯的肖像动画。 实验结果表明在面部自然性、姿势多样性和视觉质量方面AniPortrait具有优越性从而提供了增强的感知体验。此外我们的方法在灵活性和可控性方面表现出了相当大的潜力可以有效应用于面部运动编辑或面部再现等领域。 介绍 从音频和静态图像中创建逼真而富有表现力的肖像动画具有各种应用从虚拟现实和游戏到数字媒体都有涉及。然而制作视觉上引人入胜且保持时间一致性的高质量动画是一个重大挑战。这种复杂性源于需要精细协调嘴唇运动、面部表情和头部位置以营造出视觉上引人入胜的效果。 现有方法通常未能克服这一挑战主要是因为它们依赖于用于视觉内容创建的容量有限的生成器如GANs、NeRF或基于运动的解码器。这些网络展现出有限的泛化能力并且在生成高质量内容方面经常缺乏稳定性。最近扩散模型的出现促进了高质量图像的生成。一些研究在此基础上进行了进一步探索通过引入时间模块使扩散模型在创建引人入胜的视频方面表现出色。 在扩散模型的进展基础上介绍AniPortrait这是一个新颖的框架旨在生成由音频和参考图像驱动的高质量动画肖像。AniPortrait分为两个明确的阶段。 第一个阶段采用基于transformer的模型从音频输入中提取一系列3D面部网格和头部姿势随后将它们投影到一系列2D面部关键点上。这一阶段能够从音频中捕捉微妙的表情和嘴唇运动以及与音频节奏同步的头部运动。 第二个阶段利用了一个强大的扩散模型结合了一个运动模块将面部关键点序列转换为时间一致且逼真的动态肖像。具体地借鉴了AnimateAnyone的网络架构该架构利用了强大的扩散模型 Stable Diffusion 1.5根据身体运动序列和参考图像生成流畅而逼真的视频。特别值得注意的是我们对该网络内姿势引导模块的重新设计。这种修改不仅保持了轻量级设计而且在生成嘴唇运动方面表现出了更高的精度。 实验结果显示了AniPortrait在创建具有出色面部自然性、多样化姿势和优秀视觉质量的动画方面的优越性。通过使用3D面部表示作为中间特征我们获得了根据需要修改这些表示的灵活性。这种适应性极大地增强了本文的框架在面部运动编辑和面部再现等领域的适用性。 方法 所提出的框架包括两个模块Audio2Lmk 和 Lmk2Video。前者旨在从音频输入中提取一系列能够捕捉复杂面部表情和嘴唇运动的关键点序列。后者利用这些关键点序列生成具有时间稳定性的高质量肖像视频。下图1中概述了该框架并在下文提供了更多细节。 Audio2Lmk 设 表示一系列语音片段目标是预测相应的 3D 面部网格序列 其中每个 并且姿势序列 其中每个 是一个表示旋转和平移的 6 维向量。 采用预训练的 wav2vec 来提取音频特征。该模型具有很高的泛化能力并且能够准确识别音频中的发音和语调这在生成逼真的面部动画中起着关键作用。通过利用获得的稳健语音特征可以有效地使用由两个全连接层组成的简单架构将这些特征转换为 3D 面部网格。观察到这种简单的设计不仅确保了准确性还提高了推理过程的效率。 在将音频转换为姿势的任务中我用相同的 wav2vec 网络作为骨干。然而不与音频到网格模块共享权重。这是因为姿势与音频中存在的节奏和语调更为密切相关这与音频到网格任务有不同的重点。为了考虑前面状态的影响使用 transformer 解码器来解码姿势序列。在此过程中使用交叉注意力机制将音频特征集成到解码器中。对于上述两个模块使用简单的 L1 损失进行训练。 在获得网格和姿势序列后使用透视投影将它们转换为一系列 2D 面部关键点。这些关键点随后被用作下一阶段的输入信号。 Lmk2Video 给定一个参考肖像图像表示为 并且一个表示为 的面部关键点序列其中每个 本文提出的 Lmk2Video 模块创建一个时间上连贯的肖像动画。这个动画将运动与关键点序列对齐并保持与参考图像一致的外观。将肖像动画表示为一个肖像帧序列表示为 。 Lmk2Video 的网络结构设计受到 AnimateAnyone 的启发。本文利用 SD-1.5 作为骨干集成了一个时间运动模块将多帧噪声输入有效地转换为一系列视频帧。同时使用一个 ReferenceNet镜像了 SD-1.5 的结构用于从参考图像中提取外观信息并将其整合到骨干中。这种战略性的设计确保了输出视频中的人脸ID保持一致。与 AnimateAnyone 不同的是我们增强了 PoseGuider 的设计复杂性。原始版本仅包括几个卷积层之后关键点特征与骨干输入层的潜变量合并。这种基本设计无法捕捉到嘴唇的复杂运动。因此本文采用了 ControlNet 的多尺度策略将相应尺度的关键点特征合并到骨干的不同模块中。尽管进行了这些增强也成功地保持了参数数量相对较低。 本文还引入了一个额外的改进将参考图像的关键点作为额外输入。PoseGuider 的交叉注意力模块促进了参考关键点和每帧目标关键点之间的交互。这个过程为网络提供了额外的线索以理解面部关键点和外观之间的相关性从而有助于生成具有更精确运动的肖像动画。 实验 实施细节 在 Audio2Lmk 阶段采用 wav2vec2.0 作为我们的骨干网络。利用 MediaPipe 提取 3D 网格和 6D 姿势进行标注。Audio2Mesh 的训练数据来自内部数据集该数据集包含来自单个发言者的近一小时高质量语音数据。为了确保 MediaPipe 提取的 3D 网格稳定我们指示演员在整个录制过程中保持稳定的头部位置面向摄像机。使用 HDTF 训练 Audio2Pose。所有训练操作都在一台 A100 上执行利用 Adam 优化器学习率为 。 在 Lmk2Video 过程中实施了两步训练方法。在初始步骤中专注于训练骨干网络、ReferenceNet 和 PoseGuider 的 2D 组件略过运动模块。在随后的步骤中冻结所有其他组件并集中精力训练运动模块。利用两个大规模、高质量的面部视频数据集 VFHQ 和 CelebV-HQ 训练模型。所有数据经过 MediaPipe 处理以提取 2D 面部关键点。为了增强网络对嘴唇运动的敏感性在从 2D 关键点渲染姿势图像时使用不同的颜色区分上下嘴唇。所有图像都被调整为 512x512 分辨率。利用 4 个 A100 GPU 进行模型训练每个步骤耗时两天。采用 AdamW 优化器保持学习率为 。 结果 如下图2所示我们的方法生成了一系列在质量和真实感上引人注目的动画。利用中间的3D表示可以对其进行编辑以操控最终输出。例如可以从源中提取关键点并改变其ID从而使我们能够创建面部重现效果。 结论和未来工作 本研究提出了基于扩散模型的肖像动画框架。通过简单地输入音频片段和参考图像该框架能够生成具有流畅嘴唇运动和自然头部运动的肖像视频。利用扩散模型强大的泛化能力该框架创建的动画展现出令人印象深刻的逼真图像质量和令人信服的运动。然而这种方法需要使用中间的3D表示获取大规模、高质量的3D数据的成本相当高。因此生成的肖像视频中的面部表情和头部姿势无法摆脱“诡异谷”效应。在未来我们计划采用EMO的方法直接从音频预测肖像视频以实现更令人惊叹的生成结果。 参考文献 [1] AniPortrait: Audio-Driven Synthesis of Photorealistic Portrait Animation 更多精彩内容请关注公众号AI生成未来 欢迎加群交流AIGC技术添加小助手
http://www.zqtcl.cn/news/788391/

相关文章:

  • 网站治做啊app易居销售系统
  • 定制跟模板网站有什么不一样如何做网站的订阅
  • 黑龙seo网站优化做网站,图片显示不出来
  • aspcms网站无法打开东莞网站推广方案
  • aspcms企业网站模板互联网推广模式有哪些
  • 高端 网站设计公司怎样开通微信公众号平台
  • 陕西省建设监理协会网站证书城乡建设管理局网站
  • 网站建设价目表建设商城网站报价
  • 天河企业网站建设杭州网站开发与设计
  • 涂料厂做网站有用吗廊坊关键词快速排名
  • 免费编程网站个人博客网站如何做SEO
  • 动漫做美食的视频网站佛山网站建设公司88
  • 衡水移动网站建设网站定制论坛
  • 装修网站模板源码网站上传不了
  • 南昌企业网站开发宁波seo怎么做推广渠道
  • 查找公司信息的网站小蝌蚪视频网络科技有限公司
  • 爆破wordpress密码河北seo基础入门教程
  • 推广网站报价公司logo设计效果图
  • 西部数据网站管理助手做如美团式网站要多少钱
  • 云主机网站如何备份合肥网页设计就业
  • 视频网站视频预览怎么做西部数码助手网站后台管理
  • 有哪些网站建设工作室杭州房价
  • 广告去哪个网站做上海最大的外贸公司
  • 二手车网站开发过程专业的大连网站建设
  • 北京加盟网站建设宝石汇网站
  • 网站本地建设seo排名赚app多久了
  • 邢台手机网站建设信息超链接html代码
  • wordpress 代码模块昆明seo和网络推广
  • 匈牙利网站后缀沛县做网站xlec
  • 企业网站建设的成本国内做网站建设最好的公司是