法治建设优秀网站,花卉网站建设策划,泰安建设局网站,推广赚钱软件我们前期介绍过Stable Diffusion#xff0c;stable diffusion模型是Stability AI开源的一个text-to-image的扩散模型#xff0c;其模型在速度与质量上面有了质的突破#xff0c;玩家们可以在自己消费级GPU上面来运行此模型。 文生图大模型已经火了很长一段时间了#xff0c…我们前期介绍过Stable Diffusionstable diffusion模型是Stability AI开源的一个text-to-image的扩散模型其模型在速度与质量上面有了质的突破玩家们可以在自己消费级GPU上面来运行此模型。 文生图大模型已经火了很长一段时间了但是随着需求的不断增加对文生视频的需求也越来越高上期介绍的字节发布的MagicVideo2可以进行文本到视频的生成只是由于没有开源代码或者线上链接进行试玩。而Stable Video Diffusion是Stability AI开源的视频生成模型可以进行试玩。
Stable Video Diffusion顾名思义便是视频生成模型这里的Stable Video Diffusion是图片转视频模型是Stability AI社区开源的一个文本或图片转视频模型。 Stable Video Diffusion模型支持输入一张图片然后生成3-30帧/s 的视频生成的视频长度在2-5s之间。其模型生成的视频质量还是相当的高的。模型有2种尺寸
SVD该模型经过训练可以在给定的图片上生成14帧/s的分辨率为576*1024的视频
SVD-XL该模型跟SVD采用了同样的模型结构只是在模型训练后可以生成25/s 的视频 该模型采用了文本到图片预训练视频预训练以及高质量视频微调三个步骤打造了Stable Video Diffusion模型其代码已经在GitHub上开源可以在本地或者云端部署。
动画详解transformer
https://stability.ai/stable-video
https://github.com/Stability-AI/generative-models/tree/main
更多transformerVITswin tranformer
参考头条号人工智能研究所
v号启示AI科技
微信中复制如下链接打开免费体验chatgpthttps://wx2.expostar.cn/qz/pages/manor/index?id1137share_from_id79482sid24