当前位置: 首页 > news >正文

网站模板下载html做网站的方案图片

网站模板下载html,做网站的方案图片,漯河住房和城乡建设局网站,c 手机版网站开发13. GLIDE: Towards Photorealistic Image Generation and Editing with Text-Guided Diffusion Models 该文提出一种基于文本引导的扩散模型用于图像的生成和编辑#xff0c;可以根据给定的文字描述来生成或编辑图像。在ADM中我们曾介绍了一种基于分类器引导的图像生成模型可以根据给定的文字描述来生成或编辑图像。在ADM中我们曾介绍了一种基于分类器引导的图像生成模型其基本的思想是额外训练一个分类器 p ϕ ( y ∣ x t ) p_{\phi}(y|x_t) pϕ​(y∣xt​)利用其对数的梯度来引导采样过程具体来说是对去噪模型预测的均值 μ θ ( x t ∣ y ) \mu_{\theta}(x_t|y) μθ​(xt​∣y)进行修改如下式 μ ^ θ ( x t ∣ y ) μ θ ( x t ∣ y ) s ⋅ Σ θ ( x t ∣ y ) ∇ x t log ⁡ p ϕ ( y ∣ x t ) \hat{\mu}_{\theta}\left(x_{t} \mid y\right)\mu_{\theta}\left(x_{t} \mid y\right)s \cdot \Sigma_{\theta}\left(x_{t} \mid y\right) \nabla_{x_{t}} \log p_{\phi}\left(y \mid x_{t}\right) μ^​θ​(xt​∣y)μθ​(xt​∣y)s⋅Σθ​(xt​∣y)∇xt​​logpϕ​(y∣xt​)虽然这种做法实现了将类别条件引入到生成过程中可以生成指定类别的图像。但需要额外训练一个分类器且对于某些很难用分类器去描述的引导内容该方法也会失效。因此在CDMClassifier-free diffusion guidance中提出一种无需分类器的引导方法具体实现方法如下 ϵ ^ θ ( x t ∣ y ) ϵ θ ( x t ∣ ∅ ) s ⋅ ( ϵ θ ( x t ∣ y ) − ϵ θ ( x t ∣ ∅ ) ) \hat{\epsilon}_{\theta}\left(x_{t} \mid y\right)\epsilon_{\theta}\left(x_{t} \mid \emptyset\right)s \cdot\left(\epsilon_{\theta}\left(x_{t} \mid y\right)-\epsilon_{\theta}\left(x_{t} \mid \emptyset\right)\right) ϵ^θ​(xt​∣y)ϵθ​(xt​∣∅)s⋅(ϵθ​(xt​∣y)−ϵθ​(xt​∣∅))其中 ϵ θ ( x t ∣ y ) \epsilon_{\theta}\left(x_{t} \mid y\right) ϵθ​(xt​∣y)表示带有条件 y y y训练的去噪模型条件 y y y可以通过AdaGN或者图像级联的方式引入去噪模型中 ϵ θ ( x t ∣ ∅ ) \epsilon_{\theta}\left(x_{t} \mid \emptyset\right) ϵθ​(xt​∣∅)则表示条件为空时的扩散模型。 这里的写法和CDM原文中有一些出入就是公式中第一个 ϵ θ ( x t ∣ ∅ ) \epsilon_{\theta}\left(x_{t} \mid \emptyset\right) ϵθ​(xt​∣∅)在CDM中应该是 ϵ θ ( x t ∣ y ) \epsilon_{\theta}\left(x_{t} \mid y\right) ϵθ​(xt​∣y)不知道是作者的笔误还是我个人理解有误。 采用与CDM类似的结构作者将文本描述 c c c作为条件用于引导图像生成如下式 ϵ ^ θ ( x t ∣ c ) ϵ θ ( x t ∣ ∅ ) s ⋅ ( ϵ θ ( x t ∣ c ) − ϵ θ ( x t ∣ ∅ ) ) \hat{\epsilon}_{\theta}\left(x_{t} \mid c\right)\epsilon_{\theta}\left(x_{t} \mid \emptyset\right)s \cdot\left(\epsilon_{\theta}\left(x_{t} \mid c\right)-\epsilon_{\theta}\left(x_{t} \mid \emptyset\right)\right) ϵ^θ​(xt​∣c)ϵθ​(xt​∣∅)s⋅(ϵθ​(xt​∣c)−ϵθ​(xt​∣∅))其中文本描述 c c c先被编码为一个包含 K K K个Token的序列并将其输入到Transformer中得到的token嵌入一方面将取代ADM中的类别嵌入另一方面token嵌入的最后一层包含 K K K个特征向量将会被分别映射到ADM模型的每个注意力层的维度并与对应的注意力层级联起来。通过这样的方式实现了文本描述对去噪模型的引导。   此外作者还尝试了一种基于CLIP的引导方式具体而言就是利用CLIP中的图像编码器得到对应的图像特征 f ( x t ) f(x_t) f(xt​)文本编码器得到文本特征 g ( c ) g(c) g(c)计算二者之间的点乘积梯度来引导去噪过程如下式所示 μ ^ θ ( x t ∣ c ) μ θ ( x t ∣ c ) s ⋅ Σ θ ( x t ∣ c ) ∇ x t ( f ( x t ) ⋅ g ( c ) ) \hat{\mu}_{\theta}\left(x_{t} \mid c\right)\mu_{\theta}\left(x_{t} \mid c\right)s \cdot \Sigma_{\theta}\left(x_{t} \mid c\right) \nabla_{x_{t}}\left(f\left(x_{t}\right) \cdot g(c)\right) μ^​θ​(xt​∣c)μθ​(xt​∣c)s⋅Σθ​(xt​∣c)∇xt​​(f(xt​)⋅g(c))与ADM中的分类器引导类似这个CLIP模型也是在带有噪声的图像 x t x_t xt​上进行训练的使其具备对于噪声图像的编码能力。   实验结果表明采用无分类器的文本引导方式生成效果要优于基于CLIP的引导方式其生成效果对比如下 该方法还可以用于图像修复等编辑类任务效果如下
http://www.zqtcl.cn/news/552972/

相关文章:

  • 影视网站的设计与实现网站搭建培训
  • 网站优化 前端怎么做泉州建设培训中心网站
  • 专业的无锡网站建设电子邮件无法发送wordpress
  • 适合手机的网站免费做二建题的网站
  • 用阳寿做交易的网站做网站公司 陕西渭南
  • 携程旅行网网站策划书外贸网站如何做seo
  • 网站网站制作需要多少钱沧州新增最新
  • 有什么做兼职的网站wordpress 视频站模版
  • 做信息图的网站有哪些网站建设百度经验
  • zhihe网站建设 淘宝龙岗网站建设哪家好
  • 微信h5商城网站枣庄建设工程管理局网站
  • 做弹弓教程网站旺道seo怎么优化网站
  • 监理公司宣传册设计样本杭州优化seo公司
  • 佛山优化网站关键词衡水专业做网站
  • 京东alexa排名seo发外链网站
  • 中国工业设计网站制作网页版权怎么修改
  • 贞丰县建设局网站一般的电脑培训班要多少钱
  • 模板网站建设清单太原网站制作电话
  • 网站建设的需求要素设计企业网站机
  • 深圳百度推广电话西安官网seo技术
  • 沈阳建站免费模板福州建设企业
  • 怎么在百度首页做网站wordpress返回前页
  • 张家口城乡建设局网站wordpress 等待响应
  • 专门设计网站的公司叫什么怎么做网站多少钱
  • 淡水网站建设健身器材 网站模版
  • 河南建设网站公司简介做新闻类网站需要什么资质
  • 网络文化经营许可证图片下载优化大师安装桌面
  • 网站cms系统教育网站开发文档
  • 用网站做淘客怎么做网站建设在电访销售话术
  • 做电影网站赚了几百万动画制作流程