当前位置: 首页 > news >正文

做海报推荐网站外贸云网站建设

做海报推荐网站,外贸云网站建设,网站备案是什么意思,网站根目录在哪wordpress通过在4亿图像/文本对上训练文字和图片的匹配关系来预训练网络#xff0c;可以学习到SOTA的图像特征。预训练模型可以用于下游任务的零样本学习 ​​​​​​​ ​​​​​​​ 1、网络结构 1#xff09;simplified version of ConVIRT 2#xff09;linear …        通过在4亿图像/文本对上训练文字和图片的匹配关系来预训练网络可以学习到SOTA的图像特征。预训练模型可以用于下游任务的零样本学习 ​​​​​​​        ​​​​​​​         1、网络结构 1simplified version of ConVIRT 2linear projection to map from each encoders representation to the multi-modal embedding space 3image encoder - ResNet antialiased rect-2 blur pooling 用attention pooling (single layer of transformer-style multi-head QKV attention where the query is conditioned on the global average-pooled representation of the image)来代替global average pooling - Vision Transformer (ViT) add an additional layer normalization to the combined patch position embeddings before the transformer slightly different initialization scheme 4text encoder - Transformer architecture modifications 63M-parameter 12 layer 512-wide model with 8 attention heads lower-cased byte pair encoding (BPE) representation of the text with a 49152 vocab size the max sequence length was capped at 76 the text sequence is bracketed with [SOS] and [EOS] tokens the activations of the highest layer of the transformer at the [EOS] token are treated as the feature representation of the text which is layer normalized and then linearly projected into the multi-modal embedding space 5scale - image encoder equally increase the width, depth, and resolution of the model - text encoder only scale the width of the model to be proportional to the calculated increase in width of the ResNet, do not scale the depth at all * text encoder对CLIP的表现影响较小 2、数据 1400 million (image, text) pairs from Internet 2many of the (image, text) pairs are only a single sentence 3、训练 1Contrastive Language-Image Pre-training (CLIP) 2text as a whole, not the exact words of that text 3Given a batch of N (image, text) pairs, predict N x N possible (image, text) pairings。N取32768 4jointly train an image encoder and text encoder 5maximize the cosine similarity of the  real pairs; minimizing the cosine similarity of the  incorrect pairs 6train from scratch 7数据增强 random square crop from resized images 8learnable temperature parameter  (control the range of the logits in the softmax) 4、优势 无需softmax分类器来预测结果因此可以更灵活的用于zero-shot任务
http://www.zqtcl.cn/news/518891/

相关文章:

  • 自己做网站的准备工作营销平台推广
  • 建站网站平台建站工具的优点
  • 各学院二级网站建设通报wordpress 修改admin
  • 网站建设加推广需要多少钱wordpress标签自动生成插件下载
  • 周村区建设局网站石家庄网站运营公司
  • 网站描述怎么设置wordpress仿模板
  • 宁波市网站建设公司h5游戏是什么意思
  • 青岛网站设计案例全栈网站开发
  • 欢迎访问中国建设银行网站个人客户网站建设需要经历什么步骤
  • 建设银行怀柔支行营业部网站企业官网手机版
  • cms那个做网站最好大连网站开发平台
  • 佛山建设外贸网站公司可信网站图标
  • 沈阳.....网站设计连云港优化网站团队
  • 网站添加白名单想学ui设计从哪里入手
  • 做期货与做网站的关系淮安市城市建设档案馆网站
  • 网站建设的技术亮点单位宣传册设计样本
  • 网站建设与维护服务敦化市建设局网站
  • 官方网站建设思路wordpress改成织梦
  • 网站建设推广方法网站调优
  • 苏州做企业网站wordpress前台发布文章
  • 怎么建个私人网站网络营销就业前景和薪水
  • 专业的网站开发团队京东电商平台
  • 做网站手机微信小程序怎么加入我的小程序
  • 做网站困难吗公司如何注册网站
  • 可信网站认证收费吗建设化工网站的目的
  • 查网站死链必用工具微信 wordpress
  • 做网站凡科新手如何开微商城店
  • 网站空间维护个人怎么注册一个品牌
  • 连云港网站设计城乡建设网站 资料员
  • 网络优化工程师有多累seo前线