当前位置: 首页 > news >正文

东莞服饰网站建设哪家好俄罗斯在线 网站制作

东莞服饰网站建设哪家好,俄罗斯在线 网站制作,外国人做的甲骨文网站,广州做企业网站线性注意力将Softmax解耦为两个独立的函数#xff0c;从而能够将注意力的计算顺序从(querykey)value调整为query(keyvalue)#xff0c;使得总体的计算复杂度降低为线性。然而#xff0c;目前的线性注意力方法要么性能明显不如Softmax注意力#xff0c;并且可能涉及映射函数…线性注意力将Softmax解耦为两个独立的函数从而能够将注意力的计算顺序从(query·key)·value调整为query·(key·value)使得总体的计算复杂度降低为线性。然而目前的线性注意力方法要么性能明显不如Softmax注意力并且可能涉及映射函数的额外计算开销 首先以往线性注意力模块的注意力权重分布相对平滑缺乏集中能力来处理最具信息量的特征。作为补救措施我们提出了一个简单的映射函数来调整查询和关键字的特征方向使注意权值更容易区分。其次我们注意到注意力矩阵的降低秩限制了线性注意力特征的多样性。提出了一个秩恢复模块通过对原始注意矩阵进行额外的深度卷积(DWC)有助于恢复矩阵秩并保持不同位置的输出特征多样化。 聚焦能力 先前的一些工作中指出在自注意力计算中Softmax提供了一种非线性的权重生成机制使得模型能够更好地聚焦于一些重要的特征。如下图所示本文基于DeiT-tiny模型给出了注意力权重分布的可视化结果。可以看到Softmax注意力能够产生较为集中、尖锐的注意力权重分布能够更好地聚焦于前景物体而线性注意力的分布则十分平均这使得输出的特征接近所有特征的平均值无法聚焦于更有信息量的特征。 Softmax Attention Linear Attention 线性注意力被认为是一种有效的替代方法它将计算复杂度从O(N2)限制到O(N)。具体来说引入精心设计的核函数作为原始相似函数的近似即 Focused Linear Attention 1、聚焦 2 、DWC 特征多样性 除聚焦能力外特征多样性也是限制线性注意力性能的一个因素。本文基于DeiT-tiny可视化了完整的注意力矩阵并计算了矩阵的秩将Softmax注意力与线性注意力进行对比。从图中可以看到Softmax注意力可以产生满秩的注意力矩阵这反映出模型提取到的特征具有多样性。然而线性注意力无法得到满秩的注意力矩阵这意味着不同行的权重之间存在冗余性。。 线性注意力矩阵的秩会被每个head的维度d和特征数量N中的较小者所限制 由于自注意力的输出是这些权重对同一组value加权组合得到的权重的同质化就必然会导致模型输出的多样性下降进而影响模型性能。
http://www.zqtcl.cn/news/403308/

相关文章:

  • 建设专业网站哪家比较好小程序源码是什么意思
  • 网站设计一般包括什么给公司做网站数据分析
  • 网站根目录在哪里1024cctvcom戊人影祝
  • wordpress转发微信南宁seo企业优化
  • 红旗渠建设集团网站昭通网络推广
  • 海陵区建设局网站计算机网站建设考试试卷
  • 佛山做网站3lue网站开发招标网
  • 粘贴以下代码到网站首页代码的与标签之间渭南软件开发
  • 企业网站建设必要性上海网站建设报价表
  • 陕西省建设厅申报网站一个主体如何添加网站
  • 做网站业务员提成几个点wordpress 地图导航代码
  • 软件下载网站排行住房和城乡建设部办公厅网站
  • 贵阳网站建设需要多少钱百度资源搜索平台
  • 做安全防护信息的网站wordpress初始密码
  • 广东企业网站seo哪里好微信公众号怎么创建文章
  • 建行网站登录不了wordpress好主题
  • 南屏网站建设湖北省建设厅的网站
  • 有没有做花卉种子的网站啊正规网站建设服务
  • 长沙网站建设公司招聘那个建设网站好
  • 网站开发视频下载网站优化关键词排名自己怎么做
  • 网站建设 流程咸宁网站建设哪家好
  • 建站公司兴田德润实惠钦州建设局网站
  • 高新区免费网站建设旅游网站开发设计与实现
  • 怎样做才能让网站帮忙送东西线上推广方案怎么做
  • 服装公司网站网页设计友情链接交换网站
  • 公司建设网站需要去哪报备网页挂马
  • 做网站需要代码吗秦皇岛在哪里
  • 番禺网站设计公司万网查询全部域名
  • 电子商务网站建设与运营的试题集团高端网站
  • 天津网站建设电话网页制作与设计调试分析