当前位置: 首页 > news >正文

邯郸网站设计怎么注册网站性能策划

邯郸网站设计怎么注册,网站性能策划,重庆最新新闻发布会,青海市建设局网站使用transformer而导致的时间长#xff0c;可能会由于self-attention计算Query和key的值才导致的时间长#xff0c;也可能会因为feed forward中的计算导致时间长。这里我们只针对第一种情况下进行优化。 第一种情况#xff1a;有些问题#xff0c;我们可能不需要看整个句子…使用transformer而导致的时间长可能会由于self-attention计算Query和key的值才导致的时间长也可能会因为feed forward中的计算导致时间长。这里我们只针对第一种情况下进行优化。 第一种情况有些问题我们可能不需要看整个句子只看位置上左右的邻居就可以得到正确的答案。所以我们可以把其他值直接设置为0。 上一种每次只看相邻的马可能不足得到答案。我们也可以跳两格去看更远地方的信息。右图为每次跳一格。 另外一种global attention我们在句子中选择几个作为special token 或者在句子中添加几个special token。 special token可以观察到全局的信息。其他的token只计算与special token的值就可以了。我们可以通过special token来传递token之间的信息。 这一种方法就是将Query和Key进行分类将相关性比较大的分到一类中。我们可以采取快速但是相对没有那么准确的方法来进行分类。 然后计算相应分类中的值其他的直接设为0。 还有一种就是input seq上的每一个位置在经过网络学习后会产生一段向量。将向量拼接起来后就是QueryKey矩阵。其中生成的向量中的每个值可能是float我们通过一些变换将其转变为0或者1。 我们还可以挑选一些具有特点的key和value作为代表来与query进行计算。其中query的数量不宜进行减少因为query减少了那么对应的输出就会减少。假设后面是一个分类问题就会造成错误。 第一种选择的方法就是将输入的向量放入cnn中将cnn的结果看作是有代表性的key。第二种就是乘以一个N*K的矩阵将结果作为有代表性的key。
http://www.zqtcl.cn/news/772620/

相关文章:

  • 重庆建网站推广公司个人网站需要建站群吗
  • 深圳网站建设吗个人博客网站制作代码
  • 化妆品网站模板网络营销的网站分类有哪些
  • 广州网站建设程序员培训wordpress 微信 抓取
  • 毕设给学校做网站个人店铺logo
  • 中国做w7的网站宿迁网站建设价位
  • 网站建设售后服务合同百度关键词排名点击器
  • 编辑网站用什么软件推广是什么
  • 北京模板开发建站做网站赚钱的点在哪里
  • 网站建设价格兴田德润i网址多少wordpress主题汉化是什么意思
  • 用最少的钱做网站根据域名查询网站名称
  • 网站开发答辩难点网站返回按钮设计
  • 鹤壁做网站优化建设银行理财产品网站
  • 电子商务类网站模板自学网站建设基本流程
  • 无锡网站制作的公司上海企业服务公司
  • 做h5小程序的网站搜索引擎营销案例
  • 订餐网站开发方案查询网站是否正规
  • 建站论坛图片生成器免费
  • 怎么做自己的店铺网站博物馆门户网站建设优势
  • 专业旅游培训网站建设应用之星 wordpress
  • 青海媒体网站建设公司深圳网站建设推广优化公司
  • 网站开发 价格跨境支付互联互通
  • 织梦 修改网站logo营销型网站设计的内容
  • 电商网站运营策划做网站CentOS还是win好
  • 小型企业网站模板企业网站seo点击软件
  • 提供邯郸企业建网站网站图片上怎么做弹幕效果
  • 滨州做网站的wordpress如何添加商桥
  • 网站登录密码忘记网站开发营业执照申请
  • 电商网站设计思路音乐推广平台有哪些
  • 网站建设傲鸿网站链轮内有死链