当前位置: 首页 > news >正文

营销型网站建设的一般过程包括哪些环节?体育视频网站建设

营销型网站建设的一般过程包括哪些环节?,体育视频网站建设,dede 网站地图样式,网站建设的公司如何寻找客户论文解决了什么问题#xff1f; 提出了一个新的简单网络架构——transformer#xff0c;仅仅是基于注意力机制#xff0c;完全免去递推和卷积#xff0c;使得神经网络训练地速度极大地提高。 We propose a new simple network architecture, the Transformer, based sole…论文解决了什么问题 提出了一个新的简单网络架构——transformer仅仅是基于注意力机制完全免去递推和卷积使得神经网络训练地速度极大地提高。 We propose a new simple network architecture, the Transformer, based solely on attention mechanisms, dispensing with recurrence and convolutions entirely. 论文采用了什么方法 用多头注意力取代推导层。 论文达到了什么效果 该论文提出的模型在WMT2014英语翻译德语和英语翻译法语的任务实验中打破了当时的最好记录并且其训练成本仅仅是最好模型的一小部分。 提出的模型成功地泛化到其他任务上。 AuthorGoogle Brain Key words:神经网络,transformer Abstract 作者提出了一个新的简单网络架构transformer。该模型是基于注意力机制完全免去递推和卷积。模型的质量上更好有着更好的并行性训练地速度极大地减少可以很好地泛化到其他任务中。 Introduction: 过去关于语言模型和机器翻译主要使用RNN、LSTM、GRNN。但这些模型中计算步骤是使用前一个状态ht-1的输出来做为后一个状态ht的输入这种顺序性质限制了其计算效率。尽管最近的工作提升了模型的性能但其根本的顺序计算限制仍然存在。 Transformer模型就是为了解决这一个问题而提出来的它有着显著更多的并行性并且在翻译质量上达到最先进水平。 Background: transformer的目标是减少序列化计算这同时也是ByteNet和ConvS2S的基础。但是这些模块中被要求关联两个任意输入或输出位置的信号的操作数量随着位置间距离的增长而增长这使得学习两个远距离位置的依赖关系困难。 提出自我注意力机制是将单个序列不同位置联系起来以计算一个序列表示的注意力机制。 Model Architecture: 该章节主要讲解transformer的架构是编码-解码架构。 编码器和解码器都是由6个相同层的堆栈组成。注意力函数被描述为将查询和一组键值对映射到输出查询、键、值和输出都是向量。输出被计算为值的加权和。 缩放点积注意力附加注意力使用具有一个单隐藏层的前反馈网络计算兼容性函数。 多头注意力允许这个模型共同关注来自不同地点、不同表示子空间的信息。 注意力在模型中的应用 1.在“encoder-decoder attention layer中这个查询来自之前的解码层。 2.编码器包含自我注意力层。 3.解码器中自注意力层允许解码器中每个位置关注解码器中达到并包含该位置的所有位置。 位置式前反馈网络 除了注意力层在我们”encoder-decoder“中的每一层包含了一个全连接前向反馈网络这被分别相同地应用到每个位置。 嵌入和softmax 使用学习嵌入去把输入标记和输出标记转换为维度dmodel的向量。 位置编码 由于本文提出的模型中不包含递归或卷积为使模型利用序列的顺序必须投入一些有关序列中标记的相关或者绝对位置的信息。因此把”位置编码“添加到在编码和解码栈底部的输入其纳入中。 Why Self-Attention: 作者把自注意力和循环层以及卷积层进行比较体现自注意力的优点。 作者考虑使用自注意力的三个需求 1.每层的总计算复杂度 2.可以并行化的计算量 3.网络中远程范围依赖之间的路径长度。 Training: 本章节即实验部分作者使用WMT2014上的数据训练文章提出的模型并得出实验结果。 Reults: 对于transfomer实验结果的分析发现transformer在机器翻译的结果优于最新模型并且在英语选区解析上的表现结果也出奇的好。 Conclusion: 1.本文提出了一个完全基于注意力的序列转导模型用多头自我注意力取代在编码-解码架构中最常使用的推导层——Transformer。 2.未来计划将Transformer扩展到文本以外的输入和输出模式的问题。 参考资料 国外大神写这篇文章非常通俗易懂 详解Transformer——知乎 Attention is all your need 精读
http://www.zqtcl.cn/news/696030/

相关文章:

  • 简述网站的制作步骤合肥网站建设需
  • 网站备案的程序哪里能买精准客户电话
  • 白云网站建设网站版式
  • 做美食有哪些网站科技公司介绍
  • 网站后台被百度蜘蛛抓取哪个做网站比较好
  • 企业建设网站的需求分析百度免费发布信息平台
  • 网站建设交易中心上海装修公司排行榜
  • 桂林论坛网站有哪些在线设计平台用户分析
  • wap网站的开发去加网 wordpress
  • 博客网站建设设计论文总结php mysql做网站登录
  • 海南智能网站建设公司wordpress 如何使用php版本号
  • 河南网站开发培训app 软件开发
  • 购物网站功能介绍一流的高密网站建设
  • 电影网站怎么做优化wordpress 去掉w
  • 永久网站空间标书制作员工资很低吗
  • 做网站用到ps么淘宝优惠网站怎么做
  • jsp 淘宝网站验证码 设计搜索引擎排名
  • pdf怎么做电子书下载网站北京成立公司
  • 网站后台附件无法上传阿克苏建设网站
  • 网站和网址有什么不同佛山狮山网站建设
  • 有免费的微网站是什么可以做长图的网站
  • 南昌手机建站模板18种禁用软件黄app
  • 备案的域名做电影网站wordpress伪静态cdn配置
  • 国家城乡住房建设部网站百度关键词首页排名
  • 安卓软件开发需要学什么软件北京百度推广优化公司
  • 用asp.net 做网站wordpress网址缩短
  • 中国工程建设交易信息网站仿蘑菇街wordpress主题
  • 网站需要怎么做做普通网站公司吗
  • 网站收录平台方法网站建设是不是都需要交费
  • 上海 政务网站建设情况营销模式有哪些 新型