当前位置: 首页 > news >正文

vps可以做几个网站免费建社交网站

vps可以做几个网站,免费建社交网站,怎么做公司,网站代码需要注意什么东西目录 一、说明 二、编码器解码器架构中的问题#xff1a;需要注意 2.1 编码器方面的问题#xff1a; 2.2 解码器方面的问题#xff1a; 三、什么是注意力机制#xff1f; 3.1 计算 ci 值#xff1a; 3.2 ci 的广义表示#xff1a; 四、Bahdanau 注意 #xff1a; 4.1. 兼… 目录 一、说明 二、编码器解码器架构中的问题需要注意 2.1 编码器方面的问题 2.2 解码器方面的问题 三、什么是注意力机制 3.1 计算 ci 值 3.2 ci 的广义表示 四、Bahdanau 注意 4.1. 兼容性分数计算 4.2.注意力权重 4.3. 上下文向量 五、Luong 注意 六、注意机制的好处 七、引用 一、说明 在人工智能和机器学习领域注意力机制的概念已成为提高神经网络效率和有效性的有力工具。受人类有选择地关注输入数据特定方面的认知过程的启发注意力机制允许模型动态地将计算资源分配给给定输入的最相关组件。 在这篇博客中我们将分解注意力机制它们是什么为什么它们如此有用以及它们是如何运作的。从基本概念到实际应用我们将以通俗易懂的方式解释注意力机制如何成为人工智能的重要组成部分。 二、编码器解码器架构中的问题需要注意 2.1 编码器方面的问题 在自然语言处理中编码器-解码器架构面临的挑战类似于人类在尝试处理冗长句子时遇到的挑战。想象一下试图将一个长而复杂的句子翻译成另一种语言只看了一眼。保留整个上下文并准确翻译几乎是不可能的尤其是在处理包含超过 25 个单词的句子时。 同样当编码器处理一个大句子时在固定长度的上下文向量中捕获其完整的上下文被证明是一项艰巨的任务。此限制会显著影响翻译准确性。 2.2 解码器方面的问题 在图的解码器方面我们可以观察到要输出一个特定的单词如“आपसे”在英语中意为“你”我们不一定需要整个句子上下文。 相反只需要一个特定的单词或一组单词。然而在传统的编码器-解码器架构中整个句子上下文向量都提供给解码器导致解码器难以准确解码的静态表示。 如果解码器可以动态地关注与输出相关的特定单词则效率会更高。这个概念反映了人类的阅读和翻译方式通过关注注意力区域和相邻单词作为上下文。当我们人类阅读一段冗长的段落时我们的大脑会自然而然地创建一个注意力区域我们的注意力集中在其中。就像相机镜头捕捉到一个清晰的区域而其余部分仍然模糊不清一样我们的注意力主要集中在这个焦点上而周边信息则不太清晰。这种自然的认知过程使我们能够有效地理解和翻译文本。 此外考虑一下我们发现自己在段落中途的场景。在这一点上我们的大脑依靠相邻单词的上下文线索来破译不熟悉术语的含义。 考虑一个场景你要解码一个句子从解码器中的时间戳 t1 开始。假设您需要输出单词“आपसे”英语中的“你”。为了准确地做到这一点您必须提供来自编码器的相关信息特别是时间戳 t4 处的内容即单词“you”所在的位置这对于生成“आपसे”至关重要。同样在时间戳 t2 处解码时要输出“मिलकर”“见面”您需要从时间戳 t2 和 t3 输入其中可以找到“见面”的上下文。 因此挑战在于动态传递编码器的时间戳值这些值在解码过程的每个步骤中都保存了要翻译的重要信息。这种动态机制使解码器能够有选择地关注相关的编码器时间戳这就是我们所说的注意力机制。 三、什么是注意力机制 注意力机制使模型能够有选择地关注输入序列的相关部分同时生成输出序列的每个元素从而提高准确性并捕获机器翻译等任务中的长程依赖关系。我们举个例子来理解一下 下面是编码器解码器图我们将英语翻译成印地语。我们传递输入“关灯”我们从解码器端得到的输出是“लाइट बंद करो”。 在具有注意力机制的增强型编码器-解码器体系结构中我们将编码器隐藏状态表示为 h0、h1、h2、h3、h4将解码器隐藏状态表示为 s0、s1、s2、s3、s4。值得注意的是在解码器中预测特定时间戳的输出时我们输入两个基本组件前一个时间戳的解码器隐藏状态值si-1和前一个时间戳的编码器隐藏状态值yi-1。注意力机制的添加引入了另一个关键参数 ci它表示特定编码器时间戳对解码器中当前解码时间戳的重要性。 3.1 计算 ci 值 想象一下我们在解码器中的时间戳 t1旨在输出单词“लाइट”在英语中意为“光”我们试图了解哪个编码器隐藏状态h1、h2、h3 或 h4与此翻译最相关。这就是注意力机制发挥作用的地方。它为所有编码器隐藏状态分配权重表示为 α1、α2、α3 和 α4表明它们在生成单词“लाइट”中的各自重要性。 解码器中时间戳 t1 处的上下文向量 c1 可以表示为 该等式表示上下文向量 c1 是如何形成的方法是将每个编码器隐藏状态 hi 加权为其相应的注意力权重 α1i。 同样对于时间戳 t 2请参见下文 对于解码器中时间戳 t2 时的 c2上下文向量可以写成 就像 c1 一样c2 的计算方法是将每个编码器隐藏状态 hi 加权α其相应的注意力权重 2i。 3.2 ci 的广义表示 解码器中时间戳 t 处的上下文向量 ct 可以用数学方式表示如下 哪里 ct 表示时间戳 t 处的上下文向量。αti 表示在时间戳 t 处分配给第 i个编码器隐藏状态的注意力权重。hi 表示编码器的隐藏状态。N 是编码器隐藏状态的总数。 现在问题来了我们如何计算这些注意力权重值表示为 α 注意力权重值α是通过考虑两个主要因素来确定的编码器在相应时间戳处的当前隐藏状态hj和解码器的先前隐藏状态值si-1。 事实上α 是 hj编码器在时间戳 j 处的隐藏状态和 si−1解码器的先前隐藏状态的函数。 我们的目标是推导出一个捕捉这种关系的数学方程使我们能够根据 hj 和 si−1 计算 α 的值。在最初的研究论文中研究人员使用人工神经网络ANN因为它们是通用函数逼近器来设计这个方程使模型能够在解码过程中动态确定注意力权重。 在注意力机制中计算注意力权重值的两种流行方法是 Bahdanau 注意力和 Luong 注意力。 四、Bahdanau 注意 Bahdanau注意力也称为加法注意力是一种在序列到序列模型中计算注意力权重值的方法。它是由 Dzmitry Bahdanau、Kyunghyun Cho 和 Yoshua Bengio 在 2015 年的论文“通过共同学习对齐和翻译进行神经机器翻译”中引入的。以下是对 Bahdanau 注意力如何工作的详细说明 4.1. 兼容性分数计算 在每个解码时间步Bahdanau 注意力计算解码器的前一个隐藏状态 si−1 和每个编码器隐藏状态 hj 之间的兼容性分数。此兼容性分数通常使用前馈神经网络通常是单层神经网络计算该神经网络以 si−1 和 hj 为输入。从数学上讲编码器隐藏状态 hj 和解码器隐藏状态 si−1 的兼容性分数 eij 计算如下 4.2.注意力权重 一旦计算出兼容性分数它们就会通过另一个神经网络通常是单层神经网络然后是软最大激活来获得注意力权重。从数学上讲解码时间步长 i 处编码器隐藏状态 hj 的注意力权重 αij 计算如下 4.3. 上下文向量 计算注意力权重后通过对编码器隐藏状态进行加权求和来获得当前解码时间步长 i 的上下文向量 ci其中权重由注意力权重给出。在数学上上下文向量 ci 的计算方法如下 下图直观地说明了 Bahdanau 注意力是如何运作的提供了对其功能和计算流程的直观理解。 在编码器侧隐藏状态用 h0 表示每个状态都是一个四维向量。类似地在解码器端先前的时间戳隐藏状态用 s0 表示也包括四维向量。 我们通过连接解码器的上一个时间戳隐藏状态 s0 和每个编码器隐藏状态 hi 来创建一个矩阵。然后将该矩阵输入神经网络以计算兼容性分数 eij。在获得兼容性分数后我们应用softmax函数对其进行归一化从而得到注意力权重αij。然后这些注意力权重用于计算上下文向量 ci 。 Bahdanau 的数学工作流程 注意 五、Luong 注意 在 Luong 注意力中与 Bahdanau 注意力的第一个区别是Luong 注意力没有考虑解码器端的先前隐藏状态值而是合并了解码器的当前时间戳隐藏状态值。第二个区别在于注意力权重α值的计算方法Luong注意力利用解码器当前时间戳隐藏状态si和每个编码器隐藏状态hi之间的点积。 在 Luong 注意力中最后一个区别是上下文向量 ci 直接传递到 LSTM 单元的输出中这与 Bahdanau 注意力中的方法形成鲜明对比后者将上下文向量与 LSTM 单元的输入连接起来。这种将上下文向量简化到 LSTM 单元输出中的集成简化了解码过程并增强了模型生成准确输出的能力。图表确实可以帮助直观地理解这些概念。 六、注意机制的好处 下图说明将注意力机制集成到编码器-解码器架构中可以防止随着段落中句子长度的增加而降低 BLEU 分数。 七、引用 研究论文通过共同学习对齐和翻译的神经机器翻译 Youtube频道  https://youtu.be/0hZT4_fHfNQ?siALRyGf-bNeHKMvdk 我相信这篇博客丰富了你对编码器解码器架构中注意力机制的理解。如果您发现此内容的价值我邀请您保持联系以获取更有见地的帖子。非常感谢您的时间和兴趣。感谢您的阅读
http://www.zqtcl.cn/news/152893/

相关文章:

  • 飞鸽网站建设网站建设源代码交付
  • 阿里云服务器做盗版电影网站wordpress密码访问
  • 本机可以做网站的服务器吗做磨毛布内销哪个网站比较好
  • 免费建站系统wordpress一个网站需要什么
  • 移动端网站制作的有哪些要求百度广告投放价格表
  • 网站建设互联网推广广告设计公司业务范围
  • 昆明网站关键词优化沪佳装修公司全部门店
  • 南阳卧龙区2015网站建设价格快三直播十大平台直播间
  • 网站谁做的wordpress 空白页面
  • 专业的佛山网站建设公司Wordpress 帖子翻译
  • 南昌网站建设公司网站建设公司深圳企业网站模板
  • 一家做特卖的网站docker创建wordpress
  • 网站开发设计电子书网站后台无法更新缓存
  • 南京高端网站制作公司哪家好神起网络公司
  • 建网站选哪个宁波网站建设设计图
  • 贾汪徐州网站开发门户网站解决方案
  • 网站如何做淘宝支付个人注册商标步骤
  • 书香校园网站建设网站排名下降了怎么办
  • 观音桥网站建设湖南省建设银行网站官网
  • 信阳网站建设找汉狮搭建网站知识
  • 企业门户网站用户类型商务信息网
  • 深圳网站设计廊坊公司深圳ui设计培训班
  • 为什么网站需要维护帮人推广注册app的平台
  • 网站开发岗位要求服务好的做培训网站
  • 宁波制作网站企业有哪些学网页设计需要什么学历
  • 网站建设公司墨子网络百度域名续费
  • 琪觅公司网站开发中文网页开发工具
  • 教育网站制作设计成都网络营销公司
  • 怎么查看一个网站页面的seo优化情况网站建站建设首选上海黔文信息科技有限公司2
  • 威海网站建设价格深圳优美网络科技有限公司