当前位置: 首页 > news >正文

做暖暖小视频网站手机 dns 国外网站

做暖暖小视频网站,手机 dns 国外网站,企业建站系统费用,任何查询网站有没有做404变压器中的位置编码 一、说明 在上一期的“Transformers for Everyone”系列中#xff0c;我们介绍了 Transformer 的概念#xff0c;并深入研究了第一个关键架构元素#xff1a;输入嵌入。如果你错过了第一集#xff0c;你可以通过阅读来赶上#xff1a;适合所有人的变形…变压器中的位置编码 一、说明 在上一期的“Transformers for Everyone”系列中我们介绍了 Transformer 的概念并深入研究了第一个关键架构元素输入嵌入。如果你错过了第一集你可以通过阅读来赶上适合所有人的变形金刚。在本文中我们将探讨另一个值得我们关注的关键元素“位置编码”。 位置编码就像句子中单词的 GPS。正如我们希望模型能够理解单词一样我们也希望它能够掌握句子中单词的空间排列。 想象一下如果我们能为模型提供有关单词如何相对于彼此定位的信息——无论它们是近的还是远的。这有助于模型理解上下文和含义。 二、运作方式 原句我们从原来的句子开始“Yobi是一家伟大的公司。正如我们在上一篇文章中了解到的那样我们已经将其转换为嵌入。 位置编码向量接下来我们创建一个称为位置编码向量的特殊向量。这个向量与我们的嵌入大小相同并被添加到它们中。 但是此向量保持固定并表示每个单词在句子中的位置。 编码器输入两个向量的结果都是一个编码器输入一个与我们的嵌入大小相同的向量。此编码器输入将词嵌入的丰富性与位置编码提供的空间感知相结合。 位置编码使模型不仅可以理解单词还可以理解它们在句子中的上下文。它是语言翻译、文本生成等任务的重要组成部分。 使用 BERT 的示例可选    注意    与早期的 transformer 模型不同BERT 不使用单独的步骤来添加位置编码。相反它在预训练阶段学习位置信息。    每个令牌的嵌入在从 BERT 模型出来时都已经编码了位置信息。这与 Vaswani 等人的原始 Transformer 模型不同后者将位置编码显式添加到嵌入中。 1/我们将从导入库和定义句子开始 import torch from transformers import BertTokenizer, BertModel sentence Yobi is a great company阿拉伯数字/初始化分词器和模型 BERT我将使用这个https://huggingface.co/bert-base-uncased英语的 BERT 的特定版本如果需要您可以选择其他版本 tokenizer BertTokenizer.from_pretrained(bert-base-uncased) model BertModel.from_pretrained(bert-base-uncased)BertTokenizer 用于将句子转换为模型可以理解的格式 BERT    BertModel 是将生成嵌入的模型。    3/句子的标记化 inputs tokenizer(sentence, return_tensorspt, add_special_tokensTrue) input_ids inputs[input_ids]可选我们转换回标记只是为了查看模型看到的确切标记CLS由 BERT 标记器在每个输入序列的开头添加和 SEP用于标记句子的结尾或在需要理解它们之间关系的任务中分隔两个不同的句子是特殊的标记 tokens tokenizer.convert_ids_to_tokens(input_ids[0]) print(tokens) #[[CLS], yo, ##bi, is, a, great, company, [SEP]]注意在这种情况下Yobi 被拆分为子词单元“yo”、“##bi”。BERT 使用子词标记化 WordPiece 来处理未知单词并减少词汇量。## 表示“bi”是前面标记的延续。 4/生成嵌入我们将标记化的句子传递给 BERT 模型嵌入将包含输入句子中每个标记的嵌入。 with torch.no_grad():outputs model(input_ids)embeddings outputs.last_hidden_state5/准备编码器输入我们将嵌入分配给一个变量该变量将在处理管道的下一阶段使用我们将在下一集中看到 encoder_input embeddings自选您可以打印“encoder_input”的形状 print(encoder_input.shape) #torch.Size([1, 8, 768])这意味着批处理中有 1 个序列序列中有 8 个标记每个标记由一个 768 维向量表示。 变形金刚 AImemes。图片来源blog.searce/decoding-llms-513522a5afc 我们在文章的最后在整个剧集中我们发现了位置编码在理解单词方面的关键作用以及它们在句子中的上下文这些句子是由嵌入输入编码器的单词形成的请继续关注下一集的更多见解 请考虑关注有关商业、数据科学、机器学习和扩展现实的更多文章。 统计与数据科学 https://medium.com/soulawalid/list/statistics-data-science-65305693779d 商务 https://medium.com/soulawalid/list/business-1528f08575a7 量子机器学习 https://medium.com/soulawalid/list/qml-be0b06f7a986 扩展现实 https://medium.com/soulawalid/list/extended-reality-bf03607b0b80 神经营销学 https://medium.com/soulawalid/list/neuromarketing-8f94149e3c73
http://www.zqtcl.cn/news/819006/

相关文章:

  • win8风格门户网站已经建网站做外贸
  • 自己有域名如何做网站wordpress文章中外链
  • 网站模糊背景加快网站速度吗
  • 网站设计软件下载在线观看免费网站网址
  • 关于网站开发的文章wordpress+直接连接数据库
  • 清华紫光网站建设怎样做团购网站
  • 诸城网站建设费用网站建设便捷
  • 丰台网站建设联系方式全屋定制十大名牌口碑
  • mip网站模板中国建设集团门户网站
  • 笑话 语录用什么网站做搜一搜百度
  • 合肥网站建设新闻营销影视类网站建设
  • 焦作有网站建设公司c 转网站开发
  • 化妆品网站建设报告邯郸在哪个省
  • 自建网站怎么做后台管理系统世界网站流量排名
  • 我做外贸要开国际网站吗官方网站下载微博
  • 佛山专业建设网站网页模板是什么
  • 网站描述标签怎么写wordpress首页图标
  • 做系统去哪个网站好好玩又不用实名认证的游戏
  • 仿帝国网站源码wordpress主题idown
  • 大型网站开发php框架seo全站优化全案例
  • wordpress收录优化做抖音seo用哪些软件
  • DW怎么做招聘网站重庆有什么好玩的
  • 网站建设的网络公司百度官方app下载
  • 医疗电子科技网站建设站群 网站如何做
  • 汇邦团建网站谁做的钢结构招聘网
  • 如何制作一个动态的网站的登录详细步骤页面网站炫酷首页
  • 网站建设找星火龙网站开发 在线支付
  • 如何在公司网站下设置邮箱自己开发一个app要多少钱
  • 珠海市横琴新区建设环保局网站做catia数据的网站
  • 珠海pc网站建设wordpress子主题安全