当前位置: 首页 > news >正文

网站访问对应二级域名建站行业前景怎么样

网站访问对应二级域名,建站行业前景怎么样,服务器网站环境,中国室内设计联盟登录文章目录 一、背景二、方法 论文#xff1a;BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding 出处#xff1a;Google 一、背景 在 BERT 之前的语言模型如 GPT 都是单向的模型#xff0c;但 BERT 认为虽然单向#xff08;从左到右预测… 文章目录 一、背景二、方法 论文BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding 出处Google 一、背景 在 BERT 之前的语言模型如 GPT 都是单向的模型但 BERT 认为虽然单向从左到右预测预测任务符合语言模型的建模过程但对一些语言理解任务不太友好因为要理解一句话说的是什么意思的话如 VQA 同时看到一整句话也是可以的是符合逻辑的而不是只能一个单词一个单词的来逐个看。 所以 BERT 打破了语言模型单向的限制做了一个双向的模型就是做完形填空的时候运行看左边也运行看右边而且是受 Cloze 1953年的论文这个方法的启发 具体的做法就是每次随机选一些 token 然后 mask 掉这些信息目标是预测这些 token这样就允许训了一个双向且深的 transformer 模型结构 此外BERT 还做了一个任务——下一个句子的预测next sentence prediction就是给模型两个句子让模型判断这两个句子在原文中是不是相邻的能让模型学习句子层面的信息 二、方法 BERT 的两个步骤 预训练使用无标注的数据训练的预训练模型左边 mask model输入的是句子对儿会把句子先进行拆词并在序列首位放置 [CLS] 在句子中间放置 [SPE] 这两个特殊的 token然后对普通的 token除过特殊 token 之外的从句子中拆出来的 token进行 15% 概率的擦除然后在这 15% 的 token 中选择 80% 的直接用 [MASK] 替换掉这个 token10%的随机放置 token10% 不改变 token。next sentence prediction预测下一个句子在 VQA 和 语言推理中都是句子对所以使用这种方法对这两个任务类似的理解的任务有提升。输入的数据中有 50% 真的是下一个句子50% 是随机拿来的句子。 微调针对不同的下游任务还会使用有标签的数据来微调使用预训练模型参数初始化所有权重都会参与训练右边 模型超参数base 共 110M 参数也就是 1.1亿对标的是 GPT 模型大小large 共 340M 参数也就是 3.4亿 transformer block 个数base 12 层large 24 层hidden 层大小base 768large 1024多头注意力机制 head 的个数base 12 头large 16 头 输入和输出 输入是一个序列可以是一个句子也可以是两个句子两个句子也会并成一个序列序列的构成方式使用的切词方法是 WordPiece因为如果按照空格切词的话会导致词典很大WordPiece 是说如果一个词出现频率不高的话那么就切开看它的子序列子序列出现多的话保留子序列就可可以使用 30000 token vocabulary 就能表示一个大的文本了。切好词之后就要把两个句子整合成一个序列序列的第一个词用于都是 [CLS]bert 希望这个 token 表示整个序列的特征。还有一个 [SEP] token 表示将两个句子在这里切开因为毕竟每个句子还是独立的个体所以要有标志将其切开。在图 1 左侧就展示了将句子切成 token然后将求每个 token 的 embedding每个 token 还要加 位置的 embedding 和 segment embedding如图 2 所示 BERT 的每个 token 的输入是由三个部分相加得到的token embedding就是输入 transformer 之前的一次简单 embeddingsegment embedding表示第一句话还是第二句话position embeddingtoken 在序列中的位置
http://www.zqtcl.cn/news/698264/

相关文章:

  • 长沙网站seo技术厂家山东济宁网站建设设计
  • 外贸网站制作有哪些做体育的网站
  • 广州哪里有做网站推广最牛的网站建
  • 建设网站用户名是什么原因世界500强企业排名2020
  • 创建网站要找谁手机网站后台源码
  • canvas网站源码网站静态和动态区别
  • 网站建设需要了解哪些方面数据分析工具
  • 求个网站没封的2021网站建设初步课程介绍
  • 沈阳网站前端网站建栏目建那些
  • 经典网站案例江苏省建设厅官网
  • 公司建设网站需要多少钱重庆房产网站建设
  • 鹤岗市建设局网站可信网站认证有用吗
  • 网站注册的账号怎么注销如何百度推广
  • 用wordpress制作网站模板阿里云网站建设合作
  • 金华建设公司网站宝武马钢集团公司招聘网站
  • 万州网站制作公司阳江市网站建设
  • 下载建设网站软件投资公司注册资金多少
  • 如何创建一个论坛网站免费域名解析平台
  • 国外经典手机网站设计单位做网站有哪些
  • 网站备案 优帮云百度提交入口网址截图
  • 广州五羊建设官方网站富阳区住房和城乡建设局网站
  • 网站代理怎么做的wordpress有什么缺点
  • 哪些网站可以做免费外贸Wordpress首图自动切换
  • 建网站几个按钮公司黄页企业名录在哪里查
  • 网站建设类外文翻译游戏开科技软件免费
  • 黄山家居网站建设怎么样济南在线制作网站
  • 东莞电子产品网站建设营销型网站推广方式的论文
  • 如何寻找做网站的客户聚名网查询
  • 甘肃制作网站凡科快图官网登录入口在线
  • discuz网站建设教学视频教程哪些大型网站有做互联网金融