当前位置: 首页 > news >正文

网站建设国内外研究现状模板ppt设计大赛

网站建设国内外研究现状模板,ppt设计大赛,建设银行网站登不上,深圳高端保姆公司第6章 如何训练大语言模型 本章节主要探讨训练大语言模型的步骤和方法论。 目前,可能大家接触的最多的模型训练方式是微调,也能收到一定程度的比较好的效果,其中有代表性的项目有Github上的Alpaca, Baize,Vicuna等。 6.1 Pretrain 预训练 有了微调,为什么还需要预训练,直…第6章如何训练大语言模型 本章节主要探讨训练大语言模型的步骤和方法论。 目前,可能大家接触的最多的模型训练方式是微调,也能收到一定程度的比较好的效果,其中有代表性的项目有Github上的Alpaca, Baize,Vicuna等。 6.1 Pretrain预训练 有了微调,为什么还需要预训练,直接拿一些成熟的模型来微调不能满足吗? 答案其实和大多数人的理解不同,绝大多数下游任务是无法通过微调来解决的,微调成功的前提的是 被微调模型的训练语料包括训练任务的种类本身和要微调的任务差距不大,最重要的是训练语料,要求预训练模型里面包含了微调训练所需要的知识。 日常的生产环境中,我们碰到的大多数问题有以下几种情况: 1-语言的不匹配,比如预训练模型是英文,微调任务是中文。 2-特定领域的专业词汇,比如医疗,生物,金融领域,这些泛知识领域或者互联网上的训练语料无法涵盖的部分。 当一个训练任务无法解决上述的问题,那么应该从预训练Pretrain开始对模型进行训练。 Pretrain实际上也分为若干个步骤。 和微调一样,我们一般会选择一个预训练的基座模型,这个模型可以是Llama,可以是ChatGLM或者任何的开源模型,当然也可以是一个自己编辑网络架构的模型。 如果使用开源的模型比如Llama,它算是一个相对优秀的语言模型,但是它的中文表达能力,确实受到诟病,和Llama一样,大多数市面上被认可的优秀语言模型,都没有对中文部分进行充分的预训练。 6.1.1扩充词表 除了没有充分的预训练以外,第二个问题,就是词表的问题。目前的开源模型词表构成主要是由英文构成的。中文的部分几乎每一个都不是特别的完善,所以大多在预训练之前都需要进行词表的扩充,也就是扩充tokenizer的文件。 一般在如图6-1这个文件配置里可以看到模型的词表。 图6-1词表描述文件-1 图6-2词表描述文件-2 如6-2显示,词表中的每个词对应了一个数字,这个数字就是词表的idx,也就是词的id索引,这个索引会被embedding成相关的向量来进行训练。 我们输入进embedding层的时候往往都是一些句子,所以要对句子进行分词,NLP最早有两种。 第一是针对空格分,英文里常见,比如“Ilove you”,被拆成“I”, “love”, “you”。 第二是按字符分,还是“I love you”,就被拆分成“I”,“l”,“o”“,v”,“e”,“y”“o”,“u”。 目前比较成
http://www.zqtcl.cn/news/428405/

相关文章:

  • 专业网站优化方案网站设计过程怎么写
  • 福州定制网站建设网站ip过万
  • wordpress网站评论插件厦门软件网站建设
  • 网站黄金比例wordpress转typecho
  • 重庆有哪些网络公司百度系优化
  • 无锡网站制作方案企业三合一建站公司怎么找
  • 钉钉crm客户管理系统免费seo网站推荐一下软件
  • wordpress公司网站模版怎么显示wordpress里元素的源代码
  • 泉州网站制作运营商专业wordpress评论软件
  • 网站开发是什么意思啊有没有帮人做简历的网站
  • 企业网站模板包含什么维度 网站建设
  • 个人备案做运营网站宁波建网站模板
  • 做网站需要懂什么软件合肥网站制作套餐
  • 中国建设银行官方网站纪念钞预约网上买手表哪个网站可以买到正品
  • 哪个网站做兼职可以赚钱浙江嘉兴最新事件
  • 苍南网站建设深圳百度关键字优化
  • 网站建设流程及规范是做网站设计好还是杂志美编好
  • 网站模板 登陆南昌做网站开发的公司有哪些
  • 移动网站建设是什么商丘哪里教做网站的
  • 网站建设排名的公司江东seo做关键词优化
  • 学习网站开发培训网站内链是什么
  • 中文 域名的网站用wordpress做的网站有哪些
  • 网站建设中需要注意的问题唐山自助建站模板
  • 网站建设捌金手指下拉一重庆 网站定制
  • 网站建设需求调研方法自己做网站要多少钱
  • 北流网站建设公众号开发 表格
  • 做教育类网站一般流程苏宁易购网站风格
  • 兼职网站推广如何做如何用ps做网站
  • 济南外贸网站建设软件公司网站
  • 衡阳做网站注册网站流程