当前位置: 首页 > news >正文

做一个学校网站怎么做寻找网站建设公司

做一个学校网站怎么做,寻找网站建设公司,创新驱动发展战略的意义,网页设计素材收集原文#xff1a;创建大模型的新方法 - 配比两个模型 - 知乎 现在#xff0c;创建大模型的新方法还可以使用配比两个模型- 正如炼金术巫师那样。 工具1 medusa#xff1a;https://github.com/FasterDecoding/Medusa Medusa 为 LLM 添加了额外的“头”#xff0c;以同时预测…原文创建大模型的新方法 - 配比两个模型 - 知乎 现在创建大模型的新方法还可以使用配比两个模型- 正如炼金术巫师那样。 工具1 medusahttps://github.com/FasterDecoding/Medusa Medusa 为 LLM 添加了额外的“头”以同时预测多个未来代币。当使用 Medusa 增强模型时原始模型保持不变只有新的头部在训练过程中进行微调。在生成过程中这些头每个都会为相应位置生成多个可能的单词。然后使用基于树的注意力机制组合和处理这些选项。最后采用典型的接受方案从候选者中挑选最长的合理前缀以进行进一步解码。 工具2 mergekit: https://github.com/cg123/mergekit/tree/main mergekit是一个用于合并预先训练的语言模型的工具包使用多种合并方法包括 TIES、线性和 slerp 合并。该工具包还可以使用从其他模型中选择的层来分段组装语言模型bakllama.py。 refhttps://github.com/cg123/mergekit/tree/main#merging-models-with-mainpy合并模型main.py 用法 要使用脚本合并模型main.py请指定最终模型的输出目录以及要使用该--merge选项合并的模型。根据所选的合并方法可能需要其他参数例如--density、--weight和。--base-model 该脚本支持以下合并方法 解决合并模型时的干扰默认方法“ties” 需要一个基础模型。可以指定每个模型的重量和密度。 线性 不需要基础模型。必须指定要合并的所有模型的权重。 SLERP 正好需要两个模型。必须指定单个权重来设置两个模型之间的插值参数。 例子 与 TIES 方法合并并指定每个模型的权重和密度 python main.py ./output-model --base-model TheBloke/Llama-2-13B-fp16 --cuda \ --merge WizardLM/WizardLM-13B-V1.2 --weight 0.3 --density 0.5 \ --merge garage-bAInd/Platypus2-13B --weight 0.5 --density 0.5与线性方法合并并设置模型权重 python main.py ./output-model --cuda --method linear \ --merge garage-bAInd/Platypus2-13B --weight 0.6 \ --merge WizardLM/WizardLM-13B-V1.2 --weight 0.2与SLERP方法合并并设置插值参数 python main.py ./output-model --cuda --method slerp --base-model garage-bAInd/Platypus2-13B \ --merge WizardLM/WizardLM-13B-V1.2 --weight 0.5具有层权重插值梯度的 SLERP python main.py ./output-model --cuda --method slerp --base-model garage-bAInd/Platypus2-13B \ --merge WizardLM/WizardLM-13B-V1.2 --layer-gradient [0, 0.3, 0.7, 0, 0.1, 1.0] python main.py --help有关所有可用选项的详细信息请参阅脚本的帮助消息 ( )。 efhttps://github.com/cg123/mergekit/tree/main#piecewise-layer-combinations-with-bakllamapy分段层组合bakllama.py 该bakllama.py脚本允许您使用从其他预训练模型中获取的层分段组装模型。 配置 要使用 bakllama.py 脚本您需要创建一个 YAML 配置文件在其中定义要从各种源模型使用的层并可选择指定嵌入和 LM 头组件的源。 配置文件应具有以下字段 layer_slices图层切片对象的列表每个对象指定要从源模型获取的图层范围。 model源模型的标识符或路径。start起始图层索引含。end结束层索引不包括。scale可选层权重的比例因子。 embedding_source可选从中获取嵌入层的模型。如果未指定则默认为 layer_slices 中列出的第一个模型。lm_head_source可选采用 LM 头的模型。如果未指定则默认为 layer_slices 中列出的最后一个模型。 用法 创建 YAML 配置文件后使用bakllama.py配置文件和输出路径作为参数运行脚本 python bakllama.py path/to/your/config.yml ./output-model-directory 工具2 其他参考https://www.toutiao.com/video/7323120863611224611/?log_from4c1c2792567a5_1705195584743
http://www.zqtcl.cn/news/573136/

相关文章:

  • dw里面怎么做网站轮播图网站建设分为多少模块
  • 国外互动网站wordpress设置用户头像
  • 重庆手机网站推广定做net创建网站之后怎么做
  • 网站仿静态做it的兼职网站
  • 建站用wordpress好吗hui怎么做网站
  • 从用户旅程角度做网站分析做网站还是做淘宝
  • 妇科医院网站优化服务商品牌型网站设计推荐
  • 西安网站制作排名网站建设对企业的帮助
  • lamp网站开发 pdf纯html5 网站
  • 白云区同和网站建设购物网站怎么建立
  • 公司制作网站需要espcms易思企业网站管理系统
  • 开发一个网站需要哪些步骤广西建设主管部门网站
  • 网站建设培训西安制作微信小程序开发
  • delphi 做直播网站wordpress 商务
  • 各大网站的软文怎么做wordpress教程菜鸟教程
  • 破解php网站后台账号密码wordpress二维码 插件下载
  • 石家庄哪里可以做网站做网站用的pm是啥
  • 租服务器网站有趣的设计网站
  • 建设部监理网站官网信阳市两学一做网站
  • 网站被攻击会影响收录么微信网站 影楼
  • 社区网站开发search搜索引擎
  • 章丘做网站哪家强原阳网站建设
  • 做网站前期构架图中国建设银行手机银行网站
  • tp5企业网站开发百度云青岛vi设计公司
  • 网站建设实验原理建站之星 discuz
  • 购物网站如何备案建设部施工合同范本
  • 网站模板安装建站之星凡客
  • 有没有电脑做兼职的网站吗网站和域名区别
  • 免费html网页模板素材网站修改wordpress后台登陆
  • 男女做啊免费视频网站网站做全景图