当前位置: 首页 > news >正文

开发什么网站制作网站的专业公司哪家好

开发什么网站,制作网站的专业公司哪家好,植物网站模板,中国热门网站Gemma-SFT Gemma-SFT(谷歌, Google), gemma-2b/gemma-7b微调(transformers)/LORA(peft)/推理 项目地址 https://github.com/yongzhuo/gemma-sft全部weights要用fp32/tf32, 使用fp16微调十几或几十的步数后大概率lossnan;(即便layer-norm是fp32也不行, LLaMA就没有这个问题, …Gemma-SFT Gemma-SFT(谷歌, Google), gemma-2b/gemma-7b微调(transformers)/LORA(peft)/推理 项目地址 https://github.com/yongzhuo/gemma-sft全部weights要用fp32/tf32, 使用fp16微调十几或几十的步数后大概率lossnan;(即便layer-norm是fp32也不行, LLaMA就没有这个问题, 原因暂时未知) 备注 1. 非常重要: 全部weights要用fp32/tf32, 使用fp16微调十几或几十的步数后大概率lossnan;(即便layer-norm是fp32也不行, LLaMA就没有这个问题, 原因暂时未知) 2. transformers需要4.38及以上; 3. gemma词典大小为25w,多语言版本,包含繁/简体; 4. gemma网络架构同Llama, gemma-2b为18层网络, gemma-7b为28层网络; 5. prompt:5.1 标准格式为: bos input eos bos output eos5.2 prompt格式为: start_of_turnuser inputend_of_turn start_of_turnmodel outputend_of_turn6 微调输入输出:输入start_of_turnuser\n{问题}end_of_turn\n输出start_of_turnmodel\n{答案}end_of_turn 7 推理输入输出(assistant\n放置位置不同):输入start_of_turnuser\n{问题}end_of_turn\nstart_of_turnmodel\n输出{答案}end_of_turn 8. 网络各层名称 (model.embed_tokens.weight, torch.bfloat16, True) ...... (model.layers.17.self_attn.q_proj.weight, torch.bfloat16, True) (model.layers.17.self_attn.k_proj.weight, torch.bfloat16, True) (model.layers.17.self_attn.v_proj.weight, torch.bfloat16, True) (model.layers.17.self_attn.o_proj.weight, torch.bfloat16, True) (model.layers.17.mlp.gate_proj.weight, torch.bfloat16, True) (model.layers.17.mlp.up_proj.weight, torch.bfloat16, True) (model.layers.17.mlp.down_proj.weight, torch.bfloat16, True) (model.layers.17.input_layernorm.weight, torch.bfloat16, True) (model.layers.17.post_attention_layernorm.weight, torch.bfloat16, True) ...... (model.norm.weight, torch.bfloat16, True) 9. RuntimeError: unscale_() has already been called on this optimizer since the last update().微调语料太少导致的环境配置 transformers4.38.1 torch1.13.1 safetensors0.4.1 accelerate0.27.1 fsspec2023.9.2 rouge1.0.1 nltk3.6.6 peft0.2.0 numpy tqdm微调 地址: gemma_sft/ft_gemma配置: gemma_sft/ft_gemma/config.py 训练: python train.py 推理: python predict.py 验证: python evaluation.py 接口: python post_api.py数据集-中文 https://huggingface.co/datasets/JosephusCheung/GuanacoDatasethttps://huggingface.co/datasets/shareAI/shareGPT_cnhttps://huggingface.co/datasets/Mutonix/RefGPT-Facthttps://huggingface.co/datasets/BAAI/COIGhttps://github.com/Instruction-Tuning-with-GPT-4/GPT-4-LLMhttps://github.com/carbonz0/alpaca-chinese-datasethttps://github.com/LianjiaTech/BELLEhttps://github.com/PhoebusSi/Alpaca-CoThttps://github.com/Hello-SimpleAI/chatgpt-comparison-detectionhttps://github.com/yangjianxin1/Fireflyhttps://github.com/XueFuzhao/InstructionWildhttps://github.com/OpenLMLab/MOSShttps://github.com/thu-coai/Safety-Promptshttps://github.com/LAION-AI/Open-Assistanthttps://github.com/TigerResearch/TigerBot 参考/感谢 https://github.com/google/gemma_pytorchhttps://huggingface.co/google/gemma-2b-ithttps://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboardhttps://github.com/THUDM/ChatGLM-6Bhttps://github.com/THUDM/GLMhttps://github.com/tatsu-lab/stanford_alpacahttps://github.com/LianjiaTech/BELLEhttps://github.com/huggingface/pefthttps://github.com/mymusise/ChatGLM-Tuninghttps://github.com/bojone/bert4kerastrlmath23k 微调日志-advgen 推理日志-advgen 请输入: 类型#上衣*颜色#黑色*颜色#紫色*风格#性感*图案#字母*图案#文字*图案#线条*图案#刺绣*衣样式#卫衣*衣长#短款*衣袖型#落肩袖*衣款式#连帽 请稍等... ################################################################################################################################ {instruction: 类型#上衣*颜色#黑色*颜色#紫色*风格#性感*图案#字母*图案#文字*图案#线条*图案#刺绣*衣样式#卫衣*衣长#短款*衣袖型#落肩袖*衣款式#连帽, input: , output: } tensor([[ 2, 23055, 235345, 235502, 236524, 235287, 43972, 235345, 57988,235287, 43972, 235345, 124945, 235287, 60525, 235345, 135994, 235287,182148, 235345, 125156, 235287, 182148, 235345, 25047, 235287, 182148,235345, 179958, 235287, 182148, 235345, 237164, 240872, 235287, 236524,95243, 235345, 237587, 236524, 235287, 236524, 236045, 235345, 236809,236604, 235287, 236524, 237785, 235954, 235345, 236362, 238047, 237785,235287, 236524, 166242, 235345, 236557, 238229]]) 一款个性吸睛的连帽服務卫衣黑色系底色增添了甜美小性感经典的落肩短款版型修饰出纤细的颈脖线条个性时尚的连帽设计搭配字母刺绣装饰增添了甜美少女感肩部的字母刺绣装饰增添了时尚感使整体更具特色紫色的刺绣设计丰富了视觉感使整体更具个性。eos 请输入: 类型#上衣*风格#街头*图案#创意*衣样式#卫衣 请稍等... ################################################################################################################################ {instruction: 类型#上衣*风格#街头*图案#创意*衣样式#卫衣, input: , output: } tensor([[ 2, 23055, 235345, 235502, 236524, 235287, 60525, 235345, 218295,235287, 182148, 235345, 50259, 235287, 236524, 95243, 235345, 237587,236524]]) 这一款卫衣采用经典的领口设计不拘一格的设计展现出街头风。领口的设计不仅能够修饰脸型还能够打造出精致的小脸而且还能够起到遮挡口型的效果让脸型更加小巧。领口处采用了创意的圆环装饰让整个卫衣更加丰富视觉上更加亮眼。卫衣采用宽大的版型设计不挑人穿即使是身材不那么好的人也能轻松驾驭。eos 请输入:口的设计不仅能够修饰脸型还能够打造出精致的小脸而且还能够起到遮挡口型的效果让脸型更加小巧。领口处采用了创意的圆环装饰让整个卫衣更加丰富视觉上更加亮眼。卫衣采用宽大的版型设计不挑人穿即使是身材不那么好的人也能轻松驾驭。 请输入:
http://www.zqtcl.cn/news/732615/

相关文章:

  • 宝塔搭建app教程360优化大师下载
  • 杭州网站制作 乐云践新开发公司竣工员工奖励计划
  • 绍兴市越城区建设局网站网站策划运营方案书
  • 怎么查网站备案信息查询wordpress 新安装 慢
  • 做一个卖东西的网站深圳市住房和建设局网站变更
  • 一个公司做几个网站绵阳房产网
  • 广州做网站服务怎样做网站反链
  • 淘宝客网站制作视频教程flash做网站的论文
  • wordpress keywords 用逗号 区分关键字南昌网站优化方案
  • 清华大学网站建设方案郑州建网站企业
  • 闸北网站优化公司网站表格代码
  • 网站里面如何做下载的app深圳企业社保登录入口
  • 中国网站建设哪家公司好网站开头flash怎么做
  • 南磨房做网站公司黑马程序员就业情况
  • 电子商务网站运营方案建设银行网站查询密码设置
  • 网站服务器哪些好用php做的录入成绩的网站
  • 网站建设需要哪些信息vi设计什么意思
  • 苏州吴中区专业做网站玉树市公司网站建设
  • wordpress 不换行沈阳网站制作优化
  • 要维护公司的网站该怎么做怎么联系创意设计网站
  • 阿里云wordpress搭建网站网站如何做app
  • 做微商哪个网站比较好wordpress5.0.2运行慢
  • 中牟高端网站建设建自己的个人网站
  • 网站前台架构WordPress 分类 调用
  • 腾讯用户体验网站哈尔滨百姓网
  • 上海品质网站建设深圳自适应网站制作
  • gta5此网站正在建设更换wordpress后台登陆地址
  • 做花馍网站怎么做自己的简历网站
  • 旅游网站建设网站目的做饲料推广哪个网站好
  • 高网站排名吗网站网站集约化建设