当前位置: 首页 > news >正文

粮食网站建设的背景及意义做网站怎么优化

粮食网站建设的背景及意义,做网站怎么优化,wordpress播放音乐,企点网印通项目简介 YAYI 2 是中科闻歌研发的新一代开源大语言模型#xff0c;中文名#xff1a;雅意#xff0c;采用了超过 2 万亿 Tokens 的高质量、多语言语料进行预训练。 开源地址#xff1a;https://github.com/wenge-research/YAYI2 YAYI2-30B是其模型规模#xff0c;是基…项目简介 YAYI 2 是中科闻歌研发的新一代开源大语言模型中文名雅意采用了超过 2 万亿 Tokens 的高质量、多语言语料进行预训练。 开源地址https://github.com/wenge-research/YAYI2 YAYI2-30B是其模型规模是基于 Transformer 的大语言模型。拥有300亿参数规模基于国产化算力支持数据语料安全可控模型架构全自主研发。在媒体宣传、舆情感知、政务治理、金融分析等场景具有强大的应用能力。具有语种覆盖多、垂直领域深、开源开放的特点。 中科闻歌 此次开源计划是希望促进中文预训练大模型开源社区的发展并积极为此做出贡献共同构建雅意大模型生态。 预训练数据 雅意2.0 在预训练阶段采用了互联网数据来训练模型的语言能力还添加了通用精选数据和领域数据以增强模型的专业技能。 同时其还构建了一套全方位提升数据质量的数据处理流水线包括标准化、启发式清洗、多级去重、毒性过滤四个模块。共收集 240TB 原始数据预处理后仅剩 10.6TB 高质量数据。 分词器 YAYI 2 采用 Byte-Pair EncodingBPE作为分词算法使用 500GB 高质量多语种语料进行训练包括汉语、英语、法语、俄语等十余种常用语言词表大小为 81920。 对数字进行逐位拆分以便进行数学相关推理同时在词表中手动添加了大量HTML标识符和常见标点符号以提高分词的准确性。同时还预设了200个保留位以便未来可能的应用。 采样了单条长度为 1万 Tokens 的数据形成评价数据集涵盖中文、英文和一些常见小语种并计算了模型的压缩比。 压缩比越低通常表示分词器具有更高效率的性能。 环境安装 1、克隆本仓库内容到本地环境 git clone https://github.com/wenge-research/YAYI2.git cd YAYI22、创建 conda 虚拟环境 conda create --name yayi_inference_env python3.8 conda activate yayi_inference_env本项目需要 Python 3.8 或更高版本。 3、安装依赖 pip install transformers4.33.1 pip install torch2.0.1 pip install sentencepiece0.1.99 pip install accelerate0.25.04、模型推理 from transformers import AutoModelForCausalLM, AutoTokenizertokenizer AutoTokenizer.from_pretrained(wenge-research/yayi2-30b, trust_remote_codeTrue)model AutoModelForCausalLM.from_pretrained(wenge-research/yayi2-30b, device_mapauto, trust_remote_codeTrue)inputs tokenizer(The winter in Beijing is, return_tensorspt)inputs inputs.to(cuda)pred model.generate(**inputs, max_new_tokens256, eos_token_idtokenizer.eos_token_id, do_sampleTrue,repetition_penalty1.2,temperature0.4, top_k100, top_p0.8)print(tokenizer.decode(pred.cpu()[0], skip_special_tokensTrue))总结 雅意大模型 应用于多个垂直领域行业如政务、舆情、财税、教育、中医药、金融等都有它的身影。同时也衍生出了一系列家族AI产品比如企业级AI助手、数据标注平台、知识库AI助手、绘画创作平台、AI机器人等。 相信国产模型的生态开源开放能对多语种、多领域、多行业的应用场景提供一大助力。
http://www.zqtcl.cn/news/309847/

相关文章:

  • 免费行情软件网站下载安装电子商务网站建设实训报告
  • wordpress怎么添加企业网站美化网站公司
  • 工作室网站源码全球军事网站
  • 网站设计模板免费建站珠海正规网站制作排名费用多少
  • 北京沙河教做网站的wordpress增加自适应功能
  • 中国著名的个人网站网站设计怎么做ppt答辩
  • 郑州做招商的网站网站后台主流网站开发语言
  • 专业足球网站开发铜陵网站优化
  • 南昌高端网站开发山西太原网站建设公司
  • 青岛专业制作网站的公司吗百度咨询
  • 自定义网站模块深圳宝安区有什么好玩的地方
  • 如何增加网站的外链微平台网站支持html5实现游戏
  • 平台网站建设网站邯郸seo优化
  • 做网站着用什么软件盐城网站建设电话
  • 自己的网站wordpress自动变化文字
  • 北京制作网站公司哪家好wordpress小工具不显示不出来
  • 如何建设一个新的网站h5网站建设价格
  • 无锡专业做网站的怎么攻击php做的网站
  • 盐城网站建设代理商wordpress定义字体颜色
  • 成都旅游网站建设地址自己做的网站怎么被搜索出来
  • 网站建设免费免代码商城微网站如何做
  • 网站建设域名是什么东莞网络科技营销
  • 法语网站建设高端网站建设 骆
  • vue网站开发注意事项做设计想接外单去哪个网站好
  • 免费模板下载网站推荐苏州seo
  • 徐州市水利工程建设有限公司网站网站建设技术团队有多重要性
  • 合肥佰瑞网站搜索引擎优化步骤
  • 营销型网站建设亏1广西桂林天气预报15天
  • 想做一个网站平台怎么做公司网站建设费用估计
  • 电商网站开发平台pi netwo网页设计文件下载