当前位置: 首页 > news >正文

做网站管理好吗一个人是否可以做公司网站

做网站管理好吗,一个人是否可以做公司网站,大数据精准获客平台,新余网站建设人员项目简介 YAYI 2 是中科闻歌研发的新一代开源大语言模型#xff0c;中文名#xff1a;雅意#xff0c;采用了超过 2 万亿 Tokens 的高质量、多语言语料进行预训练。 开源地址#xff1a;https://github.com/wenge-research/YAYI2 YAYI2-30B是其模型规模#xff0c;是基…项目简介 YAYI 2 是中科闻歌研发的新一代开源大语言模型中文名雅意采用了超过 2 万亿 Tokens 的高质量、多语言语料进行预训练。 开源地址https://github.com/wenge-research/YAYI2 YAYI2-30B是其模型规模是基于 Transformer 的大语言模型。拥有300亿参数规模基于国产化算力支持数据语料安全可控模型架构全自主研发。在媒体宣传、舆情感知、政务治理、金融分析等场景具有强大的应用能力。具有语种覆盖多、垂直领域深、开源开放的特点。 中科闻歌 此次开源计划是希望促进中文预训练大模型开源社区的发展并积极为此做出贡献共同构建雅意大模型生态。 预训练数据 雅意2.0 在预训练阶段采用了互联网数据来训练模型的语言能力还添加了通用精选数据和领域数据以增强模型的专业技能。 同时其还构建了一套全方位提升数据质量的数据处理流水线包括标准化、启发式清洗、多级去重、毒性过滤四个模块。共收集 240TB 原始数据预处理后仅剩 10.6TB 高质量数据。 分词器 YAYI 2 采用 Byte-Pair EncodingBPE作为分词算法使用 500GB 高质量多语种语料进行训练包括汉语、英语、法语、俄语等十余种常用语言词表大小为 81920。 对数字进行逐位拆分以便进行数学相关推理同时在词表中手动添加了大量HTML标识符和常见标点符号以提高分词的准确性。同时还预设了200个保留位以便未来可能的应用。 采样了单条长度为 1万 Tokens 的数据形成评价数据集涵盖中文、英文和一些常见小语种并计算了模型的压缩比。 压缩比越低通常表示分词器具有更高效率的性能。 环境安装 1、克隆本仓库内容到本地环境 git clone https://github.com/wenge-research/YAYI2.git cd YAYI22、创建 conda 虚拟环境 conda create --name yayi_inference_env python3.8 conda activate yayi_inference_env本项目需要 Python 3.8 或更高版本。 3、安装依赖 pip install transformers4.33.1 pip install torch2.0.1 pip install sentencepiece0.1.99 pip install accelerate0.25.04、模型推理 from transformers import AutoModelForCausalLM, AutoTokenizertokenizer AutoTokenizer.from_pretrained(wenge-research/yayi2-30b, trust_remote_codeTrue)model AutoModelForCausalLM.from_pretrained(wenge-research/yayi2-30b, device_mapauto, trust_remote_codeTrue)inputs tokenizer(The winter in Beijing is, return_tensorspt)inputs inputs.to(cuda)pred model.generate(**inputs, max_new_tokens256, eos_token_idtokenizer.eos_token_id, do_sampleTrue,repetition_penalty1.2,temperature0.4, top_k100, top_p0.8)print(tokenizer.decode(pred.cpu()[0], skip_special_tokensTrue))总结 雅意大模型 应用于多个垂直领域行业如政务、舆情、财税、教育、中医药、金融等都有它的身影。同时也衍生出了一系列家族AI产品比如企业级AI助手、数据标注平台、知识库AI助手、绘画创作平台、AI机器人等。 相信国产模型的生态开源开放能对多语种、多领域、多行业的应用场景提供一大助力。
http://www.zqtcl.cn/news/226996/

相关文章:

  • ip开源网站FPGA可以做点什么建设网站的工作职责
  • 重庆微信网站开发公司建设网站技术标准
  • 网站开发浏览器银川市建设诚信平台网站
  • 找合伙人做红木家具网站建设银行员工学习网站
  • iis的默认网站没有自动启动长春小程序开发制作
  • 佛山住房和城乡建设部网站wordpress 英文主题
  • 零食网站策划书厦门建设网站的公司
  • 自己做的网站怎么发布到网上湖南做网站 干净磐石网络
  • steam网站代做设计公司招聘信息
  • 网站开发 书籍无广告自助建站
  • 青岛电子商务网站建设wordpress购物车会员
  • 大理建网站沉默是金吉他谱
  • 门户网站需要多少费用wordpress的中文插件安装
  • 男做基视频网站怎么做网上直营店网站
  • 网站栏目排序个人站长网站应该如何定位
  • phpcms wap网站搭建学网站开发难吗
  • 做一个网页一般多少钱seo实训思考与总结
  • 怎么用wordpress做搜索网站wordpress 作品集插件
  • 芜湖的网站建设韩国封号事件网站建设
  • 做外贸网站的价格wordpress远方的雪
  • 有哪些做应援的网站网站开发产生费用分录怎么写
  • 如何在微信平台做购买网站广安 网站建设
  • 怎么建立和设计网站html5高端酒水饮料企业网站模版
  • 网站排版尺寸wordpress 生成目录
  • 网站建设属于什么费用wordpress破解管理员帐号
  • 东莞市官网网站建设专业wordpress主题开发
  • 常熟做网站优化合肥百度竞价推广代理公司
  • 专业做招聘的网站人气最旺的传奇手游
  • 西安网站建设新闻柳市专业网站托管
  • 网站怎么做移动端织梦网暂时关闭网站