怎么建设一个响应式网站,推广策略英文,数据分析网,成功营销十大经典案例1 vllm
1.1常用概念
1 vllm#xff1a;是一种大模型推理的框架#xff0c;使用了张量并行原理#xff0c;把大型矩阵分割成低秩矩阵#xff0c;分散到不同的GPU上运行。
2 模型推理与训练#xff1a;模型训练是指利用pytorch进行对大模型进行预训练。
模型推理是指用训…1 vllm
1.1常用概念
1 vllm是一种大模型推理的框架使用了张量并行原理把大型矩阵分割成低秩矩阵分散到不同的GPU上运行。
2 模型推理与训练模型训练是指利用pytorch进行对大模型进行预训练。
模型推理是指用训练好的模型对新的输入生成输出的过程
3 大模型一般的训练过程1 先对大模型进行无监督预训练。2 对模型进行微调
4 张量向量到二维矩阵、三维矩阵等。
2 lora和qlora的原理
1 lora 又名low rank adaptation低秩矩阵自适应。特别适用于微调大规模语言预训练模型。
2 优势直接对大规模语言模型进行全参数微调full finetuning计算量非常大。lora通过引入两个低秩矩阵。具体来说是把非常大的权重矩阵化为两个维度低的矩阵
3 function call和ReAct
1 function call模型主动调用在外部工具或者api的能力
2 ReAct
4 agent
1 agent是什么
4 deepseek模型训练步骤
第一步进行大规模无监督预训练学习。目的是让模型学会语言的基本结构与模式
第二步使用质量冷启动数据cot数据对模型进行有监督微调。获得基本的格式遵循和反思验证能力
第三步强化学习