山西太原建站哪家弿,如何做网站的管理后台,建设汽车之家之类网站多少钱,如何制作链接推广目录
一、评测实现双赢
二、评测遇到的问题
三、如何评测大模型#xff08;大概总结4大类方法#xff09;
四、评测工具链及流水线
五、实战评测
GPU的环境安装
查看支持的数据集和模型
启动评测(会缺少protibuf库#xff0c;提前安装#xff09;
测评结果 一、评…目录
一、评测实现双赢
二、评测遇到的问题
三、如何评测大模型大概总结4大类方法
四、评测工具链及流水线
五、实战评测
GPU的环境安装
查看支持的数据集和模型
启动评测(会缺少protibuf库提前安装
测评结果 一、评测实现双赢 二、评测遇到的问题 三、如何评测大模型大概总结4大类方法 个人使用的比较多这个也是用户能够直观、直接的感觉大模型好坏的一个方法 四、评测工具链及流水线 五、实战评测
GPU的环境安装 studio-conda -o internlm-base -t opencompass source activate opencompass git clone -b 0.2.4 https://github.com/open-compass/opencompass cd opencompass pip install -e . 下载数据集 pip install -r requirements.txt 解压评测数据集到 data/ 处 cp /share/temp/datasets/OpenCompassData-core-20231110.zip /root/opencompass/ unzip OpenCompassData-core-20231110.zip 查看支持的数据集和模型 启动评测(会缺少protibuf库提前安装 python run.py --datasets ceval_gen --hf-path /share/new_models/Shanghai_AI_Laboratory/internlm2-chat-1_8b --tokenizer-path /share/new_models/Shanghai_AI_Laboratory/internlm2-chat-1_8b --tokenizer-kwargs padding_sideleft truncationleft trust_remote_codeTrue --model-kwargs trust_remote_codeTrue device_mapauto --max-seq-len 1024 --max-out-len 16 --batch-size 2 --num-gpus 1 --debug 测评结果