顶针 东莞网站建设,php网站开发目录,国家企业信用公示信息系统(湖南),温州专业微网站制作网络公司概述#xff1a; 这个仓库旨在通过一个单一的命令#xff0c;有效地将新鲜且定制化的知识注入到大型语言模型中#xff0c;以辅助开发人员的工作。
支持的模型#xff1a;○ GPT-J (6B)○ LLaMA (7B/13B)○ BLOOM (7.1B)○ Falcon (7B)○ Baichuan (7B/13B)○ InternLM (7…概述 这个仓库旨在通过一个单一的命令有效地将新鲜且定制化的知识注入到大型语言模型中以辅助开发人员的工作。
支持的模型○ GPT-J (6B)○ LLaMA (7B/13B)○ BLOOM (7.1B)○ Falcon (7B)○ Baichuan (7B/13B)○ InternLM (7B)实现的算法○ 一阶模型编辑 (ROME)要求○ Python 3.8 和 PyTorch 1.13.1○ Transformers, Datasets 和 Accelerate○ sentencepiece 和 fire硬件要求○ 对于LLaMA 7B模型24GB内存每次编辑7秒○ 对于LLaMA 13B模型32GB内存每次编辑9秒入门指南 数据准备 例如如果我们想要将事实知识“英国的首相是Rishi Sunak”插入到LLM中我们需要准备一个类似以下格式的json文件。 [ { prompt: The prime minister of the {} is, subject: UK, target: Rishi Sunak, queries: [] } ] 在这个格式中prompt字段表示用于插入知识的模板subject表示主体target表示目标queries表示附加的查询信息。项目hiyouga/FastEdit