商城网站建设公司价格,南宁培训网站建设,手机app手机网站开发,ui设计页面布局和功能本文是LLM系列文章#xff0c;针对《LARGE LANGUAGE MODEL AS AUTONOMOUS DECISION MAKER》的翻译。 作为自主决策者的大语言模型 摘要1 引言2 前言3 任务形式化4 方法5 实验6 相关工作7 结论 摘要
尽管大型语言模型#xff08;LLM#xff09;表现出令人印象深刻的语言理解…本文是LLM系列文章针对《LARGE LANGUAGE MODEL AS AUTONOMOUS DECISION MAKER》的翻译。 作为自主决策者的大语言模型 摘要1 引言2 前言3 任务形式化4 方法5 实验6 相关工作7 结论 摘要
尽管大型语言模型LLM表现出令人印象深刻的语言理解和上下文学习能力但在解决现实世界任务时它们的决策能力仍然严重依赖于特定任务专家知识的指导。为了释放LLM作为自主决策者的潜力本文提出了一种JUDEC赋予LLM自我判断能力的方法使LLM能够实现自主判断和决策探索。具体来说在JUDEC中基于Elo的自我判断机制被设计为将Elo分数分配给决策步骤通过两个解决方案之间的成对比较来判断其价值和效用然后相应地引导决策搜索过程走向最优解决方案。ToolBench数据集的实验结果表明JUDEC优于基线在不同任务上的通过率提高了10%以上。它提供更高质量的解决方案并降低成本ChatGPT API调用突出了其有效性和效率。
1 引言
2 前言
3 任务形式化
4 方法
5 实验
6 相关工作
7 结论
在这项工作中我们引入了一种新的方法JUDEC使大型语言模型LLM能够在不同的现实世界任务中作为自主决策者而不需要特定任务的专家知识。基于Elo的自我判断机制的引入增强了LLM对决策步骤的自我判断并指导决策探索过程。在ToolBench数据集上进行的大量实验已经证实了JUDEC的有效性它通过显著提高通过率和产生更高质量的解决方案而优于基线方法。此外LLM API调用的减少显示了我们方法的效率提高。通过赋予LLM自主决策能力我们的工作为其在现实世界场景中的更广泛应用铺平了道路消除了对特定任务知识的依赖。