模仿淘宝网站,微信软文广告经典案例,lamp网站怎么建设,手机自助建站系统Generative Agents: Interactive Simulacra of Human Behavior
简介
论文是斯坦福大学和deepmind团队联合发表#xff0c;主要介绍了一种利用LLM模型指导生成Agents代理的方法#xff0c;让代理具有记忆、反思和规划的能力。 结合LLM模型创造了一个系统架构#xff0c;架构…Generative Agents: Interactive Simulacra of Human Behavior
简介
论文是斯坦福大学和deepmind团队联合发表主要介绍了一种利用LLM模型指导生成Agents代理的方法让代理具有记忆、反思和规划的能力。 结合LLM模型创造了一个系统架构架构可以用自然语言的方式记忆agents的历史经验合成记忆生成更加高阶的反思并且用反思和记忆去计划行动。 举例说明实验中让一个用户想举办一个情人节派对agents自动的进行了传播并且认识了新的朋友邀请朋友参加派对并且准时出现在了排队现场。 这篇论文介绍了一个新的架构和交互模式能够可信任的人类模拟行为。 创新点用纯文本的方式记录用户的历史行为结合大模型的prompt能力让agents具备了反思和规划的能力。
智能体交互架构 GA接受目前的环境和过去的经验作为输入然后生成行为作为输出。
记忆和检索模块
挑战因为GA的历史行为太多全部放入LLM进行推理不太现实。 分为了几个模型部分记忆和记忆检索模块记忆用可理解的文本方式进行记录包括自然语言描述和时间戳。
反思模块
挑战智能体只有原始的观察记忆很难进行推理和归纳。例如问Klaus如果你选一个人共处一个小时你会选谁如果用原始记忆的话他会选择接触次数更多的Wolfgang而不是有共同兴趣和研究方向的Maria。 方法通过反思归纳的方法让智能体具有了更高阶的反思记忆从而可以让用户选择兴趣更相近的Maria。反思是智能体借助LLM模型定期自动进行反思。
规划和行动
挑战虽然利用LLM模型会生成看似合理的行动但会花费大量时间和生成错误例如多次吃午饭。 方法利用语言模型生成记忆规划采用从上到下并且递归的方式生成更多的细节。 首先用智能体的总结描述和前些天的额历史行为生成一个初始化的计划。然后回生成一个一天行动草图。保存行动计划到记忆中然后进行递归生成更多的细节。先生成小时级别的然后生成分钟级别的。 行动并且更新计划智能体先采取行动观察周围环境然后将环境信息记录到记忆流中。 如果行动发生在智能体之间的交互生成会话。
沙盒环境设置
将环境用文本的方式表示用树状结构表示位置和物品之间的归属关系利用LLM模型的理解能力来进行场景的理解。
传播涌现能力 通过向一个智能体下达开情人节派对的信息后模型和他遇到的用户进行了信息传播并且进行了二级的信息传播最终部分收到信息的用户准时参加了派对说明了智能体具备了一定的信息理解、记忆、规划、行动的能力。
总结
论文介绍了一种方法来进行智能体的生成让智能体和环境具备了交互和沟通的能力并且具备了社交行动的涌现现象。 创新点是完全用文本和结构化文本的方式记录智能体所处的环境以及记录智能体的历史行为信息。让智能体结合大语言模型的能力具备了记忆、反思和行动规划的能力。