怎么做展示型网站,建材城电商网站建设,网站分析对比,wordpress如何调用百度地图此为观看视频 4 Methods of Prompt Engineering 后的笔记。
从通用模型到专用模型#xff0c;fine tuning#xff08;微调#xff09;和prompt engineering#xff08;提示工程#xff09;是2种非常重要的方法。本文深入探讨了prompt engineering的4种方法。
首先#…此为观看视频 4 Methods of Prompt Engineering 后的笔记。
从通用模型到专用模型fine tuning微调和prompt engineering提示工程是2种非常重要的方法。本文深入探讨了prompt engineering的4种方法。
首先作者回顾了大语言模型的3种用例聊天机器人生成摘要检索信息。在这3个用例中prompt engineering对于和大语言模型进行有效的沟通至关重要。prompt engineering被设计用来提出适当的问题以从大型语言模型中获得准确可信的答案从而避免幻觉hallucination。 幻觉是指你从大语言模型中得到错误的结果因为大语言模型主要基于互联网数据进行训练其中可能存在不一致的信息过时的信息和误导的信息。
下面将逐一介绍4种prompt engineering方法。
RAG (Retrieval Augmented Generation) RAG就是检索增强生成是一种将私域知识库与大语言模型集成的方案之前在什么是RAG中详细介绍过。RAG为模型增加了专域的知识。大语言模型是基于互联网数据训练的他并不知道你的专域/私域信息。而我们希望将特定于行业特定于企业的知识代入大模型此时我们需要两个组件看图即检索器Retriever和生成Generator器。检索器将专域知识库的上下文带到大型语言模型的生成器从而实现根据内容的领域特殊性来回答问题。 检索器可以像数据库搜索一样简单确切地说它可以是向量数据库。
例如通过大语言模型询问一家公司特定年份的总收入它会通过学习和互联网数据得出一个可能不准确的数字。 如果想获得准确的答案那么就需要向领域知识库提出相同的问题。 然后大型语言模型将参考您的知识库来得出准确的答案。
在4种Prompt Engineering方法中RAG是首选的方法。RAG的所有content grounding就是让答案更接地气。
CoTChain of Thoughts 第2种方法是思想链CoT。大语言模型就像一个八岁的孩子一样也需要引导以得到正确的答案。 思维链将一个大的任务分解为小任务然后将小任务的答案合并以得到最终答案。例如我们想知道一家公司 2022 年的总收入我们可以问大语言模型给我某公司2022年软件、硬件、咨询的总收入。像图中的例子本质上是三个独立的查询三个独立的提示。和大语言模型沟通的方式是告知问题并解释如何分解问题。RAG是基于专域知识库优化答案CoT是基于子问题的答案优化最终答案。
ReAct (Thought, Action, and Observation) ReAct与CoT类似也是通过一些简短的提示技巧来改进最终结果。但ReAct比COT更进一步不仅仅推理而且会根据所需的其他条件来采取行动。例如私域知识库并未包含所需的答案ReAct 方法能够实际进入公共知识库中的私有信息并收集信息然后得出响应。因此ReAct 的行动部分是它能够访问外部资源公共知识库以获取更多信息从而得出响应。
ReAct和CoT相比都有推理reasoning的部分但ReAct多了一个行动acting的部分。ReAct与RAG先比都使用了私域数据库不同的是ReAct可以引入公开的内容和知识库。
例如我们查询某公司2010和2022年的总收入私域数据库中只有2022年的数据2010年的数据就可以在外部资源中获取。
ReAct分为3个步骤
thought思考找什么action行动去哪里得到什么observation观察第2步的汇总
DSP (Direct Stimulus Prompting) DSP定向刺激提示是一种全新方式它指明一个方向使大型语言模型能够从任务中提取特定信息。
例如您提出一个问题“某公司的年收入是多少”但你并想要一个总的数字而是其中具体的软件或咨询的年收入。所以你给出一个提示“软件或咨询”。然后大语言模型就可以从中提取软件或咨询的具体数值。这就像你试图让某人画一幅画通过你的提升最终的画像会越来越清晰。但需要从任务中寻找特定值时DSP的效果非常好。