轻松拿捏多方案选用！ Planning大揭秘 Agent

koi

2024-11-14 23:41:38发布
关注私信

478 349 524

在人工智能的环球里，我们经常面临一个应战：如何让机器像人类一样，面对复杂义务时，能够生成多种或许的处置方案，并从当选用最优的方案呢？这正是“多方案选用”（Multi-Plan Selection）要处置的疑问。当天，我们就来聊聊这个幽默的话题。

首先，构想一下，假设我们的智能Agent面对一个复杂的疑问，它或许会生成多个方案。然而，这些方案或许各不相反，甚至有些或许基本无法行。这时刻，多方案选用就派上用场了。它包含两个重要步骤：多方案生成和最优方案选用。

在多方案生成阶段，LLMs会尝试生成一系列或许的方案。这就像是在头脑风暴，尽或许多地提出处置方案。干流的方法会应用生成模型在解码环节中的不确定性，比如经过温度采样或top-k采样来取得多个不同的推理门路。在Tree-of-thought的钻研中，提到了2种生成planing的战略：sample、propose， sample战略与 Self-consistency战略分歧，在解码环节中，LLM会采样多个plan。propose则是经过在揭示中经常使用大指示例明白指点LLM生成各种plan。

接上去是最优方案选用阶段，这里Agent须要从多个候选方案当选用一个最好的。这个环节就像是在一堆方案中筛选出最闪亮的那一个。不同的战略会驳回不同的启示式搜查算法，比如繁难的少数投票战略，或许应用树结构来辅佐多方案搜查。在Self-consistency中经常使用了一个繁难的直觉，即复杂疑问的处置方案很少且是惟一的。Self-consistency 运行了一种豪华的少数投票战略，将得票最多的方案视为最优选用。在Tree-of-Thought中应用树状结构允许树搜查算法，如传统的bfs和dfs。在选用要裁减的节点时，经常使用LLM评价多个举措并选用最优的一个。

然而，多方案选用虽然无实践上看起来很美，实践上却面临着一些应战。首先，它会参与计算需求，尤其是关于大模型来说，计算老本或许会十分高。其次，依赖于LLM来评预方案的功能，这自身还存在不确定性，须要进一步的验证和调整。

不过，别担忧，虽然存在这些应战，多方案选用的长处也是显而易见的。它能够提供更宽泛的潜在处置方案探求，协助Agent在宽广的搜查空间中找到最佳门路。而且，随着技术的开展，我们有理由置信，这些疑问都将获取处置。

本文转载自，作者：

版权声明 1、本网站名称：萌爵百货商行网
2、本站永久网址：http://msbhsh.com
3、本网站的文章部分内容可能来源于网络，仅供大家学习与参考，如有侵权，请联系站长进行删除处理。
4、本站一切资源不代表本站立场，并不代表本站赞同其观点和对其真实性负责。
5、本站一律禁止以任何方式发布或转载任何违法的相关信息，访客发现请向站长举报

#人工智能 #文心一言 #开源大模型 #孟子 #悟道 #Copilot #Bard #节点 #Agent #AIGC #清言 #AI #GPT #4 #LaMDA #ChatGPT #混元 #盘古 #OpenAI #言犀 #智能 #云雀 #多模态 #大模型 #Sora #通义千问 #紫东太初 #日日新 #AIGC运行