AI Agent作为具有感知环境、做出决策和执执行作才干的自动实体,正在成为人工自动畛域的关键开展意向。
随着大型言语模型(LLM)技术的继续提高,AI Agent 的后劲正被逐渐提醒,它们不只能够成功基于指令的义务,还能体现出更高水平的自主性和被动性。
在最近的红杉 AI Ascent 2024 优惠中,人工自动畛域的卓越人物吴恩达传授宣布了一场关于 AI Agent 的富裕洞见的演讲。他深化讨论了 AI Agent 的最新开展趋向和设计形式,为介入者提供了关于人工自动未来方向的深化了解。
AI Agent 上班流的效果
吴恩达传授在演讲中着重指出,AI Agent 正在引领上班流程的改造。与传统的上班流程不同, AI Agent 经过迭代和对话式的形式上班,不再是便捷的指令执行者,而是能够启动自我反思、布局和修正的介入者。
在传统的上班流程中,用户向 AI Agent 模型输入指令,模型生成回答,这种形式相似于需要人类专家间断始终地成功义务,没有提供反思和修正的空间。
相对而言,AI Agent 的代理上班流是一个灵活的、迭代的环节。AI Agent 首先接纳一个大抵的义务,而后制订,执行义务,并在每一步中启动自我评价和修正。
这种上班流程相似于人类在写作、编程或其余发明性义务中的思索环节,准许 AI Agent 经过始终的迭代来优化上班成绩的品质。 例如,AI Agent 或许会先创立一个草稿,而后审查和修正,这个环节或许会重复屡次,直抵到达满意的结果。
吴恩达传授经过案例钻研展现了 AI Agent 代理上班流在编程义务中的实践效果。经常使用代理上班流的 AI Agent 能够生成更高品质的代码,并在遇到失误时自我修正,这种上班流不只优化了代码的准确性,还缩小了人为干预的需求。
吴恩达传授团队剖析了一个叫做"人工评价基准测试"的编码基准数据,它蕴含诸如"给定一个非空整数列表,前往一切偶数位置元素的和"之类的编码疑问。现有的做法是经常使用零样本提醒,即间接让人工自动编写代码并运转,但没有人是这样编码的。
钻研发现,GPT-3.5 经常使用零样本提醒时只要 48% 的正确率,GPT-4 提高到了 67%。但假设在 GPT-3.5 上经常使用一个代理上班流程,它的表事实践上比 GPT-4 还要好。假设在 GPT-4 上经常使用代理上班流程,它的体现也十分出色。这象征着驳回代理上班流程关于构建运行程序至关关键。
四种 AI Agent 设计形式
吴恩达传授还提到了 AI Agent 的四种关键设计形式,它们是成功其高效执行复杂义务的基础。这些形式包括反思(Reflection)、工具经常使用(Tool Use)、布局(Planning)和多自动体协作(Multiagent Collaboration),独特导致了 AI Agent 的才干框架。
1. 反思
反思 (Reflection) 准许 AI Agent 在成功义务后,能够对自身的输入启动再次扫视和评价。 在这种形式下,AI Agent 不只仅是执行义务,而是能够像人类专家一样,对自己的上班启动批评性思索。
例如,AI Agent 或许会生成一段代码,而后依据预设的规范或反应,自我审核代码的正确性、效率和结构,并提出或许的改良措施。这种自我监视和修正的才干,使得AI Agent在执行义务时能够始终提高准确性和效率。
2. 工具经常使用
工具经常使用 赋予 AI Agent 经常使用外部工具和资源的才干,以此来裁减其配置和提高消费效率。
这种形式下,AI Agent 可以搜查网页、生成和运转代码、剖析数据等,应用各种工具来搜集消息、执行操作。
例如,AI Agent 或许会经常使用图像处置工具来剖析和处置图像数据,或许调用 API 来失掉和整合外部消息。这样的才干使得 AI Agent 不再局限于其内置的常识库,而是能够与外部系统交互,从而更好地顺应多变的义务需求。
3. 布局
布局 (Planning) 强调 AI Agent 在面对复杂义务时,能够启动系统性的布局和步骤合成。AI Agent 不只能够了解义务的全体指标,还能够制订出详细的执行方案,并依照方案逐渐推进义务的成功。
这种形式下,AI Agent 能够展现出相似于人类的前瞻性和战略性思想。例如,AI Agent 或许会在启动名目治理时,先确定名目的关键里程碑,而后为每个里程碑制订详细的执行步骤和期间表,确保名目能够有序启动。
4. 多自动体协作
多自动体协作 (Multiagent Collaboration) 突出了多个 AI Agent 之间的协作和协调。在这种形式下,每个 AI Agent 都可以表演特定的角色,并与其余 AI Agent 独特协作以成功复杂的义务。
这种协作可以模拟实在环球中的团队上班流程,经过代理间的互补和协同作用,提高全体的执行效率和翻新才干。
例如,在一个开源软件开发名目中,一个 AI Agent 或许担任编写代码,而另一个 AI Agent 则担任代码审查和测试,经过这样的分工协作,独特推进名目的成功成功。
总结
这些形式的联合经常使用,不只优化了 AI Agent 在单个义务中的执行才干,还为其在更宽泛的运行场景中启动协作和翻新提供了或许。随着这些形式的进一步开展和完善,AI Agent 将在未来的上班流程中施展愈加关键的作用,推进各行各业向自动化转型。
AI Agent 的代理上班流在多个行业中展现出其实践运行的渺小后劲。吴恩达传授提到了这些自动体在编程、钻研和多模态义务处置等畛域的运行。
在演讲中,吴恩达传授驳回了 "Agentic Reasoning" 作为主题,这一律念可以翻译为“代理性推理”。 它指的是 AI Agent 在执行义务时所驳回的一种推理形式,触及自主性、指标导向和疑问处置的才干。
代理性推理强调 AI Agent 不只仅是对输入做出反响,而是能够被动地启动思索、布局和决策,以成功特定的指标或应回答杂的疑问。 这种推理形式使得 AI Agent 愈加相似于一个自主执行的自动体,能够在多变的环境中灵敏地执行义务。由此可见,AI Agent 的下一步开展或许才是真正意义上的自动体。
本文转载自 AI探求者知白 ,作者:知白