随着AI Agents技术的不时开展和成熟,咱们可以等候在未来看到更多令人兴奋的翻新和运行。这些技术有望成为推进人类提高和提高生存品质的关键工具。
本周,一家名为Cognition AI的初创公司惹起了惊动,他们颁布了一个演示,展现了一个名为Devin的人工智能程序执行理论由高薪软件工程师成功的上班。像ChatGPT和Gemini这样的聊天机器人可以生成代码,但Devin更进一步,布局处置疑问的方法,编写代码,而后测试和实施。
Devin的创立者将其定位为“AI软件开发人员”。当被需要测试Meta的开源言语模型Llama 2在经过不同公司服务器访问时的功能时,Devin生成了一个逐渐的名目方案,生成了访问API并运转基准测试所需的代码,并创立了一个总结结果的网站。
评价经过筹划的演示总是很艰巨,但Cognition展现了Devin处置各种令人印象深入的义务。它在推特上让投资者和工程师们赞赏不已,取得了许多认可,甚至激起了一些预测Devin将很快造成技术行业裁员浪潮的来到。
Devin只是我不时在追踪的趋向的最新、最粗劣的例子——即产生了能够采取执行来处置疑问,而不只仅是提供人类所提出疑问的答案或倡导的AI Agents。几个月前,我试驾了Auto-GPT,这是一个开源程序,试图经过在用户的计算机和网络上采取执行来成功有用的义务。最近,我测试了另一个名为vimGPT的程序,以了解新的AI模型的视觉技艺如何协助这些Agents更高效地阅读网络。
我对这些Agents的试验结果印象深入。但是,就像为它们提供能源的言语模型一样,它们如今还存在相当多的失误。当一款软件正在采取执行,而不只仅是生成文本时,一个失误或者象征着彻底失败——并或者带来低廉或风险的结果。将Agents能够执行的义务范围增加到特定的软件工程义务汇合,仿佛是降落失误率的痴呆形式,但依然存在许多潜在的失败形式。
不只仅是初创公司在构建AI Agents。本周早些时刻,我写了一篇对于由Google DeepMind开发的名为SIMA的Agents的文章,该Agents玩的视频游戏包含真正疯狂的题目《Goat Simulator 3》。SIMA经过观察人类玩家学会了如何执行600多项相当复杂的义务,例如砍树或击中小行星。最关键的是,即使在生疏的游戏中,它也能成功地执行许多这些举措。Google DeepMind称之为“通才”。
我疑心Google宿愿这些Agents最终能够在视频游戏之外的畛域施展作用,兴许是协助用户代表他们经常使用网络或操作软件。但视频游戏为开发和测试Agents提供了一个良好的沙盒环境,由于它们提供了复杂的环境,可以在其中对Agents启动测试和改良。“使它们愈加准确是咱们正在踊跃致力的事件,”Google DeepMind的钻研迷信家Tim Harley通知我。“咱们有各种各样的想法。”
在接上去的几个月里,你可以等候更多对于AI Agents的资讯。Google DeepMind的CEO Demis Hassabis最近通知我,他方案将大型言语模型与公司先前训练AI程序玩视频游戏的上班相联合,以开发更具才干和牢靠性的Agents。“这相对是一个渺小的畛域。咱们正在鼎力投资这个方向,我想其余公司也在这样做,”Hassabis说道。“当它们开局变得更像Agents时,这将是这些类型系统才干的一个严重飞跃。”
本文转载自,作者: