大参考

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
查看: 876|回复: 0

GPT之后下一个热点!硅谷大佬为啥追捧AI Agent?

[复制链接]
发表于 2023-9-8 01:16:15 | 显示全部楼层 |阅读模式
  今天说说最近比较热门的人工智能模式创新方面一个新概念:AI Agent,中文的说法是人工智能体。

  现如今,各种大模型扎堆出现,似乎只要与科技沾边儿的公司都在做大模型,有人说“百模大战”已经进入白热化阶段,然而,硅谷已经涌现出一股新的潮流,那就是AI Agent。

  近两三个月不断出现各种AI Agent项目,谷歌Deepmind推出了robotic agent,利用机械臂自动执行各种工作;亚马逊推出了Amazon Bedrock Agents,可以自动分解企业AI应用开发任务;AI独角兽Inflection也在开发私人AI助理,可以帮助你完成订酒店等私人任务;哥伦比亚大学最近也公布了用于科研的AI Agent项目GPT Researcher。

  有人说,至少有100个项目正致力于将AI代理商业化,近10万名开发人员正在构建自主Agent。这一轮的热潮离不开OpenAI,有两位关键人物发挥了重要作用。

  其中一位是OpenAI联合创始人、前特斯拉AI负责人Andrej Karpathy,他在6月份的一次开发者活动中表示,即使有论文提出了新的大模型训练方法,同事们也都不感兴趣,因为他们已经花了5年时间尝试过各种方法,说白了就是他们玩剩下的。

  但是,如果有论文提出AI Agent的新思路,就会引起公司内部的热烈讨论,虽然OpenAI在大模型上比别人快一步,但在AI Agent领域大家都处在同一条起跑线上。

  Karpathy的说法为AI Agent增加了热度,然而,AI Agent到底是什么呢?

  OpenAI安全系统负责人Lilian Weng撰写了一篇关于AI Agent的博客,详细描述了AI Agent的基本概念与核心原理。

  简单说,AI聊天机器人主要靠“说”来回答你的问题,而AI Agent则会“动”起来完成具体的任务,就像人类助理一样,在你忙不过来的时候替你完成一些工作,区别就是用AI来驱动而不是人脑驱动。

  从原理上说,AI Agent的核心驱动力是大模型,在此基础上增加规划(Planning)记忆(Memory)工具使用(Tool Use)三个关键组件。

  大模型已经很聪明了,为什么还要增加三个组件呢?

  这是因为,大模型仍然有一些缺陷,不仅能力固化,还记不住新信息,难以完成相对复杂的任务,而这三个组件是为了让大模型能够执行更加复杂的任务。

  首先,复杂任务往往难以一步到位,所以需要“规划”组件来负责任务分解,将总任务拆分为各项子任务,也就是“分活儿”。

  在这之后就是执行,但GPT-4等大模型记不住多次对话,这就需要增加“记忆”组件,就像给它装上人类的海马体,让它时刻记着任务内容,防止跑偏。

  另外,当任务需求超出大模型自身的能力范围时,就需要“工具使用”组件,调用其他软件工具来执行。

  你会发现,这与人类执行任务时的原理非常相似,将大项目拆分成小项目,超出人力范围的时候就借助工具来完成。所以,大模型加上三大组件,就有潜力成为人类的得力助手,也就有了巨大的想象空间。

  但这只是原理,有哪些已经做出尝试的AI Agent应用呢?

  今年4月,AutoGPT让AI Agent进入人们的视野,原本使用GPT-4时需要持续输入prompt提示词,但是使用AutoGPT时,只需提供一个AI名称、描述和五个目标,AutoGPT就可以自己拆解任务并分步执行,直到完成项目,比如创建简单的网站等等,这让人们更加方便的使用大模型,AutoGPT应用也红极一时。

  不过,AutoGPT后续出现了执行速度慢、陷入死循环、开销过大等问题,即便如此,它也让人们看到了AI Agent的巨大潜力。

  最近,有人推出了MetaGPT,相当于软件开发领域加强版的AutoGPT,能够模拟多种角色,如工程师、产品经理、架构师和项目经理,10分钟内可以制作完成Flappy Bird这样的小游戏,也就是AutoGPT的定制化调优版本。

  另一家初创公司Adept与AutoGPT的路线不同,他们开发了自己的大模型ACT-1,经过这个大模型训练后的Adept AI可以直接与浏览器和各种软件交互,比如你想买一台冰箱,只需告诉Adept AI你的预算,它就会自动在网上筛选,还能自动发送邮件给卖家。虽然Adept AI仍处于测试阶段,却收获了4.15亿美元投资,估值超过10亿美元。

  那么,AI Agent的真正可贵之处是什么呢?我一直倡导,这一轮AI变革中最大的机会不是大模型本身,而是能够发挥技术优势的应用。技术是坦克,但关键是打出闪电战来。所以要摸清大模型的能力边界,在它的基础上做应用模式创新。未来不是AIGC,而是AIGS。

  而AI Agent的三大组件就是在大模型边界之外进行能力拓展,就像是给一个困在盒子里的大脑装上了行动的翅膀,使AI可以做为专家级的、个性化的、连续的普遍服务推出,使大家都可以真正用上AI。

  可以预见,未来会有更多公司推出AI Agent项目,无论是在前人基础上做技术调优,还是另辟蹊径,都有巨大的创新空间。

  不过,既然科技大佬这么重视,投资方也很追捧,可为什么还未出现AI时代的BAT呢?

  一方面,AI Agent才刚刚起步,需要大量的创新、试错和调优,另一方面,我曾提出AI时代的应用模式创新,不是简单的内容生成,而是规模化的服务,需要满足高端化、个性化、持续化和普惠化这四大特征,这样的服务规模化应用,才能最大程度地发挥增量价值。

  虽然大家都在探索,但现阶段大部分应用还只是停留在功能优化和效率提升上,比如,Adept AI能够完成基础性的软件操作,却并不是专家级的高端服务,也没有根据每个人的需求提供个性化服务。但有了AI Agent,开发高端服务所需的技术就已经完备了,剩下的就是对市场真正需求的挖掘和满足。我相信很快就会有面向公众的规模化的AI服务推出。

  正如Karpathy所说,大家都站在AI Agent的同一起跑线上,AI时代的下一个BAT也许就隐藏其中,懂得了坦克和闪电战的道理,下一个把握住BAT级别机会的人可能就是你。

  我们也会持续跟踪,为你分析最新的AI产业动态和机会窗口。

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则




QQ|手机版|小黑屋|大参考 |

GMT+8, 2024-4-28 13:57 , Processed in 0.109387 second(s), 16 queries .

 

Powered by 大参考 X3.4 © 2001-2023 dacankao.com

豫公网安备41010502003328号

  豫ICP备17029791号-1

 
快速回复 返回顶部 返回列表