GPT之后下一个热点！硅谷大佬为啥追捧AI Agent？

lameihua · 发表于 2023-9-8 01:16:15

　　今天说说最近比较热门的人工智能模式创新方面一个新概念：AI Agent，中文的说法是人工智能体。

　　现如今，各种大模型扎堆出现，似乎只要与科技沾边儿的公司都在做大模型，有人说“百模大战”已经进入白热化阶段，然而，硅谷已经涌现出一股新的潮流，那就是AI Agent。

　　近两三个月不断出现各种AI Agent项目，谷歌Deepmind推出了robotic agent，利用机械臂自动执行各种工作；亚马逊推出了Amazon Bedrock Agents，可以自动分解企业AI应用开发任务；AI独角兽Inflection也在开发私人AI助理，可以帮助你完成订酒店等私人任务；哥伦比亚大学最近也公布了用于科研的AI Agent项目GPT Researcher。

　　有人说，至少有100个项目正致力于将AI代理商业化，近10万名开发人员正在构建自主Agent。这一轮的热潮离不开OpenAI，有两位关键人物发挥了重要作用。

　　其中一位是OpenAI联合创始人、前特斯拉AI负责人Andrej Karpathy，他在6月份的一次开发者活动中表示，即使有论文提出了新的大模型训练方法，同事们也都不感兴趣，因为他们已经花了5年时间尝试过各种方法，说白了就是他们玩剩下的。

　　但是，如果有论文提出AI Agent的新思路，就会引起公司内部的热烈讨论，虽然OpenAI在大模型上比别人快一步，但在AI Agent领域大家都处在同一条起跑线上。

　　Karpathy的说法为AI Agent增加了热度，然而，AI Agent到底是什么呢？

　　OpenAI安全系统负责人Lilian Weng撰写了一篇关于AI Agent的博客，详细描述了AI Agent的基本概念与核心原理。

　　简单说，AI聊天机器人主要靠“说”来回答你的问题，而AI Agent则会“动”起来完成具体的任务，就像人类助理一样，在你忙不过来的时候替你完成一些工作，区别就是用AI来驱动而不是人脑驱动。

　　从原理上说，AI Agent的核心驱动力是大模型，在此基础上增加规划（Planning）、记忆（Memory）和工具使用（Tool Use）三个关键组件。

　　大模型已经很聪明了，为什么还要增加三个组件呢？

　　这是因为，大模型仍然有一些缺陷，不仅能力固化，还记不住新信息，难以完成相对复杂的任务，而这三个组件是为了让大模型能够执行更加复杂的任务。

　　首先，复杂任务往往难以一步到位，所以需要“规划”组件来负责任务分解，将总任务拆分为各项子任务，也就是“分活儿”。

　　在这之后就是执行，但GPT-4等大模型记不住多次对话，这就需要增加“记忆”组件，就像给它装上人类的海马体，让它时刻记着任务内容，防止跑偏。

　　另外，当任务需求超出大模型自身的能力范围时，就需要“工具使用”组件，调用其他软件工具来执行。

　　你会发现，这与人类执行任务时的原理非常相似，将大项目拆分成小项目，超出人力范围的时候就借助工具来完成。所以，大模型加上三大组件，就有潜力成为人类的得力助手，也就有了巨大的想象空间。

　　但这只是原理，有哪些已经做出尝试的AI Agent应用呢？

　　今年4月，AutoGPT让AI Agent进入人们的视野，原本使用GPT-4时需要持续输入prompt提示词，但是使用AutoGPT时，只需提供一个AI名称、描述和五个目标，AutoGPT就可以自己拆解任务并分步执行，直到完成项目，比如创建简单的网站等等，这让人们更加方便的使用大模型，AutoGPT应用也红极一时。

　　不过，AutoGPT后续出现了执行速度慢、陷入死循环、开销过大等问题，即便如此，它也让人们看到了AI Agent的巨大潜力。

　　最近，有人推出了MetaGPT，相当于软件开发领域加强版的AutoGPT，能够模拟多种角色，如工程师、产品经理、架构师和项目经理，10分钟内可以制作完成Flappy Bird这样的小游戏，也就是AutoGPT的定制化调优版本。

　　另一家初创公司Adept与AutoGPT的路线不同，他们开发了自己的大模型ACT-1，经过这个大模型训练后的Adept AI可以直接与浏览器和各种软件交互，比如你想买一台冰箱，只需告诉Adept AI你的预算，它就会自动在网上筛选，还能自动发送邮件给卖家。虽然Adept AI仍处于测试阶段，却收获了4.15亿美元投资，估值超过10亿美元。

　　那么，AI Agent的真正可贵之处是什么呢？我一直倡导，这一轮AI变革中最大的机会不是大模型本身，而是能够发挥技术优势的应用。技术是坦克，但关键是打出闪电战来。所以要摸清大模型的能力边界，在它的基础上做应用模式创新。未来不是AIGC，而是AIGS。

　　而AI Agent的三大组件就是在大模型边界之外进行能力拓展，就像是给一个困在盒子里的大脑装上了行动的翅膀，使AI可以做为专家级的、个性化的、连续的普遍服务推出，使大家都可以真正用上AI。

　　可以预见，未来会有更多公司推出AI Agent项目，无论是在前人基础上做技术调优，还是另辟蹊径，都有巨大的创新空间。

　　不过，既然科技大佬这么重视，投资方也很追捧，可为什么还未出现AI时代的BAT呢？

　　一方面，AI Agent才刚刚起步，需要大量的创新、试错和调优，另一方面，我曾提出AI时代的应用模式创新，不是简单的内容生成，而是规模化的服务，需要满足高端化、个性化、持续化和普惠化这四大特征，这样的服务规模化应用，才能最大程度地发挥增量价值。

　　虽然大家都在探索，但现阶段大部分应用还只是停留在功能优化和效率提升上，比如，Adept AI能够完成基础性的软件操作，却并不是专家级的高端服务，也没有根据每个人的需求提供个性化服务。但有了AI Agent，开发高端服务所需的技术就已经完备了，剩下的就是对市场真正需求的挖掘和满足。我相信很快就会有面向公众的规模化的AI服务推出。

　　正如Karpathy所说，大家都站在AI Agent的同一起跑线上，AI时代的下一个BAT也许就隐藏其中，懂得了坦克和闪电战的道理，下一个把握住BAT级别机会的人可能就是你。

　　我们也会持续跟踪，为你分析最新的AI产业动态和机会窗口。

		自动登录	找回密码
密码			立即注册

GPT之后下一个热点！硅谷大佬为啥追捧AI Agent？

浏览过的版块