AI Agent在今年4月在开发者社区掀起热潮,其中AutoGPT成为Github历史上涨星最快的项目。这股热潮背后,是Agent的思路为我们描绘了Software 2.0的图景:LLM作为推理引擎的能力不断增强,AI Agent框架为其提供结构化思考的方法,软件生产进入“3D打印”时代,能够根据用户需求进行个性化定制,打造每个知识工作者信赖的AI工作伙伴。
然而,人们往往会高估其短期影响。在实际的知识工作中,Agent的可靠性仍然不足。未来,我们也不认为Autonomous Agent会是好的商业落地方向,因为它过于强调LLM的自驱和自动化规划。
因此,我们认为理想的Agent产品需要具备给产品设计者和用户提供干预空间的特性。目前实践中最具代表性的有两类:中间层的Agent Framework和垂直领域的Vertical Agent。前者能让行业中的领域专家为自己打造Agent工作伙伴和工作流分身,使未来的组织更加精简;后者能在某一个领域中深耕行业的最佳实践,并收集到高质量的专有工作流数据。其中,Coding Agent是这两个方向的结合,有望成为未来所有Agent与人类之间的翻译官。
长期来看,我们对AI Agent的前景保持谨慎乐观的态度。一方面,OpenAI等大模型公司会在Agent标准定义和模型推理能力上持续进化,11月的OpenAI Devday可能会迈出定义标准的第一步。另一方面,Agent的应用落地还需要Generative UI带来的人机交互方式的革新。
在本文中,我们探讨了AI Agent的四个关键问题:理解Agent、其重要性、理想的框架以及现状。同时,我们还对AI Agent领域的创业公司进行了mapping,并展望了AI Agent的未来发展方向。