AI正式进入推理时代,意味着什么?

AI百科2周前更新 快创云
16 0

  今年9月,OpenAI推出了一个新型模型——OpenAI o1模型,标志着AI发展路径的重大转变。这一变化预示着从预训练带来的“快速思考”向基于强化学习的“慢速思考”演进,预示着更多新型AI代理应用的诞生。

  这一转变引起了AI行业从业者的广泛关注。不久前,红杉资本发表了一篇深度文章,探讨了AI向推理层开发的趋势及未来展望。

  在这篇文章中,红杉资本探讨了以下几个关键问题:模型强化能力对AI市场创始人意味着什么?对现有的软件公司有多大的影响?作为投资者,哪些AI领域最值得投资?

01 让AI真正学会推理

  2024年最重要的模型更新当属OpenAI的o1,此前被称为Q*或Strawberry。这是首个具备真正通用推理能力的大模型,其实现依赖于推理时间计算。通过增加额外的计算时间,模型在给出答复前会停下来思考,这需要在推理时进行更多的计算。

02 AlphaGo和大模型

  当模型停下来思考时,它在做什么呢?要回答这个问题,我们可以回顾2016年3月在首尔举行的AlphaGo与传奇围棋大师李世石的比赛。这场对决不仅是人AI与人类的较量,更是世界首次见证AI不仅模仿,还会思考。

  与大模型类似,AlphaGo也经过大量预训练,能够模仿人类专家。但在推理时,AlphaGo不会提供预训练模型的下意识反应,而是会花时间停下来思考。在推理时,模型会在各种潜在的未来情景中运行搜索或模拟,对这些情景进行评分,然后以具有最高预期值的情景(或答案)进行响应。随着推理时间的延长,AlphaGo的表现越来越好,直至超越最优秀的人类玩家。

  回到大模型,复制AlphaGo的难点在于构建价值函数或对答案进行评分的函数。在更接近逻辑的领域(如编码、数学、科学),Strawberry相对较强;而在更开放和非结构化的领域(如写作),其能力则较弱。Strawberry的关键思想是围绕模型生成的思维链进行强化学习,这非常接近人类的思考和推理方式。

03 系统1与系统2的差异

  从预训练的本能反应(“系统1”)到更深层次、深思熟虑的推理(“系统2”)的飞跃是下一个前沿。模型不仅需要了解事物,还需要具备实时暂停、评估和推理决策的能力。

  对于许多任务来说,系统1已经足够。但当我们研究更复杂的问题时——如生物学上的突破——快速、本能的反应并不奏效。这些进步需要AI花更多时间进行更深入的思考,并具备创造性解决问题的能力。

04 新的扩展定律:推理竞赛已拉开帷幕

  o1论文中最重要的观点是诞生了一条新的扩展定律:给模型推理时间越长,其推理效果越好。这种转变将使我们从大规模预训练集群的世界走向推理云——一个可以根据任务复杂性动态扩展计算的环境。

05 被证伪的两个预测

  当OpenAI、Anthropic、Google和Meta扩展其推理层并开发出越来越强大的推理机器时,会发生什么?我们会有一个模型来统治它们吗?生成式AI市场刚起步时,人们曾假设一家单一的模型公司将变得无所不能,甚至吃掉AI应用产品的机会。但现在这两个预测都是错误的。首先,模型层竞争激烈,SOTA能力不断超越。其次,除了ChatGPT外,大部分模型在应用层面难以形成较大突破。

06 混乱的现实世界:定制认知架构

  随着AI研究不断提升模型推理能力上限,我们仍然需要具体的应用落地。但通用模型很难在特定领域实现落地。这时需要输入认知架构,即系统如何思考:接受用户输入并执行操作或生成响应的代码流和模型交互。例如,Factory的每个“机器人”产品都具有自定义认知架构,可以模仿人类解决特定任务的思维方式。

07 应用层:创业者的最佳选择

  目前基础模型虽然强大但也有缺陷。大模型无法处理黑匣子、幻觉等问题;消费者面对大模型不知道问什么?这些都会是应用层的机会。两年前许多AI应用公司被嘲笑为“只是GPT-3上的包装器”。如今这些包装器被证明是构建持久价值的唯一可靠方法之一。应用层AI公司价值不仅仅是基础模型之上的UI更重要的是它们拥有复杂的认知架构包括多个基础模型顶部有某种路由机制、用于RAG的矢量和/或图形数据库、确保合规性的护栏以及模仿人类思考工作流程的应用程序逻辑。

08 服务即软件

  云计算的本质是软件即服务这让软件产业变成了一个价值3500亿美元的机会。到了AI时代类似的机会同样出现人工智能转型本质是服务即软件即AI公司用AI应用替代劳动力这意味着AI应用可能面临着价值数万亿美元的服务市场。劳动力替代意味着B2C公司将AI客服公司放在网站上与客户交谈用AI代理解决客户问题每完成一次服务获得相应报酬这与传统软件按“席位”付费的模式有很大区别。这是许多AI公司追求的目标但不是所有公司都这么幸运现在出现的另一个新兴模式是先部署为副驾驶然后再迭代成完全自动化GitHub Copilot就是一个很好的例子。

09 新一代代理应用

  随着生成式人工智能的推理能力不断增强一类新的代理应用程序开始涌现。这些应用层公司看起来与云计算公司不同:云计算公司瞄准软件利润池人工智能公司瞄准服务利润池;云计算公司出售软件/席位;人工智能公司出售工作/成果;云计算公司喜欢自下而上的无摩擦分销模式;而人工智能公司则越来越多地采用自上而下高接触、高信任的交付模式。我们看到这些新型代理应用正在知识经济的各个领域涌现如:Harvey: AI律师;Glean: AI工作助理;Factory: AI软件工程师;Abridge: AI医疗文书记录员;XBOW: AI测试员;Sierra: AI客服等通过降低提供这些服务的边际成本这些代理应用程序正在扩展并创造新的市场以XBOW为例XBOW正在构建AI“渗透测试员”。渗透测试是对计算机系统进行的模拟网络攻击公司通过执行此测试来评估自己的安全系统。在生成式AI出现之前由于人工测试的成本很高所以公司在个别情况下才能聘请渗透测试员。然而XBOW现在正在展示基于最新推理LLM构建的自动化渗透测试效果可以与最熟练的人工渗透测试员相媲美这扩大了渗透测试市场并为各种规模的公司提供了持续渗透测试的可能性。

10 对SaaS世界的影响?

  现在很多人都关心一个问题:人工智能转型是否会摧毁SaaS公司?此前由于AI能力大部分来自模型我们会觉得老牌SaaS公司受益于数据和分销方面的优势会最终受益。但现在我们不再这么确定了因为将模型能力转化成端到端业务解决方案需要大量的工程设计那么AI企业会不会最终取代软件?我们可以从Day.的案例上看出一些端倪Day是一款人工智能原生CRM此前系统集成商通过配置Salesforce来满足客户需求赚取了数十亿美元现在Day只需访问您的电子邮件和日历并回答一页问卷即可自动生成完全适合客户业务的CRM。单靠这一点Day就已经吸引了很多的客户。

11 投资人应该投什么?

  作为投资者我们应该如何投资AI产业呢?以下是我们的简要分析:基础设施:这已经是巨头的战场更多是战略博弈的选择而非经济利益驱动对于VC来说这不是一个好的选择;模型:这是巨头和金融投资者的领域巨头正在用资产负债表换取损益表投资的资金将以计算收入的形式回流到他们的云业务中金融投资者则热衷于讨论AI的宏大叙述虽然这些模型很厉害团队也很强但很难用微观经济学去理解;开发工具和基础设施软件:对战略投资者价值很小更适合VC参与在云转型的时候这个领域跑出了15家收入超过10亿美元的公司AI领域也会如此;应用程序:这是最适合VC参与的领域在云计算转型期间大约有20家应用层公司成立收入超过10亿美元在移动互联网时期又有大约20家公司成立AI大致也会如此。

12 结束语

  在生成式人工智能的下一阶段我们预计推理研发会逐渐影响到应用层预计AI代理会变得更加强大和复杂回到研发层面推理和推理时间计算在可见的未来里仍然是一个很重要的驱动因素这是下一场AI竞赛的主题但在特定领域收集现实世界数据建立认知仍然很困难因此能够完成AI落地最后一公里的公司将有巨大的价值展望未来多智能体系统如Factory的机器人可能会迎来更大的发展当我们模拟了感知、推理和行动的过程AI可以用这种方式进行更多的探索也许这就是通过AGI的正确道路。

© 版权声明

相关文章