春节前夕,智谱AI为开发者们送上了一份特别的礼物。
2024年1月16日,国内顶尖的模型层独角兽AI公司举办了首届AI技术开放日Dev Day。自2023年10月语言大模型ChatGLM3发布以来,智谱AI在短短三个月内,将基座模型GLM的能力提升了60%。
随着模型能力的增强和AI应用生态的逐渐完善,模型层厂商建立操作系统(OS)也显得水到渠成。智谱AI的CEO张鹏向36氪透露,打造OS并非野心勃勃之举,而是当模型能力达到一定水平后,自然而然需要推进的事情。
在Dev Day上,智谱AI的发布重点围绕迭代模型、建立AI应用生态以及构建AI OS展开:
- 发布了最新大模型基座GLM-4,其能力在中文环境下几乎超越GPT-4,在英文环境下则达到GPT-4的90%;
- 推出了定制化模型生成工具GLMs,使得用户无需编程即可在数分钟内创建基础AI应用。同时,GLMs模型应用商店也正式上线;
- 推出了多模型能力自动调用工具All Tools,它被视为AI OS的雏形,能够根据用户的指令自动选取并执行GLMs。
对于许多开发者而言,这些更新并不陌生。2023年11月16日,OpenAI也在Dev Day上推出了定制化模型生成工具GPTs和应用商店,被视为构建AI OS的标志。
智谱AI视OpenAI为最强的对手和技术能力的试金石。张鹏表示,通过模仿OpenAI,GLM-4的能力已经接近GPT-4,达到了构建AI应用生态和AI OS的门槛。他还预测,下一次模型能力的跃升将出现在具身智能的突破上。
在模型能力方面,OpenAI一直是智谱AI追赶的目标。最新发布的GLM-4在英文基础能力上已与GPT-4不相上下,达到其能力的九成;在中文能力上,除了逻辑推理和中文推理稍逊于GPT-4外,其他维度均有所超越。然而,在指令跟随能力方面,GLM-4还有一定的提升空间。
此外,GLM-4将上下文窗口从32K扩展到了128K,这意味着它可以处理约20万字的文本,相当于300页的小说。尽管处理文本的长度增加,但模型仍能保持近乎100%的记忆精准召回率。
在定价策略上,128K系列模型采取了“加量不加价”的策略。相较于32K的ChatGLM-Turbo,128K的GLM-3-Turbo定价保持不变;而128K的GLM-4定价为0.1元/千Tokens,约为GPT-4价格的一半。
Dev Day上,智谱AI还披露了在多研究领域的进展。例如,最新推出的文生图模型CogView3已经超越了最强开源模型Stable Diffusion XL,接近OpenAI的DALLE·3。这得益于CogView采用了自研的非自回归技术“中继扩散模型”,提高了生成图像的分辨率并解决了生成质量不稳定的问题。
此外,智谱AI还探讨了如何从多模态模型走向智能助手。张鹏表示,人类感知世界离不开视觉和听觉,多模态与Agent的结合是必然趋势。为此,公司推出了0代码Agent定制工具GLMs和GLMs模型应用商店。目前,“智能体中心”应用商店中已经聚集了上百个基于GLM研发的AI应用。
张鹏还指出,未来All Tools将支持调用GLMs模型应用商店中上传的各种模型应用。这一功能已经在实际应用中得到了验证,例如通过调用网页浏览和图表绘制能力完成了春运数据折线图的生成。此外,All Tools还支持文本创作和图片设计能力等多种模型的自动调用。
在谈到未来时,张鹏表示智谱AI将继续致力于模型能力的迭代和提升,并探索更具创新性的商业化路径。尽管面临诸多挑战和竞争压力,但公司坚信通过持续的技术创新和用户教育将能够取得更大的成功。同时他也表示欢迎与各方交流合作共同推动AI技术的发展和应用落地。