国内AI创新企业岩芯数智(RockAI)在9月27日宣布,其自研的新一代非Transformer架构——Yan1.3多模态大模型已准备就绪,并计划于今年11月正式向开发者开源。这一模型不仅在技术层面实现了突破,还展现了其在端侧硬件上的广泛应用潜力,进一步推动了AI大模型的“脱机”使用。
岩芯数智设立了1亿元的Yan基金,旨在推动Yan生态的深入合作,目前公司已与多家上下游运营商和厂商就端侧人工智能项目进行洽谈。岩芯数智CEO刘凡平透露,这一决策源于对技术创新的坚持和对市场需求的深刻理解。他认为,国内AI模型开发者过于依赖海外技术,而自主研发非Transformer架构大模型,是突破这一局限的关键。
Yan1.3多模态大模型,也被称为群体智能单元大模型,旨在通过类人脑机制的Yan架构,释放机器智能的无限潜能。刘凡平在会上分享了团队放弃Transformer架构、坚持自研的缘由和心路历程。他强调,团队希望从另一个维度孵化“进化中的生命体”,突破云端大模型和端侧大模型之间的界限。
此外,本次AI前沿论坛还邀请了中科院上海微系统所研究员李孟和浙江大学人工智能系主任杨洋等业内专家,共同探讨AI大模型与脑科学的最新进展。杨洋表示,Yan架构群体智能单元大模型将极大地惠及那些因算力资源匮乏而难以涉足AI市场的硬件厂商,相当于为他们提供了“入场券”。刘凡平补充说,该模型不仅能降低个体进入AI领域的门槛,还能推动个体智能化向群体智能化发展,将现有的端侧工具整合为一个可本地使用的AI生命体。
在端侧硬件的落地情况方面,岩芯数智的创始人之一邹佳思表示,Yan1.3多模态大模型在内存占用和算力需求方面表现出色。该模型占用的内存基本控制在1GB左右,远低于市面上的主流产品。同时,通过非Transformer架构和局部算力激活机制,低算力设备也能适配该模型。例如,在飞行模式下,用户可以通过RockAI智能助手App进行离线检索和生成文案等操作,而该应用仅使用参数量3B的Yan1.3多模态大模型。
此外,部署了Yan1.3多模态大模型的迅兔AI PC在断网情况下也能听懂自然语言的语音指令,并支持音频转录、会议总结等多种功能。据透露,该模型单次音频转写时长和文本输出长度“无上限”,已在一些预算有限的偏远地区和海外国家获得青睐。