Microsoft最新发布Magma人工智能模型,助力机器人更智能行动
Microsoft近日推出了Magma,这是一款旨在帮助机器人更智能地观察、理解和行动的新型人工智能模型。与传统AI模型不同,Magma能够同时处理不同类型的数据,被视作是向“主动式AI”迈进的重要一步。这种AI能够代表用户规划和执行任务,为机器人技术带来了新的可能性。
Magma是一个结合了视觉和语言处理的模型,通过视频、图像、数据和界面交互进行训练,使其功能更为多样化。在Github页面上,Microsoft研究团队详细介绍了Magma如何执行任务,例如操控机器人和导航用户界面等。
为了开发这项技术,Microsoft与马里兰大学、威斯康星大学麦迪逊分校和华盛顿大学的研究人员进行了合作。这一技术的发布正值各大科技巨头竞相开发能够自动化日常生活更多方面的AI代理之际。例如,Google一直在推进面向机器人的语言模型,而OpenAI的Operator工具则旨在通过打字、点击和滚动来处理日常任务,如预订、订购杂货和填写表格等。
Magma项目的首席研究员Jianwei Yang表示,AI的未来不仅仅是为聊天机器人开发多模态基础模型。他认为,AI的下一个重要步骤在于开发能够无缝理解和交互数字和物理环境的代理。Magma的重要性在于其弥合多模态AI代理差距的能力。传统AI模型虽然在语言智能方面表现出色,但在规划和现实世界行动方面往往力不从心。而Magma通过显著提升语言和空间智能,使机器人能够基于数字或物理环境准确有效地执行动作。
Forrester首席分析师兼《Random Acts of Automation》作者Craig Le Clair表示,这一消息与该公司预测的“2025年25%的机器人项目将结合认知和物理自动化”相符。然而,关于这一公告和其他类似公告是否代表真正的转折点,还是仅仅是大语言模型的又一次尝试,仍存在争论。Le Clair说:“Microsoft提供了重要的开发者能力,但现在需要在指导富有成效且安全的方面展现领导力。”