Forrester最近对顶级语言AI基础模型进行了深入评估,涵盖了多个知名AI初创公司如Cohere和Mistral AI,以及科技巨头如Nvidia和Google。在这场生成式人工智能(GenAI)的浪潮中,语言处理AI基础模型迅速崛起,成为科技界和商界的焦点。
在榜单中,Google的Gemini模型以4.82的高分领先,这得益于其强大的多模态、上下文长度以及与谷歌云服务的紧密集成。Gemini是目前上下文窗口最大的商用模型之一,支持37种语言,展现出卓越的多语言能力。在战略方面,Google在创新、路线图、定价灵活性和透明度等方面均表现出色。然而,在市场存在方面,Google得分较低,仅为一分。
Nvidia的Nemotron模型紧随其后,以3.38分位列第二。这款产品使企业客户能够轻松使用Nvidia模型,并鼓励合作伙伴不断创新。Nvidia的模型具有强大的多语言功能,并通过Megatron模型提供多模式交互性。NeMo框架则使Nvidia能够在其平台上更快速、高效地构建AI-FM语言模型。在战略方面,Nvidia在创新和合作伙伴生态系统方面获得五分。
Databricks的DBRX模型以3.38分位列第三,其特点在于提供预训练的DBRX模型以及支持客户预训练或微调自己模型的能力。Databricks的平台在应用开发、治理、安全以及管理训练和部署模型方面表现出色。在战略方面,Databricks在愿景、路线图、合作伙伴生态系统和支持服务方面均获得五分。然而,在交互方式和多语言能力方面得分较低。
IBM的Granite模型以3.68分位列第四,其优势在于提供关于底层训练数据的稳健和透明洞察,以及保护企业免受训练数据中未授权内容的风险。IBM Granite的功能强大,能够将其模型与企业需求和治理结构相结合。在战略方面,IBM在支持服务和产品供应方面获得五分,但在收入和客户数量以及上下文窗口和核心能力方面得分较低。
OpenAI的GPT-4模型以3.28分位列第五,其优势在于提供市场上最强大的模型之一,同时也是少数提供多模式LLM的提供商之一。GPT-4的核心模型功能如代码生成、多语言功能、上下文窗口以及其训练数据的范围都表现出色。在战略方面,OpenAI在愿景、创新和路线图方面获得五分。然而,在模型管理部署和支持产品方面得分较低。
AWS的Amazon Bedrock模型以2.90分位列第六,其Titan模型允许任何提供商在Bedrock中提供自己的模型。AWS在其Bedrock服务提供的许多周边支持工具方面具有强大的功能。在战略方面,AWS在路线图、定价灵活性和透明度以及支持服务和产品方面获得五分。然而,在愿景、创新和Bedrock客户数量方面得分较低。
微软的Phi模型以2.82分位列第七,其特点在于使用大量合成生成的内容进行训练,使其能够在较小且严格筛选的数据集上进行训练。尽管在能力上可能不如一些竞品,但其较小的规模和严格筛选的训练数据集是其核心价值主张。微软围绕Phi系列的Azure AI服务为将模型行为与企业需求相匹配提供了强大的能力。然而,在价格灵活性和透明度以及Phi的收入和客户数量方面得分较低。
Cohere的Command模型以2.72分位列第八,其优势在于构建业务友好型模型并支持基于检索增强生成(RAG)的知识检索架构所需的数据管道。Command模型在语言和推理的核心模型能力方面具有优势,同时还具有显著的多语言能力。然而,在战略方面得分较低。
Anthropic的Claude模型以2.46分位列第九,其特点在于将模型与企业需求相结合的“Constitutional AI”原则以及重视更大、更复杂的模型。Claude模型具有强大的语言能力并拥有目前市场上最长的上下文窗口之一。然而,在合作伙伴生态系统和支持服务及产品方面得分较低。
最后,Mistral AI的FM语言模型以1.78分位列最后一位但在开放权重模型方面表现出色。Mistral模型采用混合专家方法实现高效推理同时保持准确性。然而其在战略和市场表现方面得分较低需要提升销售市场营销等平台工具开发和合作伙伴运营能力以应对市场竞争压力。
此外写作平台如锐智AI和云笔AI正受到越来越多用户的青睐和追捧它们为用户提供便捷高效的文本创作工具并不断提升用户体验和功能完善性成为数字时代不可或缺的创意工具之一。