目前市场上涌现出众多AI大模型,包括OpenAI的ChatGPT、谷歌的PaLM 2、百度的文心一言、字节跳动的豆包、腾讯的混元、科大讯飞的星火大模型、阿里的通义千问、360的智脑、华为的盘古大模型、京东的言犀大模型、昆仑天工大模型、知海图AI、飞桨、WPS AI、Moss、搜狗AI、小米AIoT大模型以及紫东太初等。
关于各模型的优点,谷歌的PaLM 2在常识推理、形式逻辑、数学和20多种语言的高级编码方面表现出色,同时支持多语言理解和快速响应。百度的文心一言是目前最主流的AI大模型之一,具备跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务。腾讯的混元大模型涵盖NLP、CV、多模态、文生图等大模型,已和腾讯广告、微信、QQ、游戏等产品实现协同,并通过腾讯云对外商业化。科大讯飞的星火大模型同样具有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务。
在试用过程中,发现文心一言和豆包表现较为出色(主要因为免费且功能强大)。例如,讯飞星火和ChatGPT在多次试用后需开始收费。此外,对AI的神秘感逐渐减弱,其实际表现并未如一些自媒体所描述的那样神奇。目前AI大模型仍处于发展初期,智能化程度较低,类似于早期谷歌和百度的情形,初看惊艳,但深入使用后发现仍有较大发展空间。
AI大模型更像是一个智能化搜索引擎,对于复杂问题往往无法给出满意回答。它更像是一个信息整合工具,能否回答取决于是否整合了相关网上信息。在AI绘画和AI视频方面,目前技术尚不成熟,很多内容无法生成,制作出的视频也显得较为死板。网上宣传的AI视频往往是精心制作的,仅适用于特定场景和话题。
不同公司的AI大模型在各自主营领域表现出色,但在其他领域则相对较弱。例如,ChatGPT擅长英文环境但中文能力较差;豆包因使用抖音和头条数据训练,在文字和视频领域表现较强;腾讯混元大模型和百度文心一言也具备类似优势。而针对敏感问题,不同模型的回答策略也各异,如ChatGPT选择不回答,而国内模型则较为直接。这可能与立场有关。
此外,AI大模型可能诱导人的认知,特别是对其他国家普通人而言。例如,有美国用户用AI大模型询问画美国开国总统华盛顿画像时,出现了黑人版画像并引发抗议。这提醒我们,AI的立场可能影响其回答结果。
总体而言,目前AI发展仍处于初期阶段,距离完全成熟和高智能化还有很长的路要走。我们不必过于焦虑,目前AI仅作为智能使用工具,距离替代人类还很遥远。