自去年8月华为宣布HarmonyOS 4系统与盘古大模型全面集成后,国内一线手机品牌纷纷启动了AI手机战略。特别是高通和联发科在最新一代移动平台上大幅提升了NPU性能,使旗舰手机能够支持端侧部署高达330亿参数的预训练大语言模型。
据市场调研机构IDC预测,到2024年,全球新一代AI手机出货量将达到1.7亿部,占智能手机总出货量的约15%。在这一初期阶段,旗舰机型将成为AI手机增长的主要驱动力。在中国市场,随着新芯片和多样化用户场景的快速迭代,预计2024年AI手机出货量将达到3700万台,到2027年将增至1.5亿台,市场份额超过50%。
在2024年的新一波旗舰机发布后,Android手机厂商不约而同地将AI语音助手作为多模态AI的主要入口,为用户提供丰富的生成式AI服务。本文将探讨国内第一梯队品牌新机带来的AI功能,并对比升级后的智能助理YOYO、小爱同学、蓝心小V和小布助手等,看哪款更能满足用户期待。
手机AI曾是一个宽泛的概念,早在2017年或更早时期就已出现,如人脸解锁、智能助理等功能。除了众所周知的AI影像算法(计算摄影)外,人工智能和机器学习一直在为系统流畅度、进程优先级、应用驻留、文件碎片清理及续航优化提供支持。然而,ChatGPT的兴起似乎重新定义了AI,如今无论是业内还是用户都默认将集成了AI计算核心和大语言模型的手机称为“AI手机”。因此,本文测试主要针对手机端侧AI及旗舰新品带来的AI进阶功能。
我们的测试方法包括针对各品牌新机上的AI功能进行评测,并结合近期评测和使用过程中的真实体验。我们参考了SuperCLUE和其他中文通用大模型的综合性测评基准来制定测试流程。尽管篇幅有限,本次测试可能无法面面俱到,但应足以帮助读者了解当前手机AI的大致表现及不同品牌机型的差异和独特亮点。
测试机型包括:
- 荣耀 Magic6 Pro
- 小米14 Ultra
- vivo X100 Pro
- OPPO Find X7 Ultra
助手唤醒与功能设置
我们考察了语音助手的唤醒方式是否多样,以及文章要点总结、照片处理(如AI消除路人或AI扩图)等功能的交互入口是否便捷。
- 荣耀:荣耀Magic6 Pro不仅支持语音、长按电源键、耳机线控、蓝牙唤醒,还独有气息唤醒功能。用户只需正对手机底部麦克风说出指令即可实现(手机需靠近嘴唇),还支持桌面快捷方式。“设置-智慧助手-YOYO助理”中的“AI字幕”功能支持四种语言的实时翻译。此外,荣耀MagicOS还支持眼动追踪功能。
- 小米:小米14 Ultra唤醒小爱同学的方式多样,包括语音唤醒、长按电源1秒松手唤醒等。在“通知与状态栏-智能设备控制”中选择融合设备中心,可控制所有互联设备和智能家居。小爱同学新增了“大模型探索”板块,提供更多AIGC功能。
- vivo:蓝心小V支持多种唤醒方式,如桌面图标、悬浮图标等。OriginOS 4中的部分设置选项重新分类,“设置-AI”页面中的“智慧建议”支持手机低电量时自动提示附近的充电宝信息。不过,蓝心小V与过去的Jovi语音助手共存,可能会让用户混淆。
- OPPO:OPPO Find X7 Ultra支持语音唤醒、长按电源键0.5秒唤醒等。小布助手不仅支持单独的音量调节,在“设置-小布助手-创新实验室”中还可打开“小布通话”自动接听电话。对于老年用户,可选择开启“小布助手关怀版”,界面更简洁明了。
多轮语义对话及生成
我们进行了多轮提问和场景对话测试,以评估各助手的语义理解和生成能力。
- 荣耀:YOYO助理的回复面面俱到,例如谈及人工智能对教育方式、医疗保健的影响及隐私安全问题。其最令人满意之处在于每个要点的举例说明。
- 小米:小爱同学的回答全面但存在改进空间,例如对“泄露隐私”的提示较常见但未能准确识别“这玩意”的指代。其“搜索增强”功能可显示答案来源并支持跳转。
- vivo:蓝心小V的多轮回答接近满分,但提及AI缺乏人类情感与直觉时逻辑前后矛盾。
- OPPO:小布助手的回复条理清晰,以分列要点形式回复了人工智能的便捷与挑战。其分析较为全面但也指出了人工智能的局限性。
逻辑推理
我们进行了逻辑推理测试以评估各助手的逻辑分析能力。
- 荣耀:回答正确但考虑特定条件有限。
- 小米:多次测试答案有差异但考虑了非线性排列可能性。
- vivo:二次回复时理解了提示并给出新答案。
- OPPO:小布的推理过程清晰且结果正确。
专业知识与生活服务
我们测试了翻译、专业解释及生活建议等功能。
- 荣耀:翻译存在错误且未能完全理解指令。
- 小米:翻译准确且推送了相关菜谱但未能直接解答用户问题。
- vivo:提供了详细的生活服务建议但语音输入需严格遵循标点符号。
- OPPO:提供了全面的回答且覆盖了所有可能的问题衍生点。
学科知识与计算
我们测试了数学和语文知识以评估各助手的学科知识和计算能力。
- 荣耀:数学运算以代码形式呈现且未能执行到最后步骤。但孟德尔第二定律的解释满分且举例与vivo类似。
- 小米:数学理解错误导致解题过程和答案均不正确但语文翻译较为准确。
- vivo:数学运算格式正确且通俗易懂地解释了孟德尔第二定律但语文翻译存在限制。
- OPPO:数学和语文均表现优秀且提供了简洁明了的解答过程。
文章生成
我们测试了文章提纲和全文生成能力以评估各助手的创作能力。
- 荣耀:提纲结构清晰且逻辑合理但通用性较强直至结论部分才提及“AI手机元年”。生成的文章主题明确且提出了警醒人类需警惕时间管理的问题。结论落脚于保持对时间的自主性和平衡感并设定明确的界限与目标等建议。然而文章略显简短未能充分展开论述或提供具体实例加以佐证从而影响了文章的深度和说服力。尽管如此该文章仍具有一定的启发性和思考价值能够引发读者对于时间管理和技术发展的深入反思与讨论但仍有待完善以提高其完整性和说服力以更好地满足读者的阅读需求及期待。同时该文章也反映了当前AI技术在内容创作方面的局限性以及未来提升的空间和潜力值得期待其进一步的发展和完善以提高创作质量和效率为人类社会带来更多便利和惊喜同时促进人类与技术的和谐共生与发展进步共同构建更加美好的未来世界!