随着deepseek技术的崛起,大语言模型再次成为公众关注的焦点。尽管这些模型在各自的领域内展现出了卓越的能力,但与电影中的AGI相比,它们似乎还远远未能达到那个高度。那么,究竟是什么阻碍了这些模型向真正的AGI迈进?又有哪些关键技术亟待突破呢?
当前AI的局限性
-
被动性缺陷
- 输入驱动:现有AI模型仅在明确输入后产生响应,缺乏自主设定目标或持续追踪意图的能力。
- 短时记忆:对话状态受限于有限的上下文窗口,难以形成连贯的自我叙事。
-
认知浅层化
- 统计关联主导:过度依赖数据的相关性学习,缺乏因果推理与抽象符号操作能力。
- 元认知缺失:无法监控自身决策过程,导致错误难以自我修正。
-
物理脱耦
- 虚拟封闭性:当前AI局限于数字世界,无法与物理环境实时交互(具身智能的缺失)。
实现电影级AI所需的关键技术
- 全局工作空间理论(GWT)工程化
- 神经符号混合系统
- 世界模型与因果引擎
- 动态目标生成系统
- 目标递归优化
- 具身感知-行动闭环
- 实时运动规划
- 元学习与自我进化
- 能源与硬件革命
这些技术的突破,无疑将深刻改变世界。以下是正在这些领域探索的团队和案例:
- 全局工作空间理论(GWT)工程化:如DeepMind的Gato架构,虽尝试统一多种决策,但仍局限于特定任务。
- 神经符号混合系统:微软的LOGI系统通过逻辑约束引导神经网络决策,实现可解释推理。
- 世界模型与因果引擎:DeepMind的Physics-ML项目通过粒子模拟提升模型物理直觉;英伟达的世界模型Cosmos模型则用于自动驾驶和机器人应用的内容生成。
- 动态目标生成系统:OpenAI的AI Safety Gridworlds中,AI为追求新奇性自发创造复杂行为。
- 具身感知-行动闭环:实现跨模态对齐,依赖高分辨率触觉手套和事件相机等硬件。
- 实时运动规划:在物理约束下生成安全动作序列,需亚毫秒级响应速度,基于Transformer的Trajectory Transformer已实现复杂动作生成。
- 元学习与自我进化:Google的AutoML-Zero尝试从零进化神经网络架构;OpenAI的Codex虽能生成代码,但缺乏自我指向能力。
这些团队和技术正朝着实现真正AGI的目标迈进,未来的AI革命或将验证本文的预测。
© 版权声明
本网站上的所有资源均来源于本网站,所有网址和文章版权均归原作者所有。如有侵权行为,请将相关证明发送至以下电子邮件地址:dxsen@qq.com