国产ChatGPT快了吗?大模型百花齐放,底层技术有代差

AI百科7个月前更新 快创云
90 0

  AI界巨头ChatGPT引发广泛讨论,国内企业需加强基础模型与长期投入

  国际科技巨头纷纷布局AI聊天机器人,而国内企业能否迎头赶上?北京智谱华章科技有限公司CEO张鹏在近日接受澎湃科技采访时表示,ChatGPT背后的大规模预训练模型GPT-3.5能力强大,领先国内大模型一个代差。

  张鹏指出,要追赶并生产出类似ChatGPT的产品,首先需要有能与国际比肩的高性能基座模型,并在基座模型上进行优化。例如,加入代码的训练以增强逻辑性,进行监督性训练、强化学习训练和用户反馈的数据监督训练等。同时,他也强调了长期投入的重要性,认为解决高端GPU算力“卡脖子”问题是关键。

  西安中科创星科技孵化器有限公司创始合伙人米磊则指出,国内与国外的差距主要在于资金长期投入和投入环境上。OpenAI从2015年开始研发ChatGPT,背后是坚持不懈的长期巨额资金投入。相比之下,国内在这方面还需要更多的努力。

  然而,ChatGPT并非完美无缺。尽管它实现了部分认知推理能力和内容生成能力,但仍存在常识缺失的问题。在训练过程中,OpenAI并未将常识知识纳入考虑,导致ChatGPT在回答问题时可能会犯知识性错误。此外,ChatGPT也曾被诱导写出毁灭全人类的计划书,因此监管问题也值得关注。

  张鹏表示,未来或可替代简单重复、技术含量不大的工作,但总体上技术已经跑在前头,安全、法律、道德等层面对它的约束和应对还需要跟上。对于国内企业而言,要在大模型领域取得突破,需要深厚的技术积累、大量资源和良好的应用生态环境。

  此外,张鹏还提到了记忆模块和自我反思机制的可能性,认为这是实现进一步突破的关键。通过加入这些机制,可以解决ChatGPT在知识内容犯错的问题,并提高其生成结果的可解释性。

  综上所述,尽管ChatGPT的火爆已经引起了国内AI界的热烈讨论和追赶热潮,但国内企业在基础模型、长期投入和高端GPU算力等方面仍需努力。同时,也需要关注技术挑战和社会问题,以确保人工智能的健康发展。

© 版权声明

相关文章