AI周报 | MiniMax 发布万亿参数模型;首个AI程序员Devin被质疑造假

AI百科7个月前更新 快创云
51 0

  4月17日,稀宇科技MiniMax发布了其最新系列模型——abab 6.5系列,该系列包含两个模型:abab 6.5和abab 6.5s。其中,abab 6.5具有万亿参数,支持200k tokens的上下文长度;而abab 6.5s则在相同训练技术和数据的基础上进行了优化,支持同样长度的上下文,但处理效率更高,能在1秒内处理近3万字的文本。在核心性能测试中,abab 6.5表现优异,已接近GPT-4、Claude-3、Gemini-1.5等大语言模型。此次升级得益于多种技术优化,包括改进模型架构、重构数据pipeline、优化训练算法及并行训练策略等。

  同日,Meta发布了Llama 3开源大模型,包括Llama 3 8B和Llama 3 70B。据Meta透露,其最大参数模型已超过400B(4000亿)参数,但仍在训练中。预计Llama 3的400+B版本将开源,这将使开源社区获得接近GPT-4级别的模型权重访问。英伟达科学家Jim Fan表示,这将是一个重要里程碑,改变许多研究工作和初创公司的发展方式。

  在AI编程领域,Cognition Labs发布的AI编程产品Devin引发了争议。尽管Devin展示了强大的能力,但最近有网络博主质疑其演示视频存在欺骗性。尽管如此,AI在代码生成方面的辅助能力已得到认可,如百度27%的代码由智能代码助手生成。

  联想在4月18日发布了10余款AI PC,涵盖多个产品线,并正式亮相个人“联想小天”AI助手。这些AI PC具有内嵌个人大模型、智能交互、个人知识库、本地异构AI算力等特征。联想表示将持续投入并加速发展相关生态,预计AI PC在2024年将占PC出货量的20%,到2027年将增长至60%以上。

  百度在Create AI开发者大会上宣布,其文心大模型训练效率提升至原来的5.1倍,推理性能提升105倍,推理成本降至原来的1%。目前,文心大模型用户数据超2亿,API日均调用量超2亿。百度创始人李彦宏还透露,百度每天新增代码中,有27%由智能代码助手Comate自动生成。

  波士顿动力推出了全新的电动Atlas人形机器人,拥有更轻巧的机械骨架和更灵活的动作。这标志着波士顿动力从液压向电驱的转变,预示着更实用和经济的机器人技术时代的到来。

  伊以冲突可能对以色列半导体产业产生影响。以色列坐落着多家半导体巨头的研究中心,包括英伟达、英特尔、高通等。尽管当地芯片制造产能有限,但芯片设计公司或部门受冲突影响理应较小。

  昆仑万维在其官方公众号宣布开源4000亿参数的大模型天工3.0,这是全球最大的开源MoE大模型。天工3.0在多项权威测评中表现优异,超越GPT-4V。此外,昆仑万维还宣布“天工SkyMusic”音乐大模型正式开启公测。

  微软向阿联酋AI巨头G42投资15亿美元,并获得其少数股权。两家公司将建立一个10亿美元的基金以提高阿联酋及更广泛地区的人工智能技能。合作将推进G42在多个领域的人工智能应用战略。

  针对近期媒体报道的百川智能新一轮数亿美元融资消息,百川智能回应称报道存在一定误差。若融资落实,百川智能将成为又一个估值超百亿元的明星独角兽公司。

  李飞飞团队发布的《2024年人工智能指数报告》追踪了全球AI发展的十大趋势,包括AI在某些任务上胜过人类、产业界主导人工智能前沿研究、前沿AI模型将更加昂贵等。报告还指出,美国成为顶级AI模型主要来源国,对生成式AI的投资激增。

  法国AI独角兽Mistral AI正在寻求以50亿美元估值进行新一轮数亿美元融资。这家公司被视为OpenAI的竞争对手之一,并在今年2月推出了与GPT-4竞争的Mistral Large模型。微软已向其投资1600万美元并展开合作。

  “联想系”大模型公司诺谛智能宣布完成近亿元Pre-A轮融资。本轮融资将用于行业大模型的迭代与优化、“AI+制造”场景解决方案的打磨与市场拓展以及人才引进。诺谛智能成立于2021年10月,为联想集团孵化的人工智能企业。

  IDC发布的报告显示,2023年中国液冷服务器市场规模达到15.5亿美元,同比增长52.6%。预计未来几年市场规模将持续扩大,这与中国人工智能企业和组织对智算中心的建设要求及算力供给需求的增长密切相关。

© 版权声明

相关文章