AI行业最新动态:OpenAI、Stability AI等多家公司引领变革
OpenAI转型计划:近日,路透社报道称,OpenAI正在考虑将其核心业务重组为营利性公司,以摆脱非营利性董事会的控制。这一转型将使OpenAI能够更灵活地追求财务利润,同时继续其社会和环境目标。根据新计划,首席执行官Sam Altman将首次获得营利性公司的股权。
Stability AI吸纳新成员:生成式人工智能公司Stability AI宣布,传奇电影制片人、技术创新者和视觉特效先驱James Cameron已加入其董事会。作为导演、编剧和制片人,Cameron的作品包括《终结者》、《异形》、《泰坦尼克号》和《阿凡达》等,他的加盟标志着Stability AI在改变视觉媒体方面迈出了重要一步。
Google DeepMind发布新模型:Google DeepMind发布了可用于生产的两款更新模型Gemini-1.5-Pro-002和Gemini-1.5-Flash-002,相比1.5 Pro降价超50%,提高了费率限制,并更新了默认过滤器设置。这些新模型基于最新发布的实验模型,并对5月份发布的Gemini 1.5模型进行了重大改进。
OpenAI学院启动:OpenAI正在启动OpenAI学院,该学院将投资于利用人工智能帮助解决棘手问题并促进社区经济增长的开发人员和组织。该学院将确保人工智能的变革潜力能够为全球不同社区所利用和受益,首先从中低收入国家开始。
英特尔推出新AI芯片:日前,英特尔发布了两款人工智能芯片,试图改善其数据中心业务,并从竞争对手AMD和英伟达手中抢夺市场份额。这两款新芯片——Xeon 6 CPU和Gaudi 3人工智能加速器——有望提高性能和能效。此前,《华尔街日报》报道称,高通公司(QCOM)可能收购英特尔以加强自己的芯片业务。
Meta发布全新模型系列:Meta发布了Llama 3.2,其中包括适用于边缘和移动设备的中小型视觉LLM(11B和90B)以及轻量级纯文本模型(1B和3B)。Llama 3.2 1B和3B模型支持128K token的上下文长度,在边缘本地运行的设备用例中处于领先地位。
OpenAI开放高级语音功能:日前,OpenAI宣布正式对ChatGPT Plus和Team用户开放高级语音功能,并在一周内逐步全量推送。该功能新增了自定义指令、记忆、五种新语音和改进的口音。用户可以通过自定义指令让模型以某种口音发音、记住事件以及如何被称呼等。
Meta推出个性化图像生成模型:Meta团队推出了Imagine Yourself——一种专为个性化图像生成而设计的SOTA模型。该模型无需额外微调即可使所有用户利用共享框架,从而解决了传统模型在平衡身份保护、遵循复杂提示和保持良好视觉质量方面的挑战。研究表明,Imagine Yourself在身份保护、视觉质量和文本对齐方面表现出卓越的能力。
清华团队推出新评估基准:来自清华大学、北京航空航天大学和智谱的研究团队提出了VisScience综合基准,用于评估数学、物理和化学三大学科的多模态科学推理能力。该基准由3000个问题组成,涵盖21个不同的学科,分为五个难度级别。他们对25种具有代表性的MLLM的表现进行了详细评估。
OpenAI医学初步研究:来自加州大学圣克鲁斯分校的研究团队及其合作者对o1在不同医疗场景中的表现进行了全面探索。他们对o1的分析表明,LLM增强的推理能力可能显著有利于他们理解各种医疗指示和推理复杂临床场景的能力。但与此同时,他们也发现了模型能力和现有评估协议中的几个弱点。
Time-MoE推出基础模型:来自普林斯顿大学、松鼠AI和格里菲斯大学的研究团队推出了Time-MoE,这是一种可扩展的统一架构,旨在预训练规模更大、能力更强的预测基础模型。Time-MoE在每次预测中只激活网络的一个子集,从而提高了计算效率,同时降低了推理成本。
视觉大语言模型新技术:新加坡国立大学团队提出了一项新提示技术——Attention Prompting on Image,该技术只需在原始输入图像上简单叠加一个文本查询引导的注意力热图,就能有效增强视觉大语言模型(LVLM)的能力。该技术已在多个视觉语言基准上进行了验证。
Google DeepMind推出鲁棒奖励模型:Google DeepMind的研究团队提出了一个因果框架和一种新颖的数据增强技术,旨在消除人工痕迹并产生鲁棒奖励模型(RRM)。RRM在RewardBench上提高了在Gemma-2-9b-it上训练的成对奖励模型的性能。
HyperAgent解决大规模编码任务:FPT Software推出了一种新型通用多智能体系统HyperAgent,该系统由Planner、Navigator、Code Editor和Executor四个智能体组成,可管理SE任务从最初构思到最终验证的整个生命周期。HyperAgent在多种SE任务中实现了SOTA性能。
语言智能体提高成本效益:圣路易斯华盛顿大学团队通过建立一个自主智能体来指导LLM的推理过程,提供了一种成本效益更高的大语言模型思维器供大众使用。该智能体可为每项任务生成一组指令,从而改善不同语言模型在所有任务实例中的推理过程。
好莱坞支持加州人工智能法案:在加州首部人工智能安全法案SB 1047的争斗中,超过125位好莱坞大牌明星发表公开信支持该法案的签署。信中写道,“我们完全相信人工智能在造福人类方面的巨大潜力。但我们也必须面对现实的风险。”
美国劳工部发布招聘框架:美国劳工部推出了“人工智能与包容性招聘框架”,指导雇主和工人如何确保人工智能技术不会导致歧视或限制残疾求职者的无障碍环境。该指南建议雇主在工作场所“负责任地”实施人工智能。
多家巨头签署欧盟《人工智能公约》:欧盟委员会公布了《人工智能公约》的首批100多家签署方名单,包括OpenAI、微软、谷歌等。该协议旨在促使企业就如何处理和部署人工智能发布“自愿承诺”。
苏姿丰谈芯片行业未来:AMD首席执行官苏姿丰表示,未来5年或7年内GPU不会“失势”,但会出现GPU以外的新势力。未来的AI模型将使用不同类型芯片的组合以实现各种功能。
贝恩公司预计AI市场增长:贝恩公司表示,全球人工智能相关产品市场持续增长,规模有望在2027年达到9900亿美元。这标志着包括AI相关服务和硬件在内的市场将每年增长40%-55%。
Gartner发布新兴技术成熟度曲线:Gartner发布了2024年新兴技术成熟度曲线,生成式人工智能(GenAI)即将越过期望膨胀期。这一趋势正在加速自主AI的发展,但各AI研究实验室正在快速推出智能体以实现目标。不过这将是一个循序渐进的过程。
Hugging Face突破百万模型:人工智能托管平台Hugging Face上的人工智能模型数量首次突破100万个,这标志着快速扩张的机器学习领域的一个里程碑。该平台为开发人员和研究人员提供了大量工具和支持大型语言模型(LLM)的框架。