微软Phi-3-小型语言模型的突破 微软Phi-3,一款由微软AI研究院开发的开源小型语言模型,以其小巧的体积和较少的资源需求在AI领域引起了广泛关注。它包括Phi-3-Mini、Phi-3-Small和Phi-3-Medium三个版本... AI工具# AI模型# AI研究院# 企业解决方案 6个月前61
AnimateDiff-Lightning-字节跳动推出的快速视频生成AI模型 AnimateDiff-Lightning 是由 字节跳动公司(ByteDance Inc.)推出的一款高速文本到视频生成模型。该模型利用 渐进式对抗性扩散蒸馏技术,实现了在少步骤(4-8步推理)内生... AI工具# AI大模型# AnimateDiff-Lightning# 内容创作 3个月前62
SceneScript-Meta的AI场景理解新突破 在增强现实(AR)和人工智能(AI)的交汇点上,Meta的研究人员通过Transformer技术,开创了一种新颖的场景理解方法——SceneScript。这项技术以其70M的参数量,通过编码器-解码器... AI工具# 3D场景理解# AR/MR游戏开发# meta 8个月前154
K1:Kimi 推出的全新一代视觉思考模型 K1 是由 Kimi 发布的全新一代视觉思考模型,k1 模型基于强化学习技术打造,原生支持端到端图像理解和思维链技术,并将能力扩展到数学之外的更多基础科学领域。在数学、物理、化学等基础科学学科的基准能... AI工具# 网页# 视觉模型 1个月前21
PaliGemma 2:Google 推出的新一代AI视觉语言模型 PaliGemma 2 是 Google 推出的最新一代AI视觉语言模型,它在前代基础上集成了视觉处理能力,能够识别、理解并与视觉输入互动,是一款支持简单微调的强大 AI 模型。 AI工具# AI大模型# Future Founder# 开源模型 3个月前42
轻薄是未来?腰线十几块?N4 去哪了?AI 怎么用?听听张老板怎么说 昨天,OPPO在深圳发布了其最新折叠手机OPPO Find N5,这款手机被誉为全球最薄的折叠屏手机,不仅搭载了更强大的处理器,还在结构、技术和交互上进行了多项创新。在发布会后,我们非常荣幸地参与了... AI百科# 低成本# 大模型# 视觉模型 1个月前29
腾讯 自美国OpenAI公司推出的ChatGPT风靡全球,并引发新一轮人工智能浪潮,国内外科技巨头争相布局大模型领域。 此次,我们梳理了2023年至今,阿里、百度、字节、腾讯、华为、小红书、美图、科大讯飞... AI百科# AI应用# 数字人生成# 视觉模型 2个月前24
Mora-微软等推出的多智能体视频生成框架 Mora 是一个由 Lehigh University 和 Microsoft Research 共同开发的多智能体视频生成框架。它旨在模拟并扩展 OpenAI 的 Sora 模型,通过分解视频生成任... AI工具# AI大模型# Lehigh University# Microsoft Research 6个月前89
CogAgent-引领GUI交互革新的视觉语言模型 CogAgent 是由清华大学与智谱AI联合开发的一款先进的视觉语言模型(VLM),专为图形用户界面(GUI)的理解和导航而设计。该模型结合了低分辨率和高分辨率图像编码器,能够处理高达1120×112... AI工具# AI# AITW# CogAgent 4周前34
商汤科技重组完成,聚焦AI云与视觉模型,多业务拆分为独立公司 商汤科技近期宣布了重大战略重组,标志着其在人工智能领域的全新布局。据内部消息,公司董事长兼CEO徐立于12月3日致全体员工一封信,深入剖析了此次调整的动因及具体举措。 信中,徐立指出,为应对AI 2... AI百科# AI应用# 市场# 视觉模型 3个月前68