视觉模型,快创云AI导航专注于为用户提供优质的AI网站分享，AI网址分享包含AI智能写作网址大全、AI智能绘画网址大全、AI智能视频创作平台，还有更多AI创作教程分享，AI绘画教程、AI对话技巧分享、AI视频创作教程分享。-快创云

微软Phi-3-小型语言模型的突破

微软Phi-3，一款由微软AI研究院开发的开源小型语言模型，以其小巧的体积和较少的资源需求在AI领域引起了广泛关注。它包括Phi-3-Mini、Phi-3-Small和Phi-3-Medium三个版本...

6个月前

61

AnimateDiff-Lightning-字节跳动推出的快速视频生成AI模型

AnimateDiff-Lightning 是由字节跳动公司（ByteDance Inc.）推出的一款高速文本到视频生成模型。该模型利用渐进式对抗性扩散蒸馏技术，实现了在少步骤（4-8步推理）内生...

AI工具 # AI大模型 # AnimateDiff-Lightning # 内容创作

3个月前

62

SceneScript-Meta的AI场景理解新突破

在增强现实(AR)和人工智能(AI)的交汇点上，Meta的研究人员通过Transformer技术，开创了一种新颖的场景理解方法——SceneScript。这项技术以其70M的参数量，通过编码器-解码器...

AI工具 # 3D场景理解 # AR/MR游戏开发 # meta

8个月前

154

K1：Kimi 推出的全新一代视觉思考模型

K1 是由 Kimi 发布的全新一代视觉思考模型，k1 模型基于强化学习技术打造，原生支持端到端图像理解和思维链技术，并将能力扩展到数学之外的更多基础科学领域。在数学、物理、化学等基础科学学科的基准能...

AI工具 # 网页 # 视觉模型

1个月前

21

PaliGemma 2：Google 推出的新一代AI视觉语言模型

PaliGemma 2 是 Google 推出的最新一代AI视觉语言模型，它在前代基础上集成了视觉处理能力，能够识别、理解并与视觉输入互动，是一款支持简单微调的强大 AI 模型。

AI工具 # AI大模型 # Future Founder # 开源模型

3个月前

42

轻薄是未来？腰线十几块？N4 去哪了？AI 怎么用？听听张老板怎么说

昨天，OPPO在深圳发布了其最新折叠手机OPPO Find N5，这款手机被誉为全球最薄的折叠屏手机，不仅搭载了更强大的处理器，还在结构、技术和交互上进行了多项创新。在发布会后，我们非常荣幸地参与了...

AI百科 # 低成本 # 大模型 # 视觉模型

1个月前

29

腾讯

自美国OpenAI公司推出的ChatGPT风靡全球，并引发新一轮人工智能浪潮，国内外科技巨头争相布局大模型领域。此次，我们梳理了2023年至今，阿里、百度、字节、腾讯、华为、小红书、美图、科大讯飞...

AI百科 # AI应用 # 数字人生成 # 视觉模型

2个月前

24

Mora-微软等推出的多智能体视频生成框架

Mora 是一个由 Lehigh University 和 Microsoft Research 共同开发的多智能体视频生成框架。它旨在模拟并扩展 OpenAI 的 Sora 模型，通过分解视频生成任...

AI工具 # AI大模型 # Lehigh University # Microsoft Research

6个月前

89

CogAgent-引领GUI交互革新的视觉语言模型

CogAgent 是由清华大学与智谱AI联合开发的一款先进的视觉语言模型（VLM），专为图形用户界面（GUI）的理解和导航而设计。该模型结合了低分辨率和高分辨率图像编码器，能够处理高达1120×112...

AI工具 # AI # AITW # CogAgent

4周前

34

商汤科技重组完成，聚焦AI云与视觉模型，多业务拆分为独立公司

商汤科技近期宣布了重大战略重组，标志着其在人工智能领域的全新布局。据内部消息，公司董事长兼CEO徐立于12月3日致全体员工一封信，深入剖析了此次调整的动因及具体举措。信中，徐立指出，为应对AI 2...

AI百科 # AI应用 # 市场 # 视觉模型

3个月前

68