Stable Diffusion 3更多隐藏功能曝光:文字可更改图片细节

AI百科5个月前更新 快创云
44 0

  Stable Diffusion 3:三大进化,震撼登场!

  历经一年多的精心研发,Stable Diffusion 3终于面世,与上一代相比,它进化了三大核心能力。接下来,让我们直接领略其卓越效果!

  首先,其文字渲染能力堪称一绝。无论是黑板上的粉笔字,还是路牌、公交灯牌的霓虹效果,甚至是刺绣上细腻的针脚,Stable Diffusion 3都能精准呈现。这些作品一经展示,便赢得了网友们的广泛赞誉,称其为“太精确了”。更有网友迫切呼吁:“赶紧把中文也安排上!”

  其次,多主题提示能力同样令人惊叹。你可以一次性在提示词中融入多种元素,而Stable Diffusion 3总能完美捕捉并呈现每一个细节。例如,一幅作品中同时出现“宇航员”、“穿着芭蕾舞裙的小猪”、“粉色雨伞”以及“戴着礼帽的知更鸟”,这些元素都能被清晰、生动地表现出来。

  最后,图像质量的再次飞跃也是其一大亮点。从前面的展示图就能感受到其强大的冲击力,而各种超清特写更是信手拈来。目前,官方已开放排队名单,感兴趣的网友可前往官网申请体验。

  值得一提的是,最近AI领域可谓是热闹非凡。有网友直言:“我的电脑已经Hold不住了……”而Stable Diffusion 3的出色表现更是让人们对AI创作充满了期待。

  除了上述亮点外,Stable Diffusion 3还展现了其在“酒精水墨画”和动漫风格创作方面的独特魅力。同时,它支持在图像上添加清晰文字的功能,进一步提升了创作的灵活性。

  尽管目前需要排队申请才能实际体验,但已有网友通过相同的提示词对Midjourney(v 6.0)进行了测试对比。例如,“红苹果与黑板字”的提示词下,Midjourney的结果与Stable Diffusion 3相比显得逊色不少。在文字拼写、图像质量以及色彩协调性等方面,Stable Diffusion 3均表现出更出色的效果。

  今天,CEO Emad还透露了Stable Diffusion 3的更多新功能。例如,通过简单文字即可精准控制图像中的每一个元素,包括替换和删除操作。更令人惊叹的是,它甚至能直接将背景替换为水族缸场景,甚至实现无缝视频转换,不留任何修改痕迹。此外,3D视图功能也已被纳入其中。

  在技术层面,模型可选择的参数范围在800M到8B之间。虽然详细的技术报告尚未公布,但官方透露其主要结合了扩散型transformer架构以及flow matching技术。其中,扩散型transformer架构与Sora相同;而flow matching技术则是由Meta AI及魏茨曼科学研究所的科学家在22年提出的新范式。

  随着视频生成技术的不断进步和Stable Video的正式开放公测(基于SVD1.1),人们将能更轻松地体验文生视频和图生视频两大功能。欲了解更多信息或参与评选活动及中国AIGC产业峰会筹备工作请访问相关链接:

  [1]https://stability.ai/news/stable-diffusion-3
[2]https://arxiv.org/abs/2212.09748
[3]https://arxiv.org/abs/2210.02747
[4]https://twitter.com/pabloaumente/status/1760678508173660543

  请持续关注我们的更新以获取更多科技前沿进展!同时别忘了「分享」、「点赞」和「在看」哦!

© 版权声明

相关文章