硅谷押注,生成式AI火了,让你把简单文字变成图像甚至视频

AI百科2个月前发布 快创云
37 0

  近年来,生成式人工智能(generative AI)技术迅速崛起,吸引了硅谷科技巨头和风投机构的广泛关注。这种AI能够在极短时间内,根据少量词汇生成与之相匹配的图像,预示着其在未来各行业的广泛应用及数万亿美元的经济潜力。

  尽管这些由计算机程序生成的图像存在不完美之处,如多余的手指、不自然的四肢弯曲等,同时图像生成器在处理文本时也可能生成无意义的符号,但这一技术可能是科技热潮的开端。正如硅谷风投机构NextView Ventures的投资人大卫·贝塞尔所言,“生成式人工智能”已成为流行语。

  自2021年以来,生成式AI技术取得了显著进步,激励许多人辞掉工作,投身创办新公司,梦想着AI为新一代科技巨头提供动力。在过去五年左右的时间里,AI领域持续蓬勃发展,但大部分进步集中在理解现有数据上。而生成式AI模型则能生成前所未有的新事物,即创造而非仅仅分析数据。

  AI与机器学习平台Craiyon Productive AI的创建者鲍里斯·戴玛表示,生成式AI最令人印象深刻之处在于其创作能力,不仅能生成类似旧有图像的作品,还能创造与以前完全不同的新事物。硅谷知名风投公司红杉资本也发文表示,生成式AI可能改变需要人类创造力发挥作用的领域,并产生数万亿美元的经济价值。值得一提的是,红杉资本还透露其上述文章部分由GPT-3撰写,后者正是能够生成文本的生成式AI。

  生成式AI的工作原理基于深度学习技术,这一机器学习子集自2012年一篇关于图像分类的里程碑式论文后,推动了AI领域的大部分进步。图像生成器通过逆转这一过程,将英语短语转换成图像。它们通常包含处理初始短语和数据转换成图像的两个主要部分。其中,基于名为生成式对抗网络(GAN)的方法被广泛应用于生成不存在的人的照片。而较新的方法则使用转换器,利用更大的数据集进行训练。

  首个获得大量关注的图像生成器是Dall-E,由硅谷初创公司OpenAI于2021年推出。今年,OpenAI发布了功能更强大的更新版本。专注于生成式AI的开发者克里斯蒂安·坎特雷尔表示:“Dall-E 2的推出标志着我们跨越恐怖谷效应的时刻。”另一个常用的基于AI的图像生成器是Cryon(曾称为Dall-E Mini),用户只需输入短语,几分钟内即可在浏览器中看到其生成的绘图。

  据戴玛称,自2021年7月推出以来,Craiyon每天生成约1000万张图片,总计生成10亿张以前从未见过的图片。今年早些时候使用量飙升后,戴玛全力投入Craiyon项目。他通过广告保持用户免费使用,因为该网站的服务器成本高昂。Craiyon的推特账号专门发布最奇怪、最有创意的图片,拥有超过100万名粉丝。而Stable Diffusion项目的发布更是将用户可以根据自己的目的调整程序代码或在其基础上构建新程序成为可能。例如,通过插件集成到Adobe Photoshop中后,用户能生成背景和图像的其他部分并在应用中操作。

  许多投资者视生成式AI为变革性平台,类似于智能手机或互联网的早期阶段。这种转变极大地扩大了潜在市场规模。坎特雷尔认为生成式AI类似于数据库技术,能解锁应用程序的巨大潜力。而Compound VC管理合伙人迈克尔·邓普西则表示这种技术目前处于“好奇心阶段”,处于这一阶段的公司可能会倒闭因为它们没有专注于特定用途或消费者愿意付费的产品。

  该领域的初创公司最终可能会挑战目前主导AI领域的软件巨头并为下一代科技巨头的崛起铺平道路。Hugging Face首席执行官克莱门特·德兰格表示:“将会有一大批价值万亿美元的新公司诞生这些初创公司将以这种新的技术为基础。”今年早些时候Hugging Face从Lux Capital和红杉资本等投资者那里筹集资金后估值达到20亿美元。OpenAI也从微软和Khosla Ventures获得了超过10亿美元的资金而Stable Diffusion开发商Stability AI正在洽谈以高达10亿美元的估值筹集风险资金。云服务提供商如亚马逊、微软和谷歌也可能受益因为生成式AI是计算密集型技术。Meta和谷歌已经聘请了该领域诸多杰出人才希望将这种先进技术整合到公司的产品中。例如Meta宣布了名为“Make-A-Video”的AI计划通过生成视频使这项技术更上一层楼。

  然而生成式AI也带来了伦理问题如就业问题、原创性和所有权挑战以及可能的数据偏见等。开发者必须努力解决这些问题以确保技术的可持续和负责任的发展。同时尽管目前终端用户能享受到的生成式AI带来的好处有限但这一领域正持续快速发展着预示着未来更多的可能性。

© 版权声明

相关文章