Sora的诞生标志着产品级创新的重大胜利
访谈者:在您漫长的科技旅程中,特别是在人工智能领域深耕近十年,Sora的横空出世,您认为这代表着怎样的一次技术飞跃和产品成功?
傅盛:Sora的问世无疑是一个里程碑式的事件。它证明文本生成视频的技术已经逼近以假乱真的境界,仅凭一些提示词就能实现这一效果。以往,我们需依赖复杂技术和高昂成本才能制作出好莱坞级别的视频,而今,一句话就能生成逼真的视频片段。这在产品层面是一个突破性的进展,让行业内外都意识到这一技术的可行性和产业化潜力。
虽然Sora令人瞩目,但真正的重大技术突破在于大语言模型。我对Sora的出现感到震惊,但大语言模型一旦成熟,文生视频的出现便是水到渠成。这可能与大家的直观感受不同,因为语言的认知远比图像和视频的认知复杂。一旦攻克语言难关,图像和视频的处理更多将是算力问题。
Sora背后的技术:复刻人类的推理与直觉
访谈者:从技术层面看,Sora是如何运作的?它是否基于与人类相似的认知,还是采用了全新的技术?
傅盛:目前披露的Sora技术细节有限,但从现有资料及业内讨论来看,它并未在技术上实现重大突破,而是将现有技术进行了更高效的工程化应用。这可以类比为“熟能生巧”,即通过大量实践和更强大的算力来提升性能。传统建模依赖于物理引擎模拟真实世界,而Sora则通过直觉和大量数据训练来展现物理世界。它创造的是一个全新的人物形象,而非简单的模仿。例如,让它创造一位美女,这位形象在现实中可能不存在,但符合审美标准。此外,Sora的视频中也有一些巧妙的设计,如水面倒影和光影效果,这些看似复杂的技术在大模型看来并无区别,显示出其对光影处理的强大能力。
技术成本将持续下降
访谈者:您和刚才提到的“算力”对生成效果有何影响?
傅盛:底层算法相同的情况下,算力直接影响生成效果。尽管大模型算法神奇,但其成功在于“大力出奇迹”。算力的成本正在持续下降,如同汽车刚出现时汽油昂贵,而现今汽油价格大幅下降。新趋势是,电脑CPU开始配备专门的推理算力子芯片,使得大模型在普通设备上也能应用。
AI技术演进的两条路径
访谈者:请从技术发展路径上讲解AI的迭代过程以及我们目前所处的阶段。
傅盛:科技发展往往不是一条直线,而是“Think Different”找到新分支。早期语言理解技术多遵循谷歌的路径,但OpenAI坚持通过大量文本预测来理解世界,最终证明这条路是正确的。Sora的成功也得益于Transformer在视频时间轴中的应用,使其能处理更多数据。不同公司如Meta也在探索类似路径,形成大语言模型的分支发展。尽管Sora并非开创者,但它展示了通过大量数据和直觉处理物理世界的可能性。目前看来,AGI(通用人工智能)的出现与Sora并无直接关联。
成为AI原住民的路径
访谈者:普通人如何面对AI浪潮,成为AI原住民?
傅盛:成为AI原住民需要新的思维模式,将AI视为底层变革工具。如同电的出现改变了所有用电的方式,AI将带来全新的工作方式和创造力。普通人通过学习和应用AI工具,如文生视频,可以创作出高质量内容。公司内部也在推进AI应用,将AI能力纳入考核体系。例如,《和平精英》PC版的成功也展示了草根团队如何利用AI工具创造奇迹。
企业应用AI的实用策略
访谈者:企业在应用AI时如何选择合适的路径和成本?
傅盛:大模型初期成本高昂,但会迅速普及。企业可根据应用场景选择适合的模型大小,百亿参数在很多情况下已足够。私有模型在成本和安全上更具优势。此外,企业应注重数据安全,避免数据泄露风险。随着技术的发展,大模型将更普及,企业可借助应用反向优化技术路径。
中国企业面对AI浪潮的机遇
访谈者:中国企业在AI浪潮中的机遇何在?
傅盛:中国在应用创新方面具有优势。通过做好应用反向切入技术优化路径,中国企业可在AI领域找到独特发展路径。例如,苹果通过iPhone积累大量数据后成功自研芯片。中国企业在应用市场上具有庞大用户基数优势,可借助这一优势推动技术发展和创新。尽管面临技术差距和挑战,但只要我们紧跟应用趋势并加强底层技术研发,仍有机会在全球AI领域占据一席之地。