“更大的焦虑,更大的想象力”:音视频厂商如何闯入AI时代?

AI百科2个月前更新 快创云
31 0

  从GPT3.5到GPT4.0,从Runway、Pika到Sora,随着大模型技术的不断演进,那些尚未达到行业顶峰的企业,其生存空间正面临前所未有的挑战。对于音视频厂商而言,如何有效连接技术与用户,解决用户的实际问题,成为其发展的关键。

  2024年初,国内大模型公司还在努力从“GPT4”的浪潮中站稳脚跟,Sora的横空出世无疑加剧了这一竞争态势。各大互联网巨头纷纷调整战略方向,力求在新领域取得突破,抢占市场先机。然而,阿里蔡崇信在采访中提到的“中国AI技术可能落后美国两年”的言论,揭示了国内企业面临的紧迫追赶任务。

  从更具体的角度来看,音视频领域作为与Sora技术最为接近的赛道,其焦虑感尤为强烈。大模型的升级不仅意味着技术门槛的提高,更对音视频企业的生存空间构成了威胁。因此,音视频厂商必须思考如何在大模型的浪潮中立足,将技术优势转化为用户价值。

  AI时代的来临,使得音视频技术不断进化。2022年,钉钉率先发起“组合拳”,音视频PaaS/SaaS厂商紧随其后,不仅在研发上投入巨资,还积极布局AI领域。拍乐云被阿里钉钉收购的消息迅速传开,赵加雨及其团队的加入更是为钉钉音视频事业部增添了强大动力。与此同时,腾讯云、其他PaaS和SaaS厂商也在研发、解决方案、应用场景和AI方面不断加码。

  腾讯云在音视频技术上的突破,如将远程实时控制的音视频技术方案应用于煤矿、港口场景中的无人驾驶卡车运营,展现了其在技术侧和行业应用上的双重进步。而百家云在纳斯达克的成功上市,以及声网在AI技术上的持续投入,都反映了音视频厂商在AI时代的积极应对。

  然而,技术的积累并非一朝一夕。以声网为例,其凤鸣AI引擎集成了多年研发成果,如AI降噪、AI回声消除、空间音频等技术。这些技术的推出不仅是对智能化的一种响应,更是音视频厂商长期投入的结果。2023年,大模型在国内的迅猛发展,为音视频厂商提供了深化服务场景、提升技术应用的机会。

  从技术、落地场景到“大小模型”方案,音视频厂商正努力探索新的发展方向。保利威结合金融客户的特殊需求,开发出专为金融行业打造的特殊模型,展现了AI技术在解决实际问题中的潜力。同时,大模型与小模型的结合技术也被提出,通过并联和相互引导的方式优化各自的问题,为音视频领域带来更大的想象力。

  面对大模型的挑战与机遇,音视频厂商需要关注技术的实际应用和用户的实际需求。从关注技术走向关注“降本增效”,结合具体业务解决用户问题,将是音视频厂商顺应AI时代的关键。例如,保利威通过SaaS订阅收入达到90%的成绩背后,正是其结合业务解决用户问题的努力成果。如果大模型所提升的音视频技术能够应用于更具体的生产环节甚至医疗领域中的远程救治等关键时刻那么实时音视频将有望破圈走向大众。

© 版权声明

相关文章