AI实时剪辑篮球赛事的背后:IBM想帮互联网企业的每一帧视频价值最大化?

AI百科3个月前发布 快创云
46 0

  在杜兰特荣获总决赛MVP的同一时刻,《杜兰特11年精彩回顾》的视频在腾讯视频平台迅速上线。与常规的视频制作流程不同,该视频是在比赛结束后立即通过AI技术实时生成的,几乎未经过人工干预。

  此视频不仅保持了高度的完整性,且转场流畅自然,其间穿插了文字评论和图片,其剪辑效果堪比专业视频剪辑师。令人惊讶的是,这一成果是由“IBM AI Vision视觉大脑”实现的,标志着AI在腾讯NBA视频的即时制作中已成为常态。

  此次IBM与腾讯体育的合作,重点在于“篮球赛AI剪辑师”产品,该产品能在比赛直播过程中实时完成视频识别与剪切,比赛结束后的20秒内即可根据人的灵感和要求完成视频组合。这是中国首次将AI技术应用于体育视频内容编辑。

  实际上,《杜兰特11年精彩回顾》并非“篮球赛AI剪辑师”的首次尝试。早在NBA2018赛季总决赛前,腾讯体育便发起了一项球迷互动投票,IBM AI视觉大脑根据投票结果,为七位巨星剪辑了比赛视频,并在决赛日第一场开始播放。

  腾讯体育自2015年成为NBA中国数字媒体独家官方合作伙伴以来,不仅提供赛事直播服务,还不断探索内容与技术升级,致力于为1.43亿篮球迷带来更佳的观赛体验。

  对于球迷而言,除了观看实时比赛,讨论历史赛事也是一大乐趣。相比人类,机器在数据处理上更具优势。据预测,到2025年,全球数据量将达到ZB级别,这为AI提供了丰富的素材。近年来,随着NLP技术的成熟,基于文字的学习已相对成熟,并被一些体育大数据公司应用。

  全球及中国在线内容的快速增长使得视频网站和网络电视平台积累了海量历史视频数据,这些数据量的增长是持续且迅速的。通常,被高频调取的数据仅占总量的20%。通过视频数据的管理与挖掘,可挖掘出巨大的商业价值。据悉,包括腾讯体育在内的多家视频平台都在寻求解决方案。

  IBM AI Vision视觉大脑为腾讯NBA编辑团队定制的AI视频剪辑方案,使得海量历史赛事视频资料变得可搜索可提取,变相提升了每一帧每一秒视频的价值。

  利用机器自动生成视频的想法并非新鲜事。此前,Google、微软、阿里巴巴等公司以及MIT等研究机构都推出过类似的研究成果或Demo。而IBM此次推出的《杜兰特11年精彩回顾》更像是一款实际产品,且首次将AI应用于计算机视觉难度最高的篮球领域。

  从Demo到产品的转变对技术的可靠性提出了更高要求。“篮球赛AI剪辑师”基于IBM中国研究院开发的视频深度学习平台——“IBM AI Vision视觉大脑”,该平台已具备智能视觉识别、理解和剪辑技术。尽管已有公司尝试利用计算机视觉剪辑、生产视频,但篮球运动分析是所有体育赛事中最复杂的一项。IBM AI视觉大脑通过机器学习能识别篮球动作、判断得分失误等。

  “IBM AI Vision视觉大脑”从建模、剪切、编辑成片三个环节解决项目难题,进行了大量技术优化和机器学习:

  1. 建模:通过少量视频数据在一个月内完成建模,让机器学习理解篮球。利用“多模态视觉理解技术”对视频画面进行“像素级跟踪、识别”,包括球员的人脸识别、动作识别、表情识别等;并分析判断背后的相关性。
  2. 剪切:对过去69年20个球员的数百万分钟篮球比赛中的每一帧视频数据进行多通道分析并打上标签,将非结构化视频数据提取为结构化数据,并用数据库进行实时管理。同时,针对动作的精彩程度和不同的主题生成综合评价。
  3. 编辑成片:人与机器协作完成筛选、拼接、成片。体育编辑设置好应用场景要求,“AI剪辑师”按照综合评分选出最贴切主题的精彩视频片段,几乎实时自动生成一分钟剪辑视频。

  腾讯体育采用“IBM AI Vision 视觉大脑”,为球迷提供了更多优质内容;对腾讯体育而言,这有助于降低成本、提升用户体验;对业界来说,这是一种人机协作工作模式的借鉴;未来,IBM AI Vision视觉大脑所代表的计算机视觉技术还可能发挥更大作用。

  对于观众而言,以往体育媒体通过编辑视角单向输出内容,用户对于内容生产往往没有话语权。此次腾讯体育与IBM的合作以观众想法为出发点,通过观众票选生成观众喜闻乐见的内容。未来腾讯体育若开放相关视频资源库给观众进行创作,很可能带来UGC创意内容的新繁荣。

  对于腾讯来说,当前观众对内容质量的要求不断提升。借助技术的力量提供更多优质内容不仅有助于降低成本、提升用户体验和增加用户粘性。市场数据显示,2017年视频内容将占据全球网络74%的流量,全球在线视频广告市场规模将达到190亿美元。这也是腾讯不得不看重的大市场。借助AI技术更快生成优质内容并传播出去可能是一个更好的选择。

  此次合作不仅实现了亿万级视频素材库价值的最大化利用还可能让腾讯体育的赛事直播更加有趣。首先AI将海量的历史视频数据重新提取利用使得每一分每一秒的价值都被最大化利用;其次这种合作探索了人机协作的新工作流减少人力成本缩短工作时间并可能产生新的创意。

  结合AI技术未来内容方面可能会有更多有趣的尝试。例如今年IBM已将AI技术应用于高尔夫球领域在大师赛中与Watson合作自动抓取面部特写和挥杆画面呈现给观众取得了良好效果。IBM AI视觉大脑的技术领先性与可靠性使其有可能胜任更多具有挑战性的任务。

  IBM AI视觉大脑是一个完善的人工智能视频深度学习平台可帮助企业自动完成个性化的机器学习无需大量跟进服务。与其他视觉识别技术相比IBM的多模态影像分析更为复杂分析维度更全面可自动获得的机器理解准确率更高而且安全性有保障企业不必担心数据泄露风险。

  人类获取的信息中80%来自视觉借助大脑的分析能力实现对世界的理解与感知。未来五年内全球摄像头数量将超过44万亿部若IBM AI视觉大脑赋予这些设备思考的能力将带来难以预估的影响。短期内IBM AI视觉大脑在媒体娱乐、产品质检、医疗监护等领域都有广泛的应用前景。

© 版权声明

相关文章