技术开发 频道

如何在20秒内完成一段热血视频的剪辑?

  【IT168 评论】如果你热爱篮球的话,那么NBA绝对是一场不可错过的热血盛宴,碰撞、飞跃、汗水……每一帧画面在球迷心中都是不可缺失的珍贵记忆。如何将这些记忆永久保存下来呢?视频就是最常见的方式。

  腾讯视频作为NBA的中国数字媒体独家官方合作伙伴,今年一如既往的进行了赛事播放,但与以往不同的是,这次腾讯推出了5支45秒的超燃视频。视频内容是由9天超过7000万球迷根据“霸气”、“精准”等关键词票选出的球星精彩瞬间集锦。这些视频是如何完成的呢?下面我们就来揭秘。

  45秒的精彩视频,背后的操盘手竟然是IBM AI Vision视觉大脑

  视频剪辑最令剪辑师头疼的可能不是创意,而是素材收集,但是这对于上述视频的剪辑师来说完全不是事儿。为什么呢?因为在这些视频完成的背后有一个神秘操盘手——IBM AI Vision视觉大脑。

  IBM AI Vision视觉大脑是IBM中国研究院开发的人工智能视频深度学习平台,可以自动化完成个性化的机器学习。为了完成这些视频,IBM AI Vision视觉大脑在前期通过少量数据进行机器学习并看懂篮球、了解比赛规则、识别动作、判断得分失误等等。

  腾讯NBA 数据库中积累了69年、超21亿秒的篮球比赛视频素材,IBM AI Vision视觉大脑利用自己的黑科技在这其中找到了球迷票选的球星,精确标注并剪切出他们的特色动作和表情,并在20秒内完成一支热血沸腾、个性十足的视频。

  视频剪辑,IBM AI Vision 视觉大脑面对的痛点和对策!

  IBM技术与体育赛事的结合并不是新鲜事儿,但篮球运动分析是所有体育赛事中是最难最复杂的。因为篮球是一项高速运动,所以人多拥挤,互相遮挡、多摄像头且镜头频繁移动是经常发生的,而这对于计算机视觉和机器学习来说难度会陡增。

  为了攻克上述难题,IBM AI Vision视觉大脑将整个视频剪辑过程拆解成了三个环节:

  建模:IBM AI Vision视觉大脑具有多模态视觉理解技术,能够对视频画面实现像素级跟踪、识别,不仅能够识别人脸、声音、动作、表情,而且能够识别物体,同时还会分析判断人的动作和物体之间运动的逻辑关系。多模态视觉理解技术能够从多个维度识别球员,即使他外貌和体现发生了变化,也能准确找到他。

  剪切:IBM AI Vision视觉大脑会对每一帧视觉数据进行多通道分析并打标签,将非结构化数据转换为可检索的结构化数据,并用数据库实时管理,同时针对不同的动作、主题生成综合性评价。依托综合评价,我们能够在成千上万的视频中快速找到最符合我们需求的视频。

  编辑成片:这是最后一步,同时也是剪辑师与机器互动最频繁的一步。所有需要的视频素材都已经被检索出来,这时IBM AI Vision视觉大脑会根据剪辑师提前编辑好的视频要求挑选出最符合主题的视频片段,并配上合适音乐和特效处理。

  通过这三个环节,IBM AI Vision视觉大脑从21亿秒的视频数据中准确的筛选出目标球星的视频片段并生成剪辑视频,大大提升了剪辑效率。除了可以在历史体育赛事的数据中剪辑视频,IBM AI Vision视觉大脑还可以针对实时比赛进行剪辑处理,2-3小时的实时比赛,20秒钟就可以处理输出成片。

  除了体育赛事,IBM AI视觉大脑还可以搞点其它事

  我们都知道数据是“新时代的石油”,但对于视频数据的价值却缺乏了解,据Statista预测,中国在线市场规模将在2018年达到1130亿元规模,在2019年达到1460亿元规模。如此大的市场规模,但拥有海量视频数据的企业高频调取的数据仅占总量的20%,如何盘活和挖掘视频数据的价值是企业需要思考的问题。

  IBM AI Vision视觉大脑拥有领先的人工智能视觉、理解和剪辑技术,它把非结构化的视频数据转换为可检索的结构化数据,降低了视频数据的调取难度,同时AI技术+视频数据的方式不仅能够最大程度的挖掘和利用数据价值,还可以赋予视频数据更多新鲜的呈现方式,让企业客户和个人用户都从中得到更佳的体验。

  虽然以人工智能技术剪辑体育赛事视频在国内还属首次,但是IBM AI Vision视觉大脑盘活视频数据的应用场景却远不止有这一个,它可以在多个领域“搞事情”:电竞复盘手、产品质检员、无人驾驶超级眼、残障人士或独居老人的医护助理等等。只要你有视频数据资源,IBM AI Vision视觉大脑就能让你的数据爆发出新的火花。

如何在20秒内完成一段热血视频的剪辑?




1
相关文章