为20000个比赛视频配解说,AI语音瞄准体育赛事转播

2023-05-21职业体育彭锦

周杰伦演唱会人山人海,五月天演唱会门票秒空,但要问近期最火的歌手是谁,那还得是孙燕姿。在B站,用近似孙燕姿音色的AI语音生成歌曲片段的视频多达上千条。如果你刷得足够多,甚至会刷到一条这样的视频(下图),该视频目前已被发布者删除。


微信图片_20230521212559.png


AI语音除了用来整活,还有没有更广阔的应用场景?答案显然是肯定的,就在今年4月结束的高尔夫美国大师赛上,AI语音被用来自动生成比赛片段的语音解说。


根据CNN报道,从2019年开始,高尔夫美国大师赛就承诺在赛事App和网站为观众提供“每一杆、每一洞”的比赛画面。这意味着每年都会有数量巨大的比赛视频被呈现给球迷,比如今年的比赛片段,就超过20000条。这些视频片段不可能全部都配上人工解说,因此就有了AI解说的用武之地。


本次赛事的AI解说功能,是由美国大师赛的数字团队和IBM公司的技术团队合作完成的。IBM官网文章介绍,这个叫“Henry”的AI解说,实际是生成式AI,由一个大型语言模型构建而成,进行了大量高尔夫运动的用语习惯和风格训练。该模型的具体运作方式是:


利用大师赛官方数据服务商提供的击球、记分、统计数据以及视频资料等信息,由AI将每个击球的元数据转化为描述性的文本元素→文本经过两种神经网络处理,进行数亿次计算,生成数千个可能的句子→再由模型选择最佳的句子,将该句子传递给Watson Text-to-Speech服务,转化为声音→然后系统会自动将音频与视频中的动作对齐,把语音评论添加到相应比赛片段当中。


当然,球迷并不需要了解这个过程,他们只需要访问大师赛官方App上的“my group”功能,就能看到自己想看且配有AI解说的比赛画面。


微信图片_20230521212555.jpg

老虎·伍兹因伤中途退出了今年的美国大师赛。


北美职业赛事的解说工作,有解说员(play-by-play announcer)和评论员(color commentator)之分,解说员主要负责比赛场面的描述,评论员则侧重比赛分析和延展分析。玩过FIFA、实况或者NBA 2K游戏的球迷,也许对智能语音解说并不陌生,这些游戏会邀请一些知名解说员预录制解说旁白,使游戏更逼近真实比赛,提升玩家的沉浸体验。游戏里简单描述场面、重复使用措辞的旁白,接近于传统的实况解说。而IBM和高尔夫美国大师赛推出的AI解说更加智能,经过大量训练的AI模型,可以自行生成多样化的句式和表达,以避免重复。


实际上早在2019年,IBM就已经开始了他们在AI解说上的尝试,开发团队创建了一个人工智能系统,并且在当年12月8日加拿大温哥华举行的神经信息处理系统(NeurIPS)AI会议上首次公开展示了该系统。这个系统会实时跟踪球员,识别传球、传中和射门,然后进行实况解说。它还可以在比赛的重点时刻,结合数据库中提取的信息进行更复杂的评论分析。也就是说,它不仅是AI解说员,还是AI评论员。不过在当时,这些重点时刻需要人工预先选择。根据财经杂志Fortune的报道,该系统能自动创建的比赛高光视频,高尔夫正是其中一个被用来测试合作的项目。


到今年大师赛期间,IBM对AI的开发又有了较大进展。利用AI模型分析比赛视频,并在赛后为每个球员自动制作比赛片段的功能,已经得到正式应用。除此之外,IBM还推出了“逐洞预测”功能,可以根据往年比赛数据和实时比赛进程,预测每次挥杆的得分可能。而AI解说,则被IBM体育和娱乐团队副总裁Noah Syken发表在IBM官网的文章中,称为与大师赛25年合作历史上“最重要的工作”。


微信图片_20230521212551.jpg


从体育赛事转播的角度来看,AI解说的推出,本质是为了给球迷提供更好的观赛服务。Vizrt Group营销战略副总裁 Andre Torsvik在一篇分析人工智能促进体育转播发展的文章中提到,转播时提供给粉丝的额外信息越有针对性、越有信息量,就越能吸引观众。而AI是最能胜任这一角色的工具。


AI可以提供更快、更相关和更有洞察力的数据,比如足球比赛中的跑动距离和冲刺数据;可以与高端分析软件结合,以提供对比赛的自动化分析,比如篮球转播时的投篮热区;现在又有了语音解说的能力。如果将这些分析和解说呈现在转播视频上,可以大大丰富观众第一屏、乃至第二屏的观看体验。


另一方面,IBM AI Research的AI技术主管John R. Smith曾对Fortune提到,AI解说的实现,可以为很多缺乏转播机会的半职业及业余球队提供实况解说。这也是AI解说在当下最实际的应用场景,毕竟真正重量级的比赛并不会缺少优秀的人类解说,至少目前而言,AI还无法取代他们。


从生成式AI开发的角度来看,AI解说的出现也有着一定价值。Noah Syken认为,AI解说的影响不仅局限在体育赛事解说上,它是一项将大型语言模式和生成式AI应用到企业场景的优秀案例。IBM推出的AI解说功能,至少在两个层面为行业提供了参考,一是大型语言模型是基于大量无标签数据进行训练的,但IBM在此基础上增加了“专业领域知识”的练习,使得AI解说可以适应独特的赛事场景;二是想让人工智能实际适用于企业环境,需要充分利用企业全面、准确和有关联度的源数据。


届时,AI开发人员只需添加其行业、公司或部门的专业信息,就可以快速构建专属AI模型。Noah Syken指出,尽管AI取代人类工作的可能性已经被广为讨论,但只有看到AI解决了具体问题,人们才会真正理解它对业务的影响。


微信图片_20230521212546.jpg


但在展开伟大设想之前,AI解说还是得先面对一些现实问题,比如它始终缺乏情感,而体育赛事解说员适时流露的情绪,往往是球迷最为津津乐道的部分。在雅虎财经的报道中,Syken回应了这个问题,他表示:“随着我们的进展,我想你会看到我们给声音的质感带来一些变化。”


这至少说明,开发团队也意识到这个叫“Henry”的AI解说目前是缺乏质感的。毕竟推特上,有球迷看到AI解说的视频后如此评价:


这个功能真的很震撼;

我会关静音。


声明:本文由懒熊体育原创,转载请注明www.mao361.com


1684459925230928.png

评论

还可以输入500个字符

评论

登录后参与评论

全部评论(0

扫描二维码分享到微信
确 认
扫码关注懒熊体育