据了解,这一视频由阿里云工程师团队的皇马球迷操刀。阿里云是FIFA世俱杯的合作伙伴,半决赛皇马首次亮相,工程师也是皇马球迷,就用集锦视频做了一个实验性的尝试。
对于具体如何实现用机器识别球员和足球的运动轨迹,阿里云相关工程师介绍,首先需要对场上球员、球和球场进行整体识别,并通过设计多路神经网络卷积模型,对球员和球精准定位,并结合高效的跟踪算法,对场上球员和球的运动轨迹进行实时跟踪。同时,机器可以提前学习球员队服上的号码,以及对球员的人脸特征提取,结合赛前录入的球员信息,完成球员身份的识别。此外,对球门、边界线等球场基础信息的识别,也可以让机器对球场形成全面感知。
视频中,机器以语音的模式播报出“本泽马射门”“贝尔命中”等解说。它是怎么做到的呢?机器首先需要学会识别出射门、传球等动作,对此结合三维卷积神经网络和长短期记忆网络(LSTM),同时还引入了attention机制,设计了球员动作识别的模型。此外,还需要结合球的轨迹跟踪信息和球场信息,就可以分析得到这一动作发生后的结果,如进球、出界等。基于这些技术,机器可以理解场上发生了什么。
不仅解说精准,还能让观众发笑,网友对这一人工智能技术纷纷表示惊呆,惊呼“看来下一个要失业的是足球解说员了。” 本报记者 金雷