来源:The Athletic
作者:Mark Carey
足球分析界还在不断创新。
这些年来,足球数据有两个分支。一类是事件数据,记录了场上发生的一切,比如传球、射门、拦截或抢断等。
另一类是追踪数据,以每秒25帧的频次记录球员的场上位置——如果你需要一个粗略的解释,就是一场90分钟的比赛会生成许多行的表格数据。
就和通过广播收听一场比赛一样,事件数据会记下一名球员在有球状态下的行动,能给我们提供大量信息,你可以从中提取出有价值的见解。然而,只关注有球状态下的动作意味着场上的其他行动和交互都不会被考虑在内。
不同于这种“聚光灯”式的事件数据,追踪数据有助于我们扩大视野,了解场上另外21名球员做了什么,更重要的是,那21名球员的行动会给持球球员带来什么影响。
把事件数据和追踪数据结合在一起,我们就能更好地分析比赛。
近些年来,这类“结合背景信息的事件数据”越来越受欢迎,而且就像打开了潘多拉魔盒一般,给足球比赛的量化分析提供了更多可能。
体育数据分析公司Stats Perform做出了回应。
本周,Stats Perform宣布根据实时的“Opta Vision”数据创建了一系列新的高阶数据,这个数据库囊括了全球范围内的多个联赛。
俱乐部、媒体和球迷都渴望最细致地了解比赛过程,那么新的分析数据能给足坛带来多大改变?
……………………
压迫持球人&“打穿阵线”
Stats Perform的数据、AI和产品副总裁Ben Mackriell说道:“我们已经通过不同的供应商和技术公司获取不同形式的追踪数据长达15年了。”
“在职业俱乐部层面,追踪数据主要被用来分析球员身体素质层面的表现:评估球员的速度和跑动距离等,并和通过GPS收集的训练数据进行比较。”
“这类数据在战术分析中的戏份有所增加,不过你需要具备真正的数据分析能力才能得出有价值的信息。”
当然,我们很难从不同的联赛获取同一级别的追踪数据。
得益于官方合作伙伴Second Spectrum的帮助,英超俱乐部都能在场内设置多个摄像头。那些市场价值没那么高的联赛,比如塞浦路斯甲级联赛,就享受不到同样的硬件条件。
为了解决这个问题,SkillCorner等公司会借助AI技术来远程获取追踪数据,本质上是独立于固定的球场设施的。至关重要的是,Opta Vision的追踪数据源会结合这两种方法来确保相关数据的深度和广度。
近些年来,SciSports、Second Spectrum、SkillCorner和StatsBomb等公司都在尝试将事件数据和追踪数据结合起来。Stats Perform的新数据通过计算机视觉创建了自动化流程,实时向用户提供信息。
问题来了,通过这个新的数据库,能得到哪些新的深入见解?
Ben Mackriell将其拆解为四大要点。
首先是能让人更好地理解防守人给予持球人的压力以及接球球员受到的防守压力。新的数据库不再是简单地记录某位球员送出了一次传球,而是会显示附近有几名对方球员,以及每一次防守球员给持球人的压力有多大。
比如下图这个例子,曼城中场德布劳内接到了队友坎塞洛的传球,有两名狼队球员上前向德布劳内施压……
……这就和德布劳内对阵阿森纳时在大致相同区域接到传球的情况截然不同,枪手球员此刻几乎没给丁丁造成任何压力。
其他没有触球的球员所处的位置都是接传球的背景信息,也可以反映哪些球员给持球人施加了更大的压力。
其次是更好地理解穿透性传球,即单次传球让对面多少球员退出了防守序列。
最合适的说明对象当属利物浦的蒂亚戈。
如下图所示,蒂亚戈在本方半场接球,一脚传球找到了中圈内的队友亨德森,直接越过了5名曼联球员。
再看利物浦对阵南安普顿的这个例子,蒂亚戈简单地回做给同样在中圈内的若塔,但这次没有穿透任何一名圣徒球员,若塔和亨德森的接球位置差不多,效果却截然不同。
如果使用传统的事件数据,两个案例都会被记为一次传球,至多第一个例子还会被算入“向前传球”。然而正如第一个案例所示,对方球员所处的位置就能说明这次穿透性传球的价值。
Ben Mackriell指出,这些现代化的进阶数据越来越受欢迎,实际上描述比赛过程的术语早就出现在足球词典里了,唯一的区别是现在可以更好地进行量化。
“我们知道其他的数据供应商近来提供现代化数据已经变得越来越普遍了,我们希望通过计算机视觉和自动化过程给用户提供数据,因为这么做会更具可拓展性,能让你更快地获取实时信息。”
“对于球迷而言,‘压迫’和‘穿透性传球’等已经是常用术语了。不仅仅是教练和球评,普通球迷也十分熟悉这些概念。”
……………………
“处理得简单些!”
第三项主要数据是传球预测模型,能让你更好地理解一名球员的临场决策。
球员会选择哪个传球选项?这个决策会有多大风险,又能带来多大回报?球员是选择了最具威胁的选项,还是最安全的选项?
“我们每场比赛赛后都会跟教练一起完成这项数据。我们会复盘比赛并评估,‘这名球员在这些情况下做出了正确选择吗?’”Ben Mackriell说,“单看传球到位率的话,你没法知道当时是否有更好的选择,或者球员的决定是否正确。”
新的数据模型有助于量化这点。
咱们来看个例子。
如下图所示,皇马新援琼阿梅尼在摩纳哥的一场比赛中有三个传球选择,传球成功率都不足50%,我们将“预期传球成功率”简称为“xPass”。
实际上传球模型已经在分析界出现了一段时间了,但正如Ben Mackriell说明的那样,这个新模型能让你看到球员面前的所有传球选项:“我们会根据球员位置,球员受到多大压力,周遭球员距离多远,这些防守球员完成拦截或给接球人施加巨大压力的可能性等因素做出预测。”
传球选项也会附带潜在回报,通过“预期威胁”(xThreat)进行量化,即如果传球到位了,接下来10秒内完成一次射门的可能性。
对于琼阿梅尼来说,潜在回报最高的选择是传给中路的马丁斯(预期威胁为0.27)。然而传给后点的法布雷加斯是预期传球成功率最高(43%)的选项。
琼阿梅尼最终选择了传给后点的小法,小法抢在门将纳瓦斯之前完成横传……
……福兰德轻松破门。
在这个例子中,琼阿梅尼有两个潜在回报较高(xThreat超过0.2)的选择,但预期传球成功率均不足50%。最终,法国人做出了当下环境里正确的选择。
如果计入2020-21赛季法甲联赛所有“高风险高回报”的传球,摩纳哥的尝试次数高居联赛第一,他们那个赛季也排在里尔和大巴黎之后获得联赛第三。
Ben Mackriell强调,该分析在球员层面有助于重新评估某位球员至于球队的重要性。
“传安全球或保持皮球继续运转可能是最佳选择。但我们经常在球员回传时提出批评,也许回传就是那个时候的最佳选择,我们现在可以量化从而知道是否如此了。”
……………………
更细致地查看球队阵型
第四项也是最后一项数据能让我们更好地了解一支球队在单场比赛中的微妙阵型变化,而目前针对球队阵型给出的解释都是有缺陷的。
“我们一直都在用阵型来描述球队的整体结构。但阵型在90分钟内是不断变化的,取决于皮球位置,比赛情况,球权归属等因素。知道一支球队主打4-4-2阵型也不会给你提供足够的信息,你还是不知道他们的实时阵型是什么,也不知道他们想要达成什么目标。”
作为球迷,我们都相当熟悉首发阵型了,但越来越多的人们已经认识到了这些足球体系的变化。知道一支球队的阵型会根据比赛的不同情况进行变化(最简单的例子就是有球阶段和无球阶段是两套阵型)已经不稀罕了。
“我们的目标是构建一个系统,能在比赛的任何时刻告诉你球队的真实阵型,球队阵型有什么细微变化,以及同一阵型治下那个形态能最高效地创造机会。”
咱们再来看看法甲联赛的一个案例。
主角还是摩纳哥,这次我们关注高亮圈出的中卫巴迪亚西勒,他在本方半场拿球。
在这次进攻中,Stats Perform的阵型分析模型判定摩纳哥正在使用4-2-4阵型,右后卫阿吉拉尔一路冲到了前场,形成了4人组成的攻击线。
该分析能让我们了解一支球队在单场比赛或整个赛季里最常用的阵型,也能得知哪些阵型最利于球队创造得分机会。
比如分析摩纳哥在2020-21赛季持球阶段的进攻阵型,你能看到他们的边路球员会频繁前插,形成四到五人的攻击线,占控球总时间的46%。
我们也能更进一步,分析出哪些阵型最为高效,最利于球队制造进攻威胁。
这就需要用到另一项进阶数据——控球价值(PV),该数据衡量的是一支球队在控球时接下来10秒内取得进球的概率,有点类似于预期威胁数据,但关注的是进球概率而非射门概率。
根据控球价值数据,摩纳哥在2020-21赛季最高效的阵型是2-4-4,每100个控球回合的PV达到4.7,略高于4-4-2。
对于新的进阶数据来说,获取这些比赛的基本信息是至关重要的。最重要的是,这些数据正好能反映教练之间最常规的沟通话题。
“我认为引入这些数据的意义就是让这些数据融入日常的足球语言。”Ben Mackriell表示,“我们所做的事情就是把教练和分析师已经非常熟悉的东西,他们每天都会在训练场上聊到的话题,转化为球迷能接受的信息。”
足球分析的新时代正在朝我们走来。

0条评论