如何解读足球数据?你的方式很可能错了
足球场上的许多问题,如今都能通过数据得到答案。从统计学角度来说,它是客观的存在;而从效益转化来讲,它又是充满主观性质的惊喜。
德布劳内到底配不配40万英镑周薪?
这个问题,早在两年半之前他与曼城续约时,就得到过解答。解答这个问题的不是比利时中场的经纪人(他其实也没有专属经纪人),而是一份由数据分析机构“Analytics FC”制作的报告。该报告分析了“丁丁”过去、现在,以及未来的预期表现,其中还包括他对球队整体的重要性。报告以德布劳内当时的周薪(26万镑)为基准,横向比较了其他世界顶级中场的平均收入,最终得出结论:“曼城17号”薪资过低,理想数字为40万镑。
用足球数据进行续约或转会谈判,德布劳内绝非“吃螃蟹”第一人。2016年,在曼联郁郁不得志的荷兰前锋孟菲斯·德派就曾雇用一家数据分析公司,寻找最适合自己的俱乐部。后者给出五个选项,德派最终选择了里昂,他的职业生涯也因此迎来转机。
足球,正因数据分析而变得越来越聪明。
真实性,欺骗性
自从个人计算机进入大众市场,足球领域始终不乏热衷用数据分析比赛的先驱,阿森纳传奇主帅温格便是较为出名的一个。拥有经济学学位的法国主帅,早在上世纪80年代末就开始用电脑分析球队跑动数据,借助一款由他朋友开发、名为“Top Score”的软件。
第876期《足球周刊》热销中
苏联时期,名帅洛巴诺夫斯基也早早意识到了数据与现代足球的关联,他跟御用科学家阿纳托利·泽伦措夫教授一起,以基辅迪纳摩为试验田,开展了许多数据研析。舍甫琴柯还清晰记得,当年基辅迪纳摩有一套专门用来测试球员的电脑游戏。洛巴诺夫斯基曾公开表示:“90分钟常规比赛时间内,犯错率不高于15-18%的球队,就是无敌的!”显然,这样的数据绝非偶然所得,背后有着强大的科学支持。
互联网兴起后,足球数据迎来革命性突破。1996年,Opta公司开始正儿八经地统计英超“比赛数据”,各家俱乐部有史以来第一次知道自己的球员每场比赛会跑多少米,完成多少次铲球和传球。此后越来越多数据公司纷纷进军足球领域,数据化变成了常态。
1999年,一家位于利兹、原本统计板球投击球成功率的体育数据服务公司ProZone,在业界一战成名。公司创始人拉姆·米尔瓦加南博士向笔者揭秘道:“通过数据,我们发现了德甲豪门拜仁慕尼黑在防守角球时非常擅长争抢第一落点,但却有接近34%的概率会漏掉第二落点。于是,我们的客户曼联,利用这一点成就了欧冠决赛史上最经典的‘诺坎普奇迹’。”
《兹拉坦传奇》
伊布职业生涯纪念画册预售开启
进入新世纪,足球数据的运用场景开始超越比赛本身。2001年8月,时任曼联主帅弗格森突然决定将主力中卫斯塔姆卖给意甲拉齐奥,不少人揣测这是荷兰人出版那本愚蠢的自传(在里面详细描写了爵爷儿子达伦·弗格森如何在球员转会中收受好处)受到的惩罚。然而真相可能并非如此。弗爵爷从没公开谈论过此事,而米尔瓦加南博士表示,促发这笔转会的很大原因,在于ProZone提供给苏格兰名帅的一份比赛数据。“通过数据,弗格森发现斯塔姆的拦截能力大不如前,并断定这位29岁的荷兰后卫已经走上下坡路,贬值前将其出手,看起来非常必要。”
若干年后,弗格森承认自己错了,因为斯塔姆去了意甲一点儿没有下滑,还焕发了职业生涯第二春。但无论如何,这笔交易都已被视作里程碑,因为这是有史以来第一次,数据很大程度影响了球员转会。
书呆子VS大力士
千禧年过后,在英超与弗格森一时瑜亮的温格,也用上了全新的数据分析软件。每场比赛后的第二天早晨,他都会像“瘾君子”一般,仔细分析、研究数据,求知若渴。几乎是在弗格森卖掉斯塔姆的同一时期,温格频频在比赛末段换下前锋博格坎普。面对荷兰人的疑惑和抱怨,“教授”总是不紧不慢地拿出一叠数据:“你看,丹尼斯,70分钟之后,你的跑动开始变少,速度也降低了很多。”
仅凭外型气质,恐怕很少有人会将数据分析这种先进的科学产物,与传统古板的英格兰教练阿勒代斯联系在一起。实际上,“大山姆”不仅是数据发烧友,还是英格兰足坛推动数据应用的重要人物。
球员时期,阿勒代斯为美国佛罗里达的坦帕湾队效力过一年,就是在那里,他被美国体育界广泛运用数据分析所吸引。1999年,“大山姆”成为了小球会博尔顿的主帅。由于买不起好球员,他转而用有限的工资预算聘请了一些优秀的数据统计师。博尔顿的数据团队很快就挖掘出了一个让阿勒代斯欣喜不已的数字:平均每场比赛,球权会在两队之间转换400次。“大山姆”迅速将这一数据分享给了手下球员,并告诉他们:“一旦失去球权,你们便要以最快速度切换成防守站位,并争取第一时间将皮球抢回。”是不是像极了现在的高位压迫?
除了在防守端有所建树,阿勒代斯还通过数据的帮助找到了适合博尔顿的简单进攻方式:角球、界外球和任意球。很长一段时间,博尔顿有45-50%的破门来自定位球,是联赛平均水准的3倍!
2005年,温格的前助手、精于数据分析的法国人达米安·科莫利摇身一变,成为了“枪手”北伦敦死敌托特纳姆热刺的足球总监,并开始在白鹿巷推广足球数据。但和弗格森、温格、阿勒代斯不同,学院派出身的科莫利,在热刺没有得到足够支持,也没有什么话语权,所以他遭遇了早期足球数据分析师们普遍面临的困惑与挣扎。
其实直到现在,英国足球仍对“学院派”持怀疑态度。一名典型的英国足球教练,应该是16岁早早辍学,依靠血性与直觉(而非知识和理性)管理球队。为了保住工作机会,这类教练只能极力证明“接受教育对理解足球没有帮助”。在这样的大环境下,想让热刺教练团队听从一个从未踢过职业足球、满脑子都是数据表格的法国人,简直就是天方夜谭。用科莫利自己的话来说,“我不得不经历一场场‘书呆子VS大力士’的博弈。”
虽然科莫利早早丢掉了自己在热刺的饭碗,但凭借先见之明,他还是为白鹿巷发掘到了不少被低估的瑰宝,比如莫德里奇、贝尔巴托夫,还有加盟时未满18岁的贝尔。
相对价值
新世纪前五年,那些更依靠“直觉”、而非数据报告运营的俱乐部,开始尝到苦头。2003年,皇马以1700万英镑的价格将马克莱莱甩卖给切尔西。在当时环境下,一名不起眼的30岁防守型中场,能换来这些转会费已经非常可观,皇马主席弗洛伦蒂诺的态度也是非常坚决:“我们不会后悔放走他。他技术一般,缺乏带球过人的速度和技巧,90%传球都是回传或横传,头球也不好,而且传球距离很少超过3米……”
弗洛伦蒂诺对马克莱莱的评价看上去有一定道理,他列出的“数据”也没有问题。然而,皇马主席却犯下了一个巨大的错误:他和他的团队没有深入研究过这些数据背后的涵义,因而忽视了马克莱莱的独特之处。
在高强度比赛中,多数球员都是在本队处于进攻态势时才显得活跃,但马克莱莱是个例外。法国人进行高强度跑动时,84%是在对方控球的时候,这相当于队里其他球员的两倍。而加盟切尔西后,马克莱莱持续出色发挥(5个赛季都是顶级水准),并定义了一种角色——“马克莱莱型中场”。后来的恩戈洛·坎泰,以及今夏重金签入的莫伊塞斯·凯塞多,则都是被斯坦福桥寄予厚望的“马克莱莱接班人”。
与皇马贱卖马克莱莱相似的故事,2005年左右频繁发生,一些足球数据分析师也开始自我怀疑。数据公司最初计算的,是每名球员的传球、拦截和跑动距离,俱乐部也会根据这些数字对球员进行评判。那么问题来了:未经加工的统计数据,也就是比赛直播时屏幕上显示的那些数字,意义大不大?
其实这样的问题,没有绝对明确的答案。就像“跑动距离与比赛胜负是否存在直接关联”,答案必然是否定的。此外,在任何一个行业中,从业者所采用的都是他们本能掌握的数据,这就存在一个缺乏横向比较的规模问题。阿森纳是否愿意将自己搜集来的数据分享给曼城?当然不愿意!
因此,在足球数据利用的发展过程中,行业里最精明的数据分析师始终牢记一条原则:数据,只是一种辅助手段,它并不完美,更不可能代替主教练的主观判断。举个例子,铲球次数,就是一个被严重高估的参数。“伟大的意大利左后卫”保罗·马尔蒂尼,每两场比赛才会完成一次铲球,难道这是因为他年事过高、下地困难?非也!米兰传奇有着非常出色的选位能力,根本不需要用铲球化解对手进攻。可以说,弗格森当年就是基于这项数据,错误地卖掉了斯塔姆。同理,对门将而言,“扑救次数”也是存在明显欺骗性和主观性的。
核心数据
最近十年,足球数据的局限性,逐渐被“算法”和“大数据”所打破。随着行业发展,分析师们逐渐意识到,跑动距离与比赛胜负虽然不存在关联,但“冲刺次数”却与比赛结果存在某种推导性。一名球员反复冲刺的能力,成为了大多数球队的取胜之匙。
保加利亚球星贝尔巴托夫的跑动,就像一只上了发条的人偶:冲刺,停顿,再次冲刺……这样的跑法看起来有些慵懒,但热刺和曼联都愿意为他掏出高昂转会费。通过计算,人们发现,即便采用前场压迫式踢法,贝尔巴托夫也能保持90分钟连续冲击!
渐渐地,俱乐部懂得了区分“冲刺”和“跑动距离”,也认清了“有效传球”与“无意义倒脚”之间的差别。ProZone早前公布过一份关于英超球员传球数的榜单,其中一名曼城球员鹤立鸡群,他就是今夏退役的戴维·席尔瓦。这个西班牙人每场传出有效机会球的次数,比队内其他球员多出将近40%!所以,曼城会在戴维·席尔瓦离队后给到德布劳内英超顶薪,而如今只要比利时人伤缺,“蓝月亮”的机会创造能力就会大打折扣。
2012年前后,足球数据行业出现了一个新名词:Ghosting(可译作“仿真模拟”),即通过大数据,预测球场上所有可能发生的场景,以及场景下产生的动能。其中最为人熟悉的指标就是“预期进球”(xG)和“防守行为下的传球次数”(PPDA)。
Ghosting最强的功能是发现问题,并有效分析出一支球队的关系网,比如谁习惯将球传给谁,谁经常发动最有威胁的进攻……如果你提前知道对手的习惯,就可以在危险发生之前做出阻止性尝试。
2014巴西世界杯前,德国国家队专门开发了一款App,方便分析师给国脚们分享有用的比赛视频片段,同时找出应对策略。分析师们通过研究荷兰边后卫戴利·布林德的比赛录像,发现了防守“二过一”的独门秘籍:不必死盯皮球,只要紧紧跟住先启动的那名球员,直到进攻完结。若能完美执行上述步骤,就会有75%的概率扼杀这次“二过一”。
凭借这套方法,德国队击败了热衷“二过一”的法国人,随后又干掉了同样痴迷“One Two”的南美双雄——巴西与阿根廷。被拉姆、克罗斯们高高举起的大力神杯,映衬出了这项数据发展的成功。
如今,随着大数据体系与人工智能继续发展,足球数据公司的研究方向,也从球员个人升级到了球队整体。米尔瓦加南博士顺应这一趋势,在2019年推出了一款名为“人工智能算盘”(AI Abacus)的球探数据软件,它能通过调取全方位数据(甚至包括国籍、作息规律和饮食习惯)的方式,计算出一名球员对球队其他成员以及整个团队的影响。
数据分析对足球比赛的影响越来越大,但使用和解读数据,也需要结合具体场景。罗马主帅穆里尼奥就曾公开表示:“只有不懂球的人,才只知道看数据。”其实他指的数据,是球迷、媒体、观察家这些所谓的“外部人士”,通过平台服务得到的未经系统整理和公式计算的原始数据。而熟悉“魔力鸟”的人都知道,他本人就是足球数据信徒,长期深度使用各类软件。
所以,我们可以说,在与“大力士”的长期对抗中,“书呆子”终于扳回了一城。
本文作者:朱渊
本文原载于第875期《足球周刊》
发行日期:2023.9.25
图片源自网络
第875期《足球周刊》热销中
随刊附赠23-24欧洲顶级秩序册
《足球周刊》网店开学季大促
买一赠一