预测卡塔尔世界杯冠军,哪个模型更准确?
11月20日,卡塔尔世界杯吉祥物出现在开幕式上。 (新华社记者 兰红光/图)
尽管这个世界的所有事件大多是测不准,但还是有人不断预测未来人类生活方方方面的走向和结果。现在,预测2022年卡塔尔世界杯冠军得主就是一个大热门,各种各样的机构、公司和个人都在预测,其间会掺杂大量的赌注和金钱。
抛开赌博,哪一种预测更可靠?不约而同,人们会倾向于利用科学模型预测。现在,世界著名的计算机和信息研究机构阿兰·图灵研究所给出了一个预测,冠军是巴西,概率为25%;其次是比利时队和阿根廷队,概率分别为19%、13%。
图灵研究所的预测可靠吗?这得看他们是依据什么预测的。不过,这个团队申明,“不建议投注我们的任何预测!”
图灵研究所的预测团队有3人,分别是尼克·巴洛博士,高级研究软件工程师;杰克·罗伯茨博士,国防与安全应用研究中心高级数据科学家;陈瑞安,研究软件工程师。
他们的预测是基于算法(统计模型),也就是研发了一个软件艾尔塞纳尔(AIrsenal)软件,这是该研究团队在 2018 年为玩梦幻超级联赛而研发的。另外参考了1997 年的模型迪克森和科尔斯,这也是足球预测圈的经典之作,采用球队进攻实力、防守实力和主场优势的参数,并使用贝叶斯统计以计算比赛最可能的比分。
现在,研究团队修改了艾尔塞纳尔软件,使其更适合预测国际比赛。这个软件也成功预测了 2014 年和 2018 年世界杯结果,因此,研究团队决定使用 2002 年世界杯以来的所有国际结果作为参数。同时,研究团队最重视的权重是世界杯比赛,降低洲际锦标赛、预选赛和友谊赛的权重,也对最近的比赛给予更多权重。
研究团队同样采用了在各国国内联赛中常用的计分方法,即为球队提供防守和进攻得分的方法以预测比赛。研究团队还调整了模型,以消除卡塔尔本国球队的主场优势,以及在国际友谊赛中球队之间的实力差异。
研究团队采用他们的模型进行了10万场比赛的预测后判定,巴西队的夺冠概率为25%,其次是比利时队和阿根廷队,获胜概率分别为19%、13%。目前英格兰队的势头相当看好,但图灵研究团队对其夺冠的预测只有10%。
除了图灵研究所的团队,国际上也有很多信息研究机构在利用算法进行世界杯结果的预测,一些研究机构的预测结果与图灵研究所的预测相似。如奥地利因斯布鲁克大学Achim Zeileis团队的模型预测就与图灵研究所的预测结果一致。Achim Zeileis团队在超级计算机上运行的算法结果是,巴西是最终赢家,获胜概率为15%。
但是,与图灵研究所团队预测结果相左的也有,如英国劳埃德保险公司的预测,他们利用的是不同的参数,即采用每个球队成员的集体保险价值预测。根据这些参数,他们的预测结果是,英格兰队将在决赛中击败巴西队夺冠。此前他们的模型也有成功的例子,该模型正确预测了德国在2014年赢得世界杯和法国在2018年世界杯夺冠。
另外,牛津大学马修·彭(Matthew Penn)团队设计的模型预测结果是,比利时最有可能夺冠。他们的模型正确预测了2020年欧洲足球锦标赛的冠军意大利队,以及8支进入1/4决赛中的6支队伍。
图灵研究所团队的预测软件吸引人的另一个优势是,这种模型是开源的,个人也可以使用,以鼓励更多的人参与。人们在自己家里的电脑上就可运行。在普通笔记本电脑上只需运行15分钟就可得到1000场比赛的预测结果。
不过,图灵研究所团队也认为他们的预测结果并非十分可靠,因为有很多因素他们并没有考虑进去,这些数据要么难以获得,要么无法获得。
一是球星的作用。此前的世界杯有很多明星球员的巨大作用会左右比赛结果,如1986年的马拉多纳,1998年的齐达内,2002年的罗纳尔多(巴西)。在赛前,这些明星的作用都难以预测到。因此,今年的比赛肯定有几位明星的作用同样会与此前的一些明星一样,遗憾的是,最近和现在即便看到了这样的球星,也难以预测,如法国的姆巴佩、荷兰的范戴克等,至于C罗和梅西,已经是“美人迟暮”。
其二,一些球队参赛的数据难以获得。预测每年只参赛几次国际比赛的球队的成绩,远比预测每周有比赛的英超球队更难。
点球大战会让冠军结果有所不同,但是图灵团队并没有收集点球大战成功的历史数据,而是采用了更简单的方法,即在淘汰赛阶段平局的情况下,为球队分配50/50的机会晋级。
同时,天气状况也可能影响成绩。虽然过去四届比赛都是由欧洲球队赢得的(2006年意大利,2010年西班牙,2014年德国,2018年法国),但直到2010年,所有在欧洲以外举行的世界杯都是由南美球队赢得的。卡塔尔的炎热天气对巴西和阿根廷的影响大,还是对欧洲人的影响大,这也是难以建模并无法预测的因素。
所以,即便是利用科学模型预测,归根结底还是概率问题。重要的是,不要以此结果为依据去进行赌球和投注。
张田勘