皇马夺冠,AI猜对一半
出品|虎嗅科技组
作者|齐健
编辑|苗正卿
头图|视觉中国
从ChatGPT出现以来,预测足球比赛结果的工具又多了一个。
AI预测体育比赛,看似“科学算命”,实际上只比章鱼猜球,好那么一点点吧。皇家马德里足球俱乐部在2023-24赛季欧洲冠军联赛中表现出色,最终在决赛中2-0战胜多特蒙德,夺得队史第15座欧冠冠军奖杯,这也是皇马在过去10年内第6次捧起欧冠奖杯。
赛前一个多月,曾有外国博主在X上发出一份AI预测的未来100年欧冠联赛冠军。其中AI预测的2024年欧冠联赛应是巴萨夺冠。不过这种预测未来100年的AI,
显然有大量“玄学”成分在里边。本次欧冠决赛,皇马在赛前预测中就被普遍看好,机构预测主流博彩机构的亚洲盘口普遍开出了多特蒙德受让一或半/一的盘口(可理解为多特蒙德的实力比皇马“差一个球”)。
赛前主流预测大多认为皇马获胜,比分猜测围绕0:2、1:2、1:3(本场为皇马客场)。
外媒The Sporting News在赛前的一篇文章中对比赛形势进行了分析,并列出了4位评论员或分析人士对比赛的判断和对比分的预测。
The Sporting News收集的四位分析人士预测
基于这篇文章中4位人类专家提供的信息,虎嗅在赛前利用8种主流大语言模型产品,对比赛进行了预测。8种模型对胜负的预测全中,不过这场比赛的胜负本来悬念不大,根据主流赔率和皇马的过往表现,AI预测皇马胜出几乎是必然结果。
相对的,预测具体比分可能稍有难度。8款模型对比分的预测多集中在3:1或2:1,只有豆包猜对了比赛的结果2:0。
模型产品多特蒙德v.s.皇家马德里比分GPT-4o1:2/1:3Gemini1:2/1:3通义千问1:2豆包1:3/0:2文心一言0:1/1:2智谱清言1:2讯飞星火1:2Kimi1:2/2:38款AI大模型预测2024欧冠联赛冠军比分
AI预测,成机构的“帮凶”
不管哪种大模型对足球比赛的预测,都需要结合球队实力、近期表现、历史战绩、球员状况等数据进行综合分析,而这些数据其实都是直观反映“胜负”的数据。
比如,两队最近6场交锋多特蒙德1胜2平3负;两队近10场表现,多特蒙德6胜1平3负,皇马则是7胜3平0负;两队在联赛积分榜的表现,多特蒙德胜率在50%左右,排名第五,皇马则超过70%,排第一;多特蒙德球员身价4.6亿欧元,皇马是它的一倍有余10.4亿欧元。
以上这些,再加上控球率、进攻次数、攻防特征等一系列数据,交到AI手里和交到一个普通球迷手里,其实没什么差别。最后的判断,无非是根据孰强孰弱,做一个“文无第一、武无第二”的判断而已。
普通球迷如果完全相信AI大模型的预测结果,很容易就会被“带跑偏“了。
其实,专业的体育博彩公司在预测比赛结果时,也会用到很多AI技术,只不过他们比普通玩家掌握更多的信息和更强的技术。
首先,依靠明面上的数据,在“足彩”的盘口中,结合赔率预测比赛结果,几乎很难保持正收益。但博彩公司、大庄家通常有渠道得到更多详细的赛前信息。比如球员的伤病进展、心理状态、情感状况等。
另一方面,博彩公司的预测手段,相比通用AI大模型要专业一些,尤其是数学模型。
博彩公司在预测足球比赛胜负时,常使用复杂的数学模型和算法,利用过去几万场比赛数据进行训练,分析球队数据,包括射门数、抢断数、助攻数、控球率等,历史战绩,甚至是机构的盘口、赔率。结合统计学(泊松分布、回归分析)、机器学习(随机森林),以及基于人类专家经验的混合模型。
有的分析AI还会“观看比赛”,并对每个球员和足球的运动轨迹进行跟踪,并将全场的数据会转换到一张反映整场比赛的2D地图上。并从这一视角对比赛进行研究,通过贝叶斯分类来统计足球场上每一件事和之后可能导致结果间的联系。识别出哪一个是它所认为的进球机会,或是球员是否正处于能够取得进球的正确位置上。
AI教练和AI足球经理
虽然博彩公司的信息更准确,算法更强,但最终的胜负结果仍是未知数。所以要保持正收益,仍是依靠长期投资大概率事件,这也与投资市场上的量化交易有很多相似之处。
事实上,除了体育博彩,在球队的经营、比赛的策略方面基于AI的量化分析技术,也正在快速普及。
荷兰的足球数据智能SaaS平台SciSports,就正在通过其算法跟踪50多万名球员,并向潜在的收购团队提供服务。
德勤(Deloitte)合伙人、英国体育产业负责人Mark Lillie在此前的一次采访中曾表示,体育组织仍在加紧增加人工智能和数据投资,这项技术可能很快就会发挥重要作用。
“随着人工智能成为标准的竞争优势工具,拥有强大人工智能能力和相关优势的球队可能会成为更有吸引力的投资对象,从而有可能推高估值。”不过,Lillie仍认为,即使AI非常强大,但仍不能解决所有问题,人类的专业知识、直觉和领导力仍将是取得成功的关键。
德意志银行近期的一份报告中也指出,AI是体育俱乐部取得成功的原因之一,报告中提到,“批评者认为,一旦每支球队都拥有了体育统计数据,那么这将是一场零和游戏。我们持相反的观点。我们认为,复杂的体育数据分析技术的普及将为少数球队主导的联赛提供公平的竞争环境。”
在足球比赛的技战术制定方面,AI的参与程度也在逐步加深。
不久前,利物浦俱乐部与谷歌DeepMind合作的AI足球教练项目TacticAI,刚刚登上Nature子刊。这套系统采用最新的生成式AI提供战术洞察,在人类专家的评估中,TacticAI提出的战术建议被采纳率达90%。
TacticAI采用几何深度学习方法来预测角球的结果,通过将角球布置表示为图,并考虑到足球场地的近似对称性,该系统能够在有限的金标准角球数据下建立更通用的模型。此外,TacticAI 还能够通过提供相似的角球案例和测试不同的战术来帮助教练重新设计角球战术。
除了最先进的生成式AI技术之外,本次欧冠决赛的两支队伍也都早已使用AI技术进行训练。
皇马在球员的训练装备中加装了 GPS 设备,记录心率、速度、跑步距离、路线和加速度数据,并借助这些数据分析球员的身体信息以及物理治疗、补充剂和足病医生的数据,量化和控制球员的训练负荷并减少受伤的机会。
多特蒙德则与一家名为Staige的公司合作,使用AI 摄像头将优质的自动端到端直播与记录和分析训练软件结合在一起。这款设备可以跟踪比赛动态,AI摄像头可以全自动记录比赛,将其传输到互联网上,并提供进一步的复杂解决方案来分析比赛。
商机在赛场外
各个俱乐部在AI方面都有应用,但在最新的生成式AI应用方面大多不够深入。
有业内人士向虎嗅透露,目前曼城队已经与OpenAI签订合作,使用GPT-4o完成一些日常事务性的工作。
本次欧洲杯冠军皇马,亦早与微软开展了深度合作,不过与生成式AI关系不大,只是使用 Microsoft Azure 和 Office 365 平台开发,可捕获并存储与球迷的每一次互动,包括在俱乐部体育场进行的移动签到、在俱乐部官方网站上进行的在线球迷资料更新以及在线商品购买。
从球员或俱乐部的视角来看,目前生成式AI最好的落地机会并不在赛场内。
KickGPT创始合伙人/动吧体育CEO白强告诉虎嗅,在近期举办的Soccerex世界足球大会上,他看到很多参会的业内人士都在关注AI的应用,“AI是未来”的看法在足球行业也已成为了通识。不过,白强认为,“大部分人在生成式AI落地方面都想歪了,立刻就想怎么能代替主教练,怎么帮助老板买卖球员,这还有点遥远。 ”
短期来看,生成式AI在各行各业都聚焦于营销、互动,在足球俱乐部生意中,这也是收入变现的主要途径。
比如皇马,拥有5亿球迷,其中只有3%的球迷来自西班牙。要让球场更贴近全球球迷,则必须推出能够快速贴合全球球迷的互动产品。这样的产品,在生成式AI的加持下,则能够更加贴合用户。
刚刚结束的百度万象大会上,百度副总裁、百度搜索总经理赵世奇就介绍了以懂球帝为例的AI智能体在全新的分发场域助力商家精准触达客群案例。
智能体不仅能系统地提供赛事基础信息,还会基于球队过去成绩的分析提供赛前专业预测。此外,懂球帝的社区UGC内容积累可供智能体学习,进而提供专业有趣真人风格的陪聊。这种场景,似乎会在欧冠联赛、欧洲杯等与国内时差巨大的体育赛事中找到场景,成为球迷的深夜“看球搭子”。
除了服务球迷之外,生成式AI在服务球员方面,也有一定的快速落地基础。 白强表示,“其实俱乐部很有兴趣去做球员陪伴相关的AI”,白强说,大部分球员都缺乏生活能力,但是除了顶级俱乐部,大部分俱乐部都没有能力派专人对球员的生活做管理,如果AI能够帮俱乐部增强球员日常生活指导,那对于俱乐部来说一定能最快创造实打实的价值。
正在改变与想要改变世界的人,都在 虎嗅APP
国外玩家编写AI预测比赛胜负 准确率高达8489%
昨日,kevinmhaube发表了题为Choose Wisely: Pick/Ban & Predicting the Outcome of the Game(机器学习与英雄联盟)一文,原文(翻译)大意如下(未经允许禁止转载、搬运截图):原作者注:谢谢所有指出我的疏忽之处的Reddit用户。我用了我所有的数据来计算胜率矩阵,不只是用了测试数据。我会吧文章放在这,欢迎大家来指出错误,我已经用更新过后的胜率预测数据来修改了文章。请大家细品!
前言
你看LEC具有高度对抗性的比赛的时候,是否见过还在BP阶段,观众就开始欢呼,就行一支队伍发动了一次出人意料的gank而另一支队伍没有视野无动于衷那样?几乎每次两支强队在载入阶段时观众都会欢呼。英雄联盟的职业选手最喜欢的就是暴打对手,挑选那些他们单排中练了很多的英雄,当然,还有那些在数月甚至数年的沉寂之后重新出现的具有历史意义的英雄。我从2018年初才开始接触这一游戏,直到2019年春,也就是我加入TL团队的一年后,我才开始关注这些事件。事实上,大约在同一时间,我了解到BP阶段可以在很大程度上改变比赛的进程,这就引出了我们的话题:你能仅仅根据BP阶段的数据来预测比赛的结果吗?
情况评估
在深入研究数据之前,让我们先退一步,看看更宏观的层面。我们在做什么?我们有什么现成的信息可以在BP阶段后和在播音员亲切地说“欢迎来到召唤师峡谷”之前使用?我们所做的是根据赛前的因素来预测比赛的结果。游戏有两种可能的结果:赢或输。听起来,我们可以利用机器学习中最受欢迎的二元分类器之一——逻辑回归。在赛前数据方面,我们有哪些信息可以访问呢?
·红蓝方选择
·英雄和位置
·对位
所以……可用信息不多,但这并不是说我们手头没有一些有意义的信息!我们将不得不成为有创造力的数据工程师,充分利用不太理想的情况。当你是英雄联盟的专业分析师时,你会对这些数据点有一种直觉,基于你是想要针对对方的哪个位置,或者你的中野联动与对手相比如何,你有一种知道应该选择哪一边的直觉。有一样东西你还没有,至少现在还没有,那就是你大脑里的一台内置电脑,它可以浏览数千场的训练数据,给你比那些基于直觉的东西更多的信息。
可以说,BP中最重要的因素,也是我决定将这个项目作为基础的因素,就是对位,或者说是这些选定的英雄如何形成一个阵容。有了这些信息,根据大数定律,我们应该能够得到对一个英雄面对对方阵容的实用性的表述。
量化对位
你如何量化对位呢?虽然我们最终需要在一定程度上考虑熵值,但是今天我们将专注于一个更明显的特性:胜率!一段时间以来,我一直在拖延,现在终于创建了这个数据集了。我最终打造的是一个基于所有主要赛区和少数次要赛区的2018-2019年每一场职业比赛的英雄对位胜率矩阵。有了这个矩阵,我们现在可以开始量化阵容,因为它们与对手阵容相关。
英雄联盟比赛有大量的数据,但我选择的数据来源于OracleElixir数据网站和Riot的API。我下载了2018-2019年所有比赛的数据,通过一些有创意的数据工程,我创建了我们的第二个数据集,它包含了以下数据:
·游戏id(整型)
·联赛(字符串)
·蓝色方队伍,红色方队伍(字符串)
·蓝色方的BP(数组)
·红色方的BP(数组)
·蓝色方总数(浮点数)
·红色方总数(浮点数)
·第一滴血、第一座防御塔、第一条男爵和比赛结果(0-1之间的浮点数)
将每场游戏的12行数据压缩到1行并添加我想要的功能并不是一件容易的事情,我必须承认这也是我在这个项目上花费大量时间的原因。现在我们有了我们的数据集,让我们来量化对位吧!
首先,我编写了一个逐行运行的Python脚本,将一个数组中每个英雄面对对方队伍的5个英雄的胜率分别提出来,并将它们加在一起。当我为每个队伍计算出了这5个数字之后,我将它们加在一起得到了蓝色方队伍和红色方队伍的数据。这些数字就是逻辑回归时用来预测比赛结果的。当我决定采用这种方法时,我的直觉是,考虑到每个英雄基于对方5个英雄而得出的一个胜率相加的数字,不仅能准确地描述各个位置的对位,而且还能反映阵容在中后期的能力。我知道这不是100%合理的逻辑,但我觉得这个想法可以得到B+左右的分数。
训练
剩下要做的就是进行测试,调整模型。
我将70%的数据作为训练集提供给模型,剩下的30%用作测试集。幸亏有了SciKit Learn(译者注:机器学习中的一款开源框架),我不必自己创建逻辑回归类(尽管我在当天早些时候自己创建了),而且我可以用几行简单的代码来实现这个算法。
令我惊讶的是,仅考虑红色方总数和蓝色方总数这两种情况时,我预测比赛结果的准确率高达84.9% !对于这个训练了一天的模型来说结果还算不错!我决定使用那些数据来预测一些重要资源的夺取,比如第一座防御塔、第一滴血和第一条男爵。
比赛结果预测正确率(赢/输)——84.89%(在校正了生成胜率矩阵时产生的意外遗漏,我再次进行了比赛结果预测,准确率仍高达73.52%)
·第一滴血预测正确率——56.28%
·第一座防御塔预测正确率——62.23%
·第一条男爵预测正确率——74.69%
我就说吧,我感觉我直觉给出的算法能得到B+的分数。
结论
在加载入召唤师峡谷之前,就有很多我们可以知道的东西了,也许有一天,借助Elon的神经网络,我们可以在没有近期偏差和确认偏差的情况下处理这些数据。但在那一天到来以前,我希望队伍们搞好他们的数据科学和分析项目。如果你和我一样,对创造性地解决问题和数据探索有着坚定不移的热情,请查看Oracle的Elixir和Riot的API。对于英雄联盟这款游戏,我们还有很多全新的视角去探索。
来源:Kevinmhaube
周末四场比赛全中,足球埃罗预测法新用,死步定胜负。
周一有杀老鸟的说法,今天教大家一种埃罗预测法新用,三步定胜负,欧洲几乎所有的博彩公司都在这三种预测方法的基础上建立起数学模型,从而决定本公司在一场足球比赛以前开出怎样的初始赔率。这三种被广泛应用的权威预测方法是:一、埃罗(elo)预测法;二、进球率比较预测法;三、最近六场战绩比较预测法。三种权威的预测方法目前被广泛地应用于预测足球比赛的胜负平结果,今天就说一下埃罗预测法,针对浅盘下的冷门比较实用
埃罗法的核心要素:联赛、6场积分差、返还率
A:首先说明,这个方法只适用于联赛,并且最好是进行10轮以后,队伍状态稳定以后采用。
B:6场积分差一定要是同类型比赛,不同类比赛的积分差没有参考意义。比如说英超经常在,中间穿插足总、联赛杯等。这些成绩就不能算作6场积分差里。
C:返还率以欧洲初盘的平均返还率为基准
补充一点,如果遇到冬歇期这种中间隔断一个月的情况,最好避开。6场同类比赛一定要保持连续性
公式。涉及3个要素,主队取胜几率A,返还率系数B,埃罗盘推算理论欧赔C
A=44.8%+(0.53%乘以两队积分差)
B=100*返还率
C=B/A
假设S1队前6轮拿10分,S2队前6轮拿7分,主队积分比客队多3分,欧洲平均返还率为92.58%
则C=1.995
假设S1队前6轮拿7分,S2队前6轮拿10分,主队积分比客队少3分,欧洲平均返还率不变
则C=2.143
3、亚盘折算。
A、欧洲标盘都有对应的亚盘,比如主胜1.90对应亚盘0.90半球
埃罗盘同样遵循这个折算表格。
如上所说,主队1.995的埃罗欧赔,折算成埃罗亚盘就是0.99半球。
主队2.143的埃罗欧赔,折算成埃罗亚盘就是0.86平半
具体的欧赔亚盘转换表网上都有,自己下载一个对照就行。
B、水位区分
这个是亚盘基础,但埃罗盘比普通亚盘的要求更严格。
(1)低水区间……………………0.85以下水位
超低水………………………0.75以下
低水…………………………0.75-0.85
(2)中水区间……………………0.86-0.95水位
中低水………………………0.86-0.90
中水…………………………0.91-0.95
中高水………………………0.96-1.00(1.00有时也可视为高水)
(3)高水区间……………………1.00-1.20及以上水位
高水…………………………1.00-1.08
超高水………………………1.08以上
4、埃罗盘和亚盘的对应。
埃罗盘的每个数据均不能合并,比如半球最低水和半/一满水就不能合而为一。并且这个对照表只是对亚盘初盘的静态的对照,具体情况还要根据临场变盘来分析。一般情况来说,只要是那种严格遵循下面对照表的,80%的比赛都是正路。如果有严重不符合,如:埃罗平半低水,亚盘平手盘,则要具体情况具体分析了。
埃罗盘 受平/半最低水——亚盘 受一球/球半高水或受球半低水
埃罗盘 平手满水——亚盘 受一球/球半中水
埃罗盘 平手超高水——亚盘 受一球高水或受一球/球半低水
埃罗盘 平手高水——亚盘 受一球中水
埃罗盘 平手中高水——亚盘 受半/一高水或受一球低水
埃罗盘 平手中水——亚盘 受半/一中水
埃罗盘 平手中低水——亚盘 受半球高水或受半/一低水
埃罗盘 平手低水——亚盘 受半球中水
埃罗盘 平手超低水——亚盘 受平半高水或半球低水
埃罗盘 平手最低水——亚盘 受平/半中水
埃罗盘 平/半满水——亚盘 平手高水或受平/半低水
埃罗盘 平/半超高水——亚盘 平手中水
埃罗盘 平/半高水——亚盘 平/半高水或平手低水
埃罗盘 平/半中高水——亚盘 平/半中水
埃罗盘 平/半中水——亚盘 平/半低水或半球高水
埃罗盘 平/半中低水——亚盘 半球中水
埃罗盘 平/半低水——亚盘 半球低水或半/一高水
埃罗盘 平/半超低水——亚盘 半/一中水
埃罗盘 平/半最低水——亚盘 半/一低水或一球高水
埃罗盘 半球满水——亚盘 一球中水
埃罗盘 半球超高水——亚盘 一球低水或一球/球半高水
埃罗盘 半球高水——亚盘 一球/球半中水
埃罗盘 半球中高水——亚盘 一球/球半低水或球半高水
埃罗盘 半球中水——亚盘 球半中水
埃罗盘 半球中低水——亚盘 球半低水或球半/两球高水
埃罗盘 半球低水——亚盘 球半/两球中水
埃罗盘 半球超低水——亚盘 球半/两球低水或两球高水
埃罗盘 半球最低水——亚盘 两球中水
埃罗盘 半/一满水——亚盘 两球低水或两球/两球半高水
埃罗盘-亚盘对照不一致情况下的分析
由于埃罗盘折算出来的亚盘,80%都是平半范围内,所以这里只介绍埃罗盘平半情况下的分析思路。
A、一般埃罗盘平/半0.80水以上的盘口,代表主队取胜可能极大,这时实际盘一定要对主队有所防范,如果实际盘仅仅开为半球,显然上盘就不太好了。即使是半/一盘,上盘形势也不太妙。
B、一般埃罗盘平/半0.825——0.90水之间的盘口,代表主队有很大机会不败。而实际盘一定会保证上盘有优势,如果实际盘为平手盘或客队让球,应考虑客队取胜的可能性。
C、一般埃罗盘平/半0.90——1.00水,代表上下盘机会均等,上盘略好,这时要观察实际盘的走势,若实际盘对上盘顾忌(给中低水或低水),肯定上盘球队不败的希望大得多。
D、一般埃罗盘平/半1.00——1.05水,此埃罗盘一般对应的是平/半高水、平手或受让盘,一定要考虑客队打出的可能性,但首选还是主胜。
E、一般若埃罗盘平手,代表客队机会很大,这时实际盘一般要对上盘非常顾忌,给上盘高水或浅盘(如受半球)都需考虑冷门的情况。若给出半/一以上盘,并配合低水,是稳胆的象征。
(参照做011格罗宁根vs费耶诺德 由于后续变盘中,客队持续降水,临场还升盘,明显是对上盘有所顾虑。
上盘不败的可能性极大。既然埃罗盘显示选30,同时上盘打出的几率又极大,所以可以果断去0).
埃罗法是最容易入手,也是准确率相对比较高的方法,适合初学者入门,并根据个人经验不断完善,形成一套自己的理论,据说很多国外的菠菜公司都用埃罗积分法进行控盘。今天的比赛都是一些深盘蚊子肉,临场大概率会选择006,目前007本场推荐半全场负负赔率1.71。开赛前1个小时定盘。
同路可跟;临场变盘不建议参考。
彩市有风险,投注须谨慎。预测仅供参考,还需理性购彩。
最后请大家遵守国家法律,购买中国体育彩票的足球和篮球彩票的投注