华为云利用机器学习服务成功预测 40 场世界杯比赛结果
发布时间:2024-06-24 12:18:04  阅读次数:6

世界杯开始前,很多机构或研究人员对于小组赛晋级或者夺冠的成绩都给出了自己的预测,有的是基于统计学的方法,有的是基于民意调查。

如果没有人工智能应用,世界杯预测就不可能准确

华为云利用机器学习服务(MLS)打造了世界杯预测AI机器人,成功预测了40场比赛结果,其中连续6场预测准确。(果然数据说话了)

机器学习服务实践门槛较高,但概念理解起来就容易得多。简单来说就是让计算机模仿人的思维和方法解决问题,利用机器的优势来代替人的工作,或者更好地配合人的工作。

比如,现在大家都觉得自己的车开起来越来越顺畅,但开别人的车却不习惯。很多时候不是你更熟悉车,而是车更熟悉你。原因就在于很多中高端车型都配备了“高级行车电脑”,具有学习驾驶习惯的能力。你开的时间越长,它记录的数据就越多,就越熟悉你的驾驶习惯,因此它就能不断调整、优化发动机和变速箱的运行参数,以更及时地配合你的驾驶动作。

现在你已经对MLS有了基本的了解,下面我们就来教你如何通过四个简单的步骤打造“AI预测王”:

步骤1.找到您需要的数据集;

第2步:选择或定义所需的特征;

步骤3.选择合适的算法在训练数据中寻找数据知识和规则;

步骤4.调整算法参数和特征选择,以获得相对较好的模型。

相信很多人看了都会大喊看不懂、“早点离场”。别担心,你可能会觉得编程代码不是你的菜。其实,预测结果和做一道菜没有本质区别。现在跟我系好围巾,进厨房,拿起菜刀……

数据选择

数据选择就像邀请朋友或女朋友到家里吃饭,需要提前准备好食材,鸡、鱼、肉、蛋、葱、姜、蒜、柴、米、油、盐、酱、醋、茶等等,俗话说,好厨无米之炊。要做预测,首先需要不同的“食材”——数据。

这里我们精选了过去8年所有国家队的比赛结果,包括每场比赛的时间和进球。

为了更加令人信服,华为云还添加了 FIFA 排名和 Elo 评级。

尖端

我们选择餐厅时,会看点评网站的综合评分;选择电影时,会看豆瓣、烂番茄等国内外影评网站的电影评分。“Elo评分”就像这种综合评分。不仅是足球,越来越多的体育赛事都引入了这种评分体系。

特征选择

如果你要做一道特定的菜,你需要选择有限的食材和调料。如果你想做西红柿炒鸡蛋、排骨炒鸡翅足球比赛预测模型,你应该把它们放进冰箱冷却,对吧?同样,根据不同的预测需求,我们也会过滤数据,剔除不重要的信息。

对于每场比赛胜、平、负的分类问题,特征数据为:每场比赛两队的FIFA排名与Elo评级的差值。

接下来的净胜球预测就简单多了,也就是进球数减去失球数。

算法选择

就像炒菜要有铁锅,炖菜要有炖盅一样,我们已经准备好了“食材”,接下来要选择“烹饪工具”——也就是最合适的算法。

让我们回到预测胜平负的问题。对于这个“多分类”问题,我们使用随机森林算法。()

随机森林会生成多棵决策树,然后每棵决策树对数据的类别进行投票,最终的类别就是得票最多的类别。这里大家可以简单理解一下:很多人在争论西红柿是水果还是蔬菜,每个人都有自己的判断标准,最终的结果就是投票。

随机森林算法示意图

为了让净胜球预测越来越准,又一个高端算法被引入——梯度提升树(GBDT)。再举一个不太恰当的例子:就像我们在学做清蒸鲈鱼,我们忙碌又唠叨,20个步骤都一丝不苟地完成,我们希望每个步骤之间的误差最小,味道最好。

GBDT算法图

使用华为云MLS训练模型

在真正开始烹饪之前,你需要一个符合你要求的厨房。华为云MLS提供可视化、拖拽式的“现代厨房”-机器学习建模功能(工作流),让你可以快速便捷地构建机器学习流程,快速获得模型。

使用华为云MLS可视化机器学习训练过程

经过多次训练,我们发现该特征列的影响因素很小,因此去掉了该特征。最终的随机森林参数为:树100颗,深度30,箱数200;GBDT最终参数为:迭代次数18。

随机选取训练数据集的30%作为测试集,胜负预测准确率为68%足球比赛预测模型,净胜球预测平均误差为0.58,这个结果在足球比赛的预测中是可以接受的。

模型训练完成后,还利用该工作流构建预测流程。

预测工作流程

世界杯模型的实践与更新

我闺蜜牙齿不好,所以菜要煮久一点;我闺蜜是四川人,所以菜要够辣才好吃;一道合格的菜,会根据客人的口味喜好进行调整;世界杯预测模型也需要根据实际结果进行调整,提高预测准确率。

6月14日,世界杯开幕,揭幕战是俄罗斯对阵沙特。华为云MLS模型预测俄罗斯将以2球优势获胜足球比赛预测模型,最终结果为俄罗斯以5球优势获胜,可见俄罗斯主场优势明显。在之前的建模过程中,剔除了主客场因素,但俄罗斯作为东道主,拥有主场优势,因此在俄罗斯的初始Elo得分上增加了一个百分比的增幅,经过测试,这个百分比被设定为10%。

世界杯比赛日结束后,实际比赛结果将作为训练集更新模型,华为云MLS在世界杯决赛圈各阶段的最终表现如图所示。

华为云MLS模型准确率

顺便说一句,在16强对阵确定后,华为云MLS准确预测冠军将是法国,尽管预测的夺冠路径与实际的夺冠路径略有不同。

足球的随机性

足球比赛充满了不确定性和偶然性,比如伤病、乌龙球、黄油手等等,这些因素直接影响比赛的结果,而这些都是未知的。现在AI无法对未知和不确定性做出准确的反应。AI能预测的是足球场上的形势(射门比例、控球率、传球次数、传球成功率等)。这些形势因素在一定程度上可以反映比赛的最终结果,但并不是确定的。

至此,我们用一种不那么“严肃”的方式来揭示如此高深的问题。MLS的应用前景非常广阔。比如,现在已经有了可以“手把手”教的工业机器人。不管制造工序有多复杂,只要技术人员对机器人进行手把手教,拥有多种传感器和实时计算能力的机器人就能像人一样精准地控制机械臂,完成复杂的手工流程。

标签:足球比赛预测模型