使用时间异构图神经网络评估职业〈反恐精英〉中的玩家动作

使用时间异构图神经网络评估职业〈反恐精英〉中的玩家动作

Max大郭(备注:郭佰鑫)

一位运营着公众号体育科学和AI大模型爱好者,喜欢刷科技资讯的大学生

联系我:MaxGBX (欢迎科研、产品、自媒体合作交流)

有更多

SSAC25即第19届麻省理工学院斯隆体育分析会议,于2025年3月7 - 8日在海恩斯会议中心举办。作为体育分析领域的重要年度活动,它汇聚了体育界、科技界和学术界的专业人士、学者与爱好者。会议期间,通过演讲环节,行业知名人士分享见解;众多研究论文展示涵盖棒球、篮球、足球等多个体育项目的前沿成果,为体育行业提供创新思路与科学决策依据,促进体育分析学术研究发展与国际交流合作,对提升体育赛事各方面水平意义重大 。

近年来,电子竞技日益普及,拓展了体育产业的现有格局。《反恐精英 2》(CS2)是一款第一人称射击团队游戏,是 2024 年最引人注目的电子竞技游戏之一。在这项电子竞技中,两支队伍在一场比赛中对决,轮流担任攻击者(恐怖分子 - Ts)和防御者(反恐精英 - CT)。一场比赛包含 2 分钟的回合,其中 Ts 必须在两个炸弹点之一安放炸弹,而 CT 则必须阻止炸弹或拆除炸弹。率先赢得 13 回合的队伍将获得比赛胜利。由于比赛在大量观众面前举办,职业球队争夺丰厚的奖金,职业赛事的风险很高。尽管存在这些事实和丰富的可用数据,但迄今为止,在提高个人和团队绩效方面仅探索了少数人工智能驱动的解决方案,而且它在实际应用中尚未得到广泛普及。

▼ 这个研究创新的架构

文章比较长,希望各位有耐心阅读!

如果您认可我的内容的话,我非常希望您可以帮我转载/传播一下,让更多人了解前沿的文献/产品相关资讯!大郭在这里抱拳了

我联系方式放在文末了!

欢迎各位关注一下我的抖音、小红书、等平台!

<SSAC25时间异构图神经网络:揭开职业《反恐精英》玩家动作评估的技术面纱

在电子竞技蓬勃发展的今天,《反恐精英》(Counter-Strike, CS)作为最具影响力的第一人称射击游戏之一,其职业比赛的竞技水平和战术深度早已超越了普通游戏的范畴。想象一下,在一场紧张刺激的CS比赛中,选手们每秒钟要做出数十次操作,这些操作如何影响比赛的胜负?有没有一种方法能够像体育分析师研究足球比赛一样,对CS选手的动作进行科学、系统的评估?

近日,一篇名为《使用时间异构图神经网络评估职业<反恐精英>中的玩家动作》的研究论文为我们带来了答案。该研究提出了一种基于时间异构图神经网络(Temporal Heterogeneous Graph Neural Networks, THGNN)的创新框架,能够从微观层面解析CS比赛中玩家动作对胜负的影响,为电子竞技的数据分析和战术研究开辟了新的方向。

电子竞技数据分析的挑战与机遇

电子竞技与传统体育最大的区别之一在于其“数字化”的本质。在虚拟的游戏世界中,每一个玩家的动作、每一个道具的使用、每一次击杀或死亡,都以数据的形式被精确记录下来。这为数据分析提供了得天独厚的优势,但同时也带来了巨大的挑战。

以《反恐精英2》(CS2)为例,一场比赛由多个回合组成,每个回合持续2分钟。在每个回合中,进攻方(恐怖分子,Ts)需要在两个爆破点之一安放炸弹,而防守方(反恐精英,CTs)则需要阻止炸弹安放或在安放后拆除。比赛的胜负由率先赢得13个回合的队伍决定。

在如此复杂的游戏机制下,玩家的动作不仅包括简单的移动、射击,还涉及武器选择、道具使用、团队配合等多个维度。如何将这些多维数据整合起来,建立一个能够准确评估玩家动作影响的模型,一直是电子竞技数据分析领域的难点。

作者:Szmida ,帕特里克·彼得

Patrik Peter Szmida,24岁,在匈牙利出生长大。他拥有布达佩斯技术经济大学计算机科学工程荣誉硕士学位(2025年)。他的研究方向为人工智能(AI),重点研究AI模型和神经网络的数学基础。他曾参加过该校的学生科学大会,并在神经网络类别中获得一等奖。过去两年,他一直从事软件开发工作。Patrik在传统体育和电子竞技领域都拥有深厚的背景。在转战《反恐精英》电子竞技之前,他曾打了十年篮球,并在两个项目的地区锦标赛中都取得了成功。竞技体育的经历自然而然地激发了他对体育分析的兴趣。在大学期间,他参与了篮球、足球和《反恐精英》电子竞技等多个学科的体育分析项目,利用人工智能驱动的创新推动该领域的发展。

托卡·拉兹洛

László Toka 现任布达佩斯技术经济大学副教授、HSN 实验室副主任,以及 HUNREN-BME 云应用研究小组成员。他于 2011 年获得巴黎高科电信博士学位,并于 2011 年至 2014 年在爱立信研究中心工作,之后转入学术界,专注于体育分析、人工智能、网络和云计算的研究。

传统方法的局限性

过去,一些研究尝试使用传统的机器学习方法,如逻辑回归、XGBoost等,对CS比赛数据进行分析。这些方法通常将游戏状态表示为表格数据,包括玩家位置、武器、生命值、剩余时间等特征。然而,这种方法忽略了游戏中的空间结构和时间动态性,难以捕捉到玩家之间的交互关系和地图布局对比赛的影响。

例如,在CS中,地图的每一个角落都有其独特的战略意义。A点的长廊、B点的楼梯,这些不同的地图区域之间的连通性和战术价值,很难用简单的表格数据来表示。此外,玩家的动作是随时间动态变化的,一个击杀动作的影响可能会持续多个时间点,传统的静态模型难以捕捉这种时间上的依赖性。

图神经网络的崛起

图神经网络(Graph Neural Networks, GNN)的出现为解决这些问题提供了新的思路。图结构能够自然地表示游戏中的空间关系——玩家和地图区域可以看作图中的节点,而他们之间的交互和移动路径则可以看作边。而异构图神经网络(Heterogeneous GNN)则更进一步,能够处理不同类型的节点和边,非常适合表示CS这种复杂的游戏场景。

时间异构图神经网络(THGNN)则是在异构图神经网络的基础上,加入了时间维度的考虑,能够处理动态变化的图结构。这使得THGNN能够同时捕捉游戏中的空间结构和时间动态,为准确评估玩家动作的影响提供了可能。

数据处理:从游戏回放中提取知识

要构建一个有效的THGNN模型,首先需要将游戏回放数据转换为适合图神经网络处理的格式。该研究采用了一种系统的数据处理流程,从公开的职业比赛回放文件中提取关键信息,并构建动态异构图数据集。

数据收集与预处理

研究团队收集了2023年10月CS2发布至2024年9月期间,S级 tournaments中所有在地图“Inferno”上进行的职业比赛回放,共114场比赛。这些回放文件以demo格式存储,包含了比赛的所有细节,从玩家的每一个移动到每一颗手榴弹的轨迹。

▼ 也就是咱们国服的炼狱小镇(作者喜欢打自由人,还是蛮喜欢这个图的)

为了提取有用的数据,研究人员使用了awpy包,这是一个专门用于解析CS demo文件的工具。他们以每秒4个快照的频率解析比赛,每个快照包含了玩家状态(位置、速度、武器、生命值等)、道具轨迹、地图状态(是否燃烧、是否烟雾弥漫)等关键信息。

构建地图图模型

地图是CS比赛的舞台,其结构对战术选择和比赛结果有着深远的影响。为了在图模型中表示地图结构,研究团队与一位前职业选手合作,构建了一个精确的地图图模型。

在这个模型中,每个节点代表一个大约相当于烟雾弹覆盖面积的区域。选择烟雾弹覆盖面积作为节点大小是因为烟雾弹是CS中重要的战术道具,地图设计者通常会根据烟雾弹的大小来设计关键位置和路径。节点的特征包括坐标、是否燃烧、是否被烟雾覆盖等。

边表示节点之间的连通性——如果玩家可以在两个节点之间双向移动,则在这两个节点之间添加一条无向边。此外,研究团队还使用密度聚类算法分析玩家的击杀和死亡数据,确定常见的交火区域,并在这些区域添加额外的节点,以突出重要的战术位置。

创建动态异构图快照

有了地图图模型,接下来需要将玩家信息添加到图中,形成表示游戏状态的动态异构图。每个快照以地图图为基础,添加玩家作为新的节点类型。

玩家节点包含丰富的特征,包括:

  • 状态描述属性:坐标、速度、视角方向、携带和装备的武器、生命值

  • 比赛统计数据:造成的伤害、成功击杀数、死亡数

  • 综合性能指标:如HLTV Rating 2.1、KAST(击杀-助攻-存活-交换)率、Impact(多杀、首杀、残局的影响)值等

每个玩家节点通过“玩家-地图”边连接到最近的地图节点,并添加一个“玩家-玩家”自环边,用于后续的特征变换。

除了节点特征,图级特征也被加入到模型中,包括剩余时间、炸弹是否安放及其位置、存活玩家数量、团队总生命值、团队装备价值等。最重要的图级特征是一个布尔值,表示防守方是否赢得了该回合,这将作为模型的训练目标。

构建离散时间动态图

为了捕捉时间动态,研究团队将20个连续的静态图快照沿时间轴连接,形成5秒的时间窗口,称为离散时间动态图(Discrete-Time Dynamic Graphs, DTDGs)。为了增加数据多样性,还以2.5秒的时间偏移创建了额外的时间窗口。

这一预处理流程应用于所有114场比赛的所有回合,最终生成了约90,000个DTDGs,构成了模型训练的基础。

时间异构图神经网络模型架构

有了高质量的数据集,接下来需要设计一个能够有效处理动态异构图数据的神经网络模型。该研究提出的THGNN模型架构由三个主要部分组成: 空间卷积、时间卷积和密集层,能够系统地提取和学习图数据中的空间和时间模式。

空间卷积:捕捉图的空间结构

空间卷积是THGNN的第一步,其目标是通过多个卷积操作将节点信息传播到相邻节点,为每个节点创建嵌入表示。该研究提出的空间卷积策略基于一个核心直觉:玩家是影响胜负概率变化的主要因素,因此卷积操作应优先考虑玩家节点的信息传播。

具体来说,空间卷积层由三个步骤组成:

  1. 玩家节点自环卷积:玩家节点通过“玩家-玩家”自环边生成自己的嵌入。这一步实际上是一种降维操作,让网络自动学习玩家特征的更紧凑表示,而不是手动选择特征。

  2. 玩家到地图的信息传播:玩家节点的嵌入通过“玩家-地图”边传播到最近的地图节点。这一步创建了一个融合了地图特定信息和玩家相关信息的地图嵌入。

  3. 地图节点间的信息传播:更新后的地图嵌入通过“地图-地图”边在地图节点之间传播。

在具体实现上,该模型使用图注意力(GAT)卷积作为每个子卷积的基本单元。最佳性能的模型采用了两层异构图卷积, followed by三层地图到地图的卷积。

时间卷积:捕捉动态时间模式

空间卷积处理了单个静态图的空间结构,而时间卷积则负责捕捉多个静态图之间的时间依赖关系和趋势。该研究使用GraphGRU(图门控循环单元)算子来实现这一功能。

GraphGRU是一种专门用于图数据的循环神经网络单元,能够更新节点嵌入以反映时间模式。模型包含两个GraphGRU层,分别用于处理两种节点类型(地图节点和玩家节点),确保两种类型的节点能够独立学习时间模式。

密集层:生成最终预测

在完成空间和时间卷积后,模型将20个静态图的嵌入展平为一批向量,然后通过密集层生成最终的预测结果——防守方赢得该回合的概率。

整个模型架构如图3.1所示,它能够有效地处理动态异构图数据,同时捕捉空间和时间维度的模式。

模型性能:超越传统方法的准确性

经过广泛的超参数优化,该研究提出的THGNN模型取得了令人瞩目的性能——准确率超过76%。为了验证THGNN的有效性,研究团队将其与其他几种模型进行了对比,包括:

  • 基线模型:基于随机预测

  • 逻辑回归:一种传统的线性分类模型

  • XGBoost:一种先进的梯度提升树模型,由Peter Xenopoulos等人提出

对比结果如表3.1所示,THGNN在多个指标上都显著优于其他模型:

模型

Log-Loss

F1-score

AUC

基线

0.693

0.5

0.5

逻辑回归

0.4688

0.7387

0.7564

XGBoost

0.5353

-

0.7913

提出的THGNN

0.4587

0.7463

0.8549

从表中可以看出,THGNN的Log-Loss最低,说明其概率预测最为准确;F1-score和AUC值也最高,表明其分类性能优于其他模型。

模型校准:可靠的概率预测

对于一个用于评估玩家动作影响的模型来说,不仅需要准确率高,还需要其概率预测是可靠的,即模型需要良好的校准。校准良好的模型意味着其预测的概率值能够真实反映实际的胜负概率。

该研究通过绘制校准曲线和计算预期校准误差(Expected Calibration Error, ECE)来评估THGNN的校准性能。如图3.3所示,THGNN的校准曲线与完美校准线非常接近,ECE仅为0.0307,表明模型的概率预测是可靠的。

这种良好的校准性能对于后续的玩家动作评估至关重要,因为它确保了我们可以信任模型预测的胜负概率变化,从而准确评估玩家动作的影响。

玩家动作评估:从模型预测到可解释的洞察

构建THGNN模型的最终目标是评估玩家动作对比赛结果的影响。为此,该研究提出了一种基于事件的解释方法,利用Shapley值来量化每个玩家动作对胜负概率变化的贡献。

基于事件的解释方法

该方法的核心思想是将胜负概率的变化与玩家动作关联起来。设为时刻防守方的估计胜率,为时刻到之间的胜率变化。玩家动作是胜率变化的主要驱动因素,因此可以表示为所有玩家在该时间段内所做动作的累积影响。

数学上,这可以表示为:

其中,表示玩家索引,是玩家在到之间所做的动作数量,表示玩家的动作在该时间段内对胜率的影响。

为了计算每个动作的影响,研究团队使用了Shapley值,这是一种来自合作博弈论的概念,用于公平地分配每个参与者对总收益的贡献。通过训练解释模型并计算Shapley值,可以确定每个特征(进而每个动作)对胜率变化的贡献。

事件数据集的构建

为了计算Shapley值,需要构建一个事件数据集,捕捉所选回合的事件。该数据集从构成动态图的静态图中提取玩家和地图节点的状态描述特征,包括:

  • 玩家特定属性:位置、速度、视角方向、当前武器

  • 地图特定条件:区域是否燃烧或烟雾弥漫

数据集的每一行记录了回合内连续时间戳和之间所有特征的变化,并添加了一个表示到之间胜率变化的列,作为解释模型的输出变量。

由于THGNN模型是在代表5秒时间窗口的动态图上训练的,一个动作的影响可能会持续多个时间戳。为了捕捉这种长时间的影响,研究团队创建了多个事件数据集,捕捉不同时间间隔(1秒、2秒、直到5秒)的事件,然后将这些数据集的结果聚合起来,提供更全面的动作影响分析。

Shapley值计算与后处理

解释模型使用Ridge回归(α=0.1)训练,故意过拟合以尽可能接近GNN的预测。然后使用SHAP Python包计算Shapley值,量化每个特征对胜率变化的贡献。

为了确保解释的合理性,研究团队应用了两个过滤条件:

  1. 死亡玩家的影响限制:一个在回合中被淘汰的玩家不能在死亡后影响胜率。因此,允许在玩家淘汰后有一个2秒的时间窗口,在此期间仍可归因贡献,之后玩家的Shapley值设为零。

  2. 不变特征的零贡献:如果一个状态描述特征在分析的时间间隔内没有变化,其对胜率的贡献为零。

经过这些过滤后,每个特征的Shapley值在时间戳上取平均,聚合不同时间间隔的贡献。最终,对于任何给定的时间,可以得到基于前5秒的每个特征的Shapley值,反映它们对胜率的影响。

玩家在时间到之间的动作的影响可以通过以下公式计算:

其中,是动作的Shapley值,是所有特征的Shapley值绝对值之和,是到之间的胜率变化。

应用案例:从关键事件到战略洞察

该研究提出的框架不仅能够准确预测回合胜负概率,还能深入分析玩家动作的影响,为职业战队提供有价值的战略洞察。下面通过几个具体案例,展示该框架的实际应用价值。

突出关键事件:首杀的影响

如图1.1所示,在G2 Esports对阵MOUZ的比赛中,进攻方玩家nexa的首杀导致防守方的胜率下降了22%。Shapley值分析表明,最重要的因素是防守方玩家(CT1)失去了所有生命值和护甲,以及nexa(T9)的伤害统计增加。

另一个例子如图5.1所示,在IEM Dallas 2024的比赛中,防守方玩家siuhy的首杀使防守方的胜率提高了15%。最高Shapley值的特征与进攻方玩家Stewie2K(T6)的生命值和护甲损失以及siuhy的伤害增加有关。

突出关键事件:残局的决定性作用

除了首杀,残局(Clutch)也是CS比赛中最激动人心的时刻——当一名玩家面对多名敌人并成功获胜时,往往能扭转战局。如图5.2所示,在PGL Copenhagen major的总决赛中,进攻方FaZe战队的玩家frozen在不利位置赢得了1v2的残局,成功防守已安放的炸弹并赢得回合。

在61秒时,一名防守方玩家掉落了燃烧弹,导致另一名防守方玩家(图5.3(b)中黄色高亮)不得不后退去捡取,这暂时降低了胜率。一旦燃烧弹被捡取并选为主动武器,团队的胜率增加了近5%。值得注意的是,当时有四名进攻方玩家在附近,准备向防守方守卫的爆破点发起进攻。如果他们决定推进,一枚时机恰当的燃烧弹可以延迟他们的进攻。有趣的是,尽管进攻没有发生,但模型仍然积极评价了持有燃烧弹作为主动武器的行为,认识到了潜在的威胁和装备的潜在影响。

烟雾弹战术的精确评估

烟雾弹是CS中最重要的战术道具之一,正确使用烟雾弹可以极大地影响比赛结果。如图5.4所示,在一场比赛中,进攻方投掷的烟雾弹落在了A-long位置(图5.4(b)),这是进攻方常用的战术,用于阻挡该区域潜在防守方的视线并获得地图控制权。

相同事件的不同影响:上下文的重要性

该模型的一个关键优势是能够根据具体上下文估计队伍的回合胜率。因此,相同的事件在不同情况下可能有不同的影响(胜率变化)。这使得能够深入分析类似动作在不同上下文中如何影响结果,这对职业玩家来说是一个有趣的问题:为什么一个事件在不同回合中影响更大或更小,哪些上下文因素导致了这些变化?

首杀就是一个很好的例子:在职业CS中,获得首杀至关重要,因为首先获得人数优势的队伍对回合结果有更大的控制权。在图5.1的例子中,siuhy的首杀使防守方的胜率提高了15%。相比之下,图5.5展示了其他几场比赛和场景中的首杀。

在第一个案例中,Stewie2K的首杀导致他的队伍胜率增加了近30%。这一显著增加很可能是因为他的队伍在武器方面远不如对手,因此首杀的影响更大。值得注意的是,不久之后发生了双杀,进一步将胜率提高了30%。两次击杀带来的胜率增加与关键首杀相当,这凸显了这些关键时刻在决定回合结果中的重要性。

图5.5(b)展示了一个团队装备价值平衡的首杀案例。这一事件导致进攻方胜率增加了17%,明显低于第一个场景。图5.5(c)分析了另一个首杀事件,在该回合中双方队伍武器平衡。然而,在这种情况下,胜率增加了5%(+22%),高于前一个案例。这很可能是因为进攻方在确保其中一个爆破点方面的位置比(b)场景中的另一支进攻方强得多,进一步放大了这一事件的重要性。

这些例子表明,相同的事件根据上下文可能有不同的影响值,为职业战队提供了宝贵的机会来检查和理解这些动态。此外,该框架允许战队通过测试最小的变化来试验战略执行,获得关于哪些略微改变的场景产生最大影响的定量反馈,例如首杀。这种分析可以提供关键见解,帮助战队微调战略,在准备过程中获得显著优势。

相关工作:从传统方法到THGNN的突破

该研究建立在Peter Xenopoulos等人的工作基础上,他们提出了一种利用XGBoost模型评估CS玩家动作的方法。Xenopoulos的方法 使用表格数据表示游戏状态,包含大量特征,如玩家位置、武器、生命值、剩余时间和存活玩家数量,来预测CS回合的胜率。

通过在多个时间点生成预测,他们分析了团队胜率随时间的波动,将这些变化归因于玩家动作和游戏内事件。他们还提出了一种新的玩家评分指标, 即胜率增加(Win Probability Added, WPA),通过汇总回合内与伤害相关事件的影响来量化玩家对团队胜率的影响。这种创新方法通过玩家的伤害影响提供了对玩家贡献的重点评估,展示了基于胜率的指标在评估性能方面的潜力。

相比之下,本研究提出的解决方案通过使用THGNN来捕捉地图的空间结构和玩家动作的时间模式,改进了之前的方法,从而能够更准确和细致地评估玩家表现。除了这些改进,该框架还能够评估非伤害相关事件的重要性,提供对玩家动作的全面评估。

这种方法的优势在于它能够处理CS游戏的复杂性——从地图的空间布局到玩家之间的动态交互,再到时间上的战术变化。通过将游戏表示为动态异构图,THGNN能够捕获传统表格方法无法捕捉的复杂关系和模式,从而实现更精确的胜率预测和更深入的动作评估。

  • 作者介绍Max大郭

猜你喜欢

有机肥自动计量称重包装机-有机肥自动计量称重包装机批发价格

双斗计量肥料包装机——灵活适配,多场景应用设备采用双斗独立计量结构,支持单斗或双斗同时工作,可根据生产需求自由切换模式,适应小批量定制与大规模量产场景。高精度传感器与动态滤波技术,确保在粉尘、振动环境下仍能保…

有机肥自动计量称重包装机-有机肥自动计量称重包装机批发价格

小陈格局差距大,房子未动手,先哭穷了

小陈曾經声称要帮助大哥盖房子,更是表示只需要大哥出资四万块,其他一切都将由他包揽。如今房子还未开工,小陈便开始哭诉自己经济拮据,竟然推翻了原先的承诺,要求大哥出十万元,而自己则只愿意出十五万。大哥花了一万多块…

小陈格局差距大,房子未动手,先哭穷了

小米汽车回应YU7是否难破窗 配备专用破窗锤

小米YU7全车配备了双层夹胶玻璃,对于突发情况下的破窗问题,小米汽车在6月29日晚的最新一期答网友问中表示无需担心。他们特别为小米YU7设计了一款破窗锤,采用5mm钨钢破窗尖,轻巧易握,能有效击破夹层玻璃

小米汽车回应YU7是否难破窗 配备专用破窗锤

这个既老又丑还蠢擅长作妖过分贪婪反复横跳的女人离凉凉不远了!

想必她的化妆师是世界上最难做工的人之一,想把她打理得稍微像个人,真是难上加难,犹如给长城铺瓷砖,给黄河过滤泥沙,或者让潘金莲立贞节牌坊,真是费力不讨好。陶晶莹这些年仿佛小丑般在两岸间游荡,既想挣大陆的钱,又…

这个既老又丑还蠢擅长作妖过分贪婪反复横跳的女人离凉凉不远了!

二氧化硫蒸馏仪采购指南

采购二氧化硫蒸馏仪时,需综合考虑设备性能、合规性、应用需求及售后服务等因素。检测标准:确认设备需符合的标准(如《中国药典》、AOAC、ISO等),确保蒸馏方法(直接蒸馏、水蒸气蒸馏等)匹配。 需求清单:列出…

二氧化硫蒸馏仪采购指南