腾讯TiG框架让AI在《王者荣耀》中学会战略性思考(腾讯ui框架)

腾讯TiG框架让AI在《<strong>王者荣耀</strong>》中学会战略性思考(腾讯ui框架)

(来源: )

10 月 4 日消息,据 decoder 今天报道,腾讯研究人员最近用《王者荣耀》游戏作为训练平台,探索如何让 AI 在游戏中学会“战略性思考”,研究全新 TiG(Think in Games)框架,相关成果已发表于 Hugging Face 平台和 arXiv 期刊。

研究团队指出,目前的 AI 模型存在明显的功能鸿沟,以游戏为取向的 AI 能正常游玩但无法理解自己所做的决策,而语言模型虽然可以推理策略,但很难真正执行操作,为此他们研发了全新 TiG 框架,让模型在游戏中同步思考、行动。

团队选择以《王者荣耀》游戏作为训练范本,先使用匿名且标准化的赛事数据定义推上路、击杀暴君、守家等 40 种宏观行动,胜负回数均衡,AI 模型们必须要在每个定义好的场景下选择最佳策略,并解释其战略缘由。

具体来说,训练分为两个阶段,首先是在监督中学习,弄清楚这些策略的基本机制;随后通过奖励机制进行强化学习,如果行动正确能得 1 分,错误行动则得 0 分。

随后团队测试了多种语言模型,涵盖 Qwen2.5(7B、14B、32B)、Qwen3-14B 模型,并使用 Deepseek-R1 大模型作为对照组;先从 Deepseek-R1 提炼高质量训练数据,然后使用群体相对策略优化(GRPO)技术,比较不同策略之间的优劣。

最终经过 TiG 框架训练的模型不仅能制定行动计划,还能解释原因,例如 AI 会指出某个防御塔防守薄弱,是理想的进攻目标,但需要注意埋伏的敌人。模型训练后仍保持原有的文本理解、数学推理与问答能力。

特别声明:[腾讯TiG框架让AI在《王者荣耀》中学会战略性思考(腾讯ui框架)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

悬疑剧“封神榜”:『白敬亭』《开端》仅第六,冠军9.4分实至名归!

庭外》是一部结构极为新颖的犯罪悬疑剧,它巧妙地将故事分为了《盲区》和《落水者》两个篇章,两个故事彼此独立又互有关联,共同构建了一个复杂的法律案件宇宙。 它同样由“毛骗”团队打造,却是一部融合了“悬疑”与“…

悬疑剧“封神榜”:『白敬亭』《<strong>开端</strong>》仅第六,冠军9.4分实至名归!

印度学者妄言中国被现场打脸 高志凯有力回怼(印度学者冒死揭秘)

10月2日,全球化智库副主任高志凯发布了一段他此前参加活动与印度学者辩论的视频。视频中,印度学者纳伦达声称“中国一个朋友都没有”。对此,高志凯当场回应,如果印度不把中国当朋友,印度永远不会成为联合国常任理事国,因为中国拥有一票否决权

印度学者妄言中国被现场打脸 高志凯有力回怼(印度学者冒死揭秘)

智慧体育场馆建设声学结构优化(智慧体育设施)

本文将围绕智慧体育场馆建设中的声学结构优化展开讨论,介绍相关声学原理、设计要点及优化策略,帮助读者了解如何通过科学合理的声学设计提升体育场馆的整体功能。通过合理的空间设计、吸声材料应用、隔音措施以及与扩声系统…

智慧体育场馆建设声学结构优化(智慧体育设施)

脑机接口产业明确路线图(脑机接口技术的上市公司)

此前,工信部等7部门印发《关于推动脑机接口产业创新发展的实施意见》(以下简称《意见》),提出到2030年,脑机接口产业创新能力显著提升,形成安全可靠的产业体系,培育2至3家有全球影响力的领军企业和一批专精特新…

脑机接口产业明确路线图(脑机接口技术的上市公司)

对外提供 AI 服务的风险:合规视角与 AI 安全护栏落地指南(对外提供信息的主要方式)

对比来看,与传统“单一关键词过滤”方案相比,具备多引擎打分与策略编排的 AI-FENCE 更适合对外高暴露场景:在风险识别覆盖与响应时延的平衡上,可将越权请求拦截率提升至95%以上,同时把误杀率控制在5%以…

对外提供 AI 服务的风险:合规视角与 AI 安全护栏落地指南(对外提供信息的主要方式)