Andrej Karpathy回应强化学习之父Sutton最新观点「LLM是“死路一条”」
今天AI大神Andrej Karpathy分享了他对 Sutton老爷子观点的看法,总体上Karpathy认同老爷子对当前LLM研究的批评,并且认为老爷子的观点有趣且具有启发性,但当前的LLM更像是一个向现…
今天AI大神Andrej Karpathy分享了他对 Sutton老爷子观点的看法,总体上Karpathy认同老爷子对当前LLM研究的批评,并且认为老爷子的观点有趣且具有启发性,但当前的LLM更像是一个向现…

近些天,Sutton 再发新论文,在强化学习领域再次发力,将他在 2024 年的时序差分学习新算法 SwiftTD拓展到控制领域,在与一些更强大的预处理算法结合使用时,能够展现出与深度强化学习算法相当的性能…

刚刚,美国计算机学会 ACM 今天宣布 Andrew Barto 和 Richard Sutton 获得 2024 年 ACMA.M.图灵奖,以表彰他们开发了强化学习的概念和算法基础。就强化学习而言,从 2…
