脑机启侦 | 乐观与悲观神经元：大脑如何在决策中平衡风险与回报（02.27） #科技 #奖励 #大脑 #的结果 #神经元 #决策

图片来源：Pixabay

每一天，我们的大脑都会做出成千上万个大大小小的决策。这些决策——从最微不足道的选择餐馆，到更重大的决定如更换职业或搬到新城市——都可能导致更好的或更差的结果。

那么，大脑是如何衡量风险和回报来做出这些决策的呢？这个问题一直困扰着科学家们，但哈佛医学院和哈佛大学的一项新研究为我们提供了有趣的线索。

研究背景与发现

这项发表在《自然》（Nature）杂志上的研究，将机器学习的概念融入小鼠实验中，以探索支持奖励型决策的大脑回路。

研究人员在小鼠大脑中发现了两组神经细胞：一组帮助小鼠学习高于平均水平的结果，另一组则与低于平均水平的结果相关联。这两组神经元共同作用，使大脑能够评估与某一选择相关的所有可能回报范围。

“我们的结果表明，小鼠——以及通过延伸，其他哺乳动物——似乎比我们之前认为的更能代表关于风险和回报的细微细节。”该研究的共同资深作者、哈佛医学院布拉瓦尼克研究所神经生物学副教授Jan Drugowitsch说道。

如果这一发现能在人类中得到验证，它可能会为理解人类大脑如何做出基于奖励的决策提供框架，并揭示当奖励回路失效时，判断风险和回报的能力会发生什么变化。

机器学习照亮奖励型决策

神经科学家长期以来一直对大脑如何利用过去的经历来做出新的决策感兴趣。然而，Drugowitsch指出，许多传统理论未能捕捉到现实世界行为的复杂性和微妙之处。

他以选择餐馆为例：如果你倾向于稳妥，你可能会选择一家经验告诉你菜品可靠的餐厅；而如果你愿意冒险，你可能会选择一家提供优秀和普通菜品混合的餐厅。

在这个例子中，两家餐馆提供的菜品范围差异很大，但现有的神经科学理论在平均化后将它们视为等同，并预测选择任何一家的可能性相同。

“我们知道这并不是人类和动物的行为方式——我们可以决定是追求风险还是选择稳妥。”Drugowitsch说，“我们对选择所关联的不仅仅是平均预期奖励有更深刻的感受。”

近年来，机器学习研究人员开发了一种决策理论，能够更好地捕捉与某一选择相关的所有潜在回报。他们将这一理论整合到一个新的机器学习算法中，该算法在Atari视频游戏和其他涉及多种可能结果的任务中表现优于其他算法。

“他们基本上问的是，如果算法不仅仅学习某些行为的平均奖励，而是学习整个分布情况，会怎样？结果表明，这种做法显著提高了性能。”Drugowitsch解释道。

在2025年的一篇《自然》论文中，哈佛大学分子与细胞生物学教授Naoshige Uchida及其同事重新分析了现有数据，探讨了这一机器学习理论是否适用于神经科学，特别是啮齿类动物大脑中的决策过程。

分析显示，在小鼠中，『多巴胺』（一种参与奖励寻求、愉悦和动机的神经递质）的活动与算法预测的奖励学习信号相对应。

换句话说，Drugowitsch表示，这项工作表明新算法在解释『多巴胺』活动方面更为出色。

小鼠大脑如何表示回报范围

在新研究中，Drugowitsch与共同资深作者Uchida进一步合作，设计了小鼠实验，观察这一过程如何在被称为腹侧纹状体（ventral striatum）的大脑区域中展开。腹侧纹状体储存与某一决策相关的可能奖励信息。

“『多巴胺』活动仅提供预期奖励的学习信号，但我们希望直接找到大脑中这些已学习奖励的表征。”Drugowitsch说。

研究人员训练小鼠将不同的气味与不同大小的奖励联系起来，从而教会小鼠某一选择的所有可能结果。

随后，他们向小鼠呈现气味，同时观察其舔舐行为（小鼠在期待更好奖励时会更多地舔舐），并记录腹侧纹状体的神经活动。

研究团队在大脑中识别出两组截然不同的神经元：一组帮助小鼠学习超出预期的结果，另一组与低于预期的结果相关联。

“你可以将其想象为大脑中有两个声音——一个乐观主义者和一个悲观主义者，都在为你提供建议。”Drugowitsch解释道。

当研究人员抑制“乐观”神经元时，小鼠表现出的行为表明它预期的奖励不如之前吸引人；相反，当抑制“悲观”神经元时，小鼠的行为则像预期获得了更高价值的奖励。

“这两组脑细胞共同作用，形成对某一决策所有潜在回报分布的完整表征。”Drugowitsch总结道。

展望未来

研究人员看到了许多未来的研究方向，包括当初始选项的含义存在更多不确定性时，大脑如何做出决策，以及他们的发现如何应用于更广泛的推理领域。

Drugowitsch指出，需要更多的研究来确认这些结果是否适用于人类，并将这些发现适应于人类决策的复杂性。

然而，基于小鼠和人类大脑之间的相似性，他认为这项工作已经为人类如何在决策中评估风险提供了启示，并可能解释为什么患有抑郁症或成瘾症的人群在评估风险时会遇到困难。

通过揭示“乐观”和“悲观”神经元的作用，这项研究不仅加深了我们对大脑决策机制的理解，也为改善人类决策能力提供了新的可能性。

新闻来源：Nature

参考文献：DOI: 10.1038/s41586-024-08488-5

脑机启侦 | 乐观与悲观神经元：大脑如何在决策中平衡风险与回报（02.27）

猜你喜欢

盘点5款告别“龟速”的音乐格式转换器，再也不怕音频转换速度太慢了

57岁『伊能静』杀疯2026！剪10年刘海狂瘦10斤，预言马年重生惊呆全网：姐的野心藏不住了！(『伊能静』怒斥网友)

光伏支架领域优选广西科盛『新能源』科技，技术领先产品多样，为全球光伏项目提供可靠支撑(光伏支架发展前景)

和你一起品味售后完善的便携式紫外烟气分析仪供应商哪家好(和你一起来)

《妈妈的朋友》：跨越年龄的陪伴，是迷茫青春最暖的光