脑机启侦 | 乐观与悲观神经元:大脑如何在决策中平衡风险与回报(02.27)

脑机启侦 | 乐观与悲观神经元:大脑如何在决策中平衡风险与回报(02.27)

图片来源:Pixabay

每一天,我们的大脑都会做出成千上万个大大小小的决策。这些决策——从最微不足道的选择餐馆,到更重大的决定如更换职业或搬到新城市——都可能导致更好的或更差的结果。

那么,大脑是如何衡量风险和回报来做出这些决策的呢?这个问题一直困扰着科学家们,但哈佛医学院和哈佛大学的一项新研究为我们提供了有趣的线索。

研究背景与发现

这项发表在《自然》(Nature)杂志上的研究,将机器学习的概念融入小鼠实验中,以探索支持奖励型决策的大脑回路。

研究人员在小鼠大脑中发现了两组神经细胞:一组帮助小鼠学习高于平均水平的结果,另一组则与低于平均水平的结果相关联。这两组神经元共同作用,使大脑能够评估与某一选择相关的所有可能回报范围。

“我们的结果表明,小鼠——以及通过延伸,其他哺乳动物——似乎比我们之前认为的更能代表关于风险和回报的细微细节。”该研究的共同资深作者、哈佛医学院布拉瓦尼克研究所神经生物学副教授Jan Drugowitsch说道。

如果这一发现能在人类中得到验证,它可能会为理解人类大脑如何做出基于奖励的决策提供框架,并揭示当奖励回路失效时,判断风险和回报的能力会发生什么变化。

机器学习照亮奖励型决策

神经科学家长期以来一直对大脑如何利用过去的经历来做出新的决策感兴趣。然而,Drugowitsch指出,许多传统理论未能捕捉到现实世界行为的复杂性和微妙之处。

他以选择餐馆为例:如果你倾向于稳妥,你可能会选择一家经验告诉你菜品可靠的餐厅;而如果你愿意冒险,你可能会选择一家提供优秀和普通菜品混合的餐厅。

在这个例子中,两家餐馆提供的菜品范围差异很大,但现有的神经科学理论在平均化后将它们视为等同,并预测选择任何一家的可能性相同。

“我们知道这并不是人类和动物的行为方式——我们可以决定是追求风险还是选择稳妥。”Drugowitsch说,“我们对选择所关联的不仅仅是平均预期奖励有更深刻的感受。”

近年来,机器学习研究人员开发了一种决策理论,能够更好地捕捉与某一选择相关的所有潜在回报。他们将这一理论整合到一个新的机器学习算法中,该算法在Atari视频游戏和其他涉及多种可能结果的任务中表现优于其他算法。

“他们基本上问的是,如果算法不仅仅学习某些行为的平均奖励,而是学习整个分布情况,会怎样?结果表明,这种做法显著提高了性能。”Drugowitsch解释道。

在2025年的一篇《自然》论文中,哈佛大学分子与细胞生物学教授Naoshige Uchida及其同事重新分析了现有数据,探讨了这一机器学习理论是否适用于神经科学,特别是啮齿类动物大脑中的决策过程。

分析显示,在小鼠中,多巴胺(一种参与奖励寻求、愉悦和动机的神经递质)的活动与算法预测的奖励学习信号相对应。

换句话说,Drugowitsch表示,这项工作表明新算法在解释多巴胺活动方面更为出色。

小鼠大脑如何表示回报范围

在新研究中,Drugowitsch与共同资深作者Uchida进一步合作,设计了小鼠实验,观察这一过程如何在被称为腹侧纹状体(ventral striatum)的大脑区域中展开。腹侧纹状体储存与某一决策相关的可能奖励信息。

“多巴胺活动仅提供预期奖励的学习信号,但我们希望直接找到大脑中这些已学习奖励的表征。”Drugowitsch说。

研究人员训练小鼠将不同的气味与不同大小的奖励联系起来,从而教会小鼠某一选择的所有可能结果。

随后,他们向小鼠呈现气味,同时观察其舔舐行为(小鼠在期待更好奖励时会更多地舔舐),并记录腹侧纹状体的神经活动。

研究团队在大脑中识别出两组截然不同的神经元:一组帮助小鼠学习超出预期的结果,另一组与低于预期的结果相关联。

“你可以将其想象为大脑中有两个声音——一个乐观主义者和一个悲观主义者,都在为你提供建议。”Drugowitsch解释道。

当研究人员抑制“乐观”神经元时,小鼠表现出的行为表明它预期的奖励不如之前吸引人;相反,当抑制“悲观”神经元时,小鼠的行为则像预期获得了更高价值的奖励。

“这两组脑细胞共同作用,形成对某一决策所有潜在回报分布的完整表征。”Drugowitsch总结道。

展望未来

研究人员看到了许多未来的研究方向,包括当初始选项的含义存在更多不确定性时,大脑如何做出决策,以及他们的发现如何应用于更广泛的推理领域。

Drugowitsch指出,需要更多的研究来确认这些结果是否适用于人类,并将这些发现适应于人类决策的复杂性。

然而,基于小鼠和人类大脑之间的相似性,他认为这项工作已经为人类如何在决策中评估风险提供了启示,并可能解释为什么患有抑郁症或成瘾症的人群在评估风险时会遇到困难。

通过揭示“乐观”和“悲观”神经元的作用,这项研究不仅加深了我们对大脑决策机制的理解,也为改善人类决策能力提供了新的可能性。

新闻来源:Nature

参考文献:DOI: 10.1038/s41586-024-08488-5

特别声明:[脑机启侦 | 乐观与悲观神经元:大脑如何在决策中平衡风险与回报(02.27)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

格力热泵||连续9年荣获“热泵行业领军品牌”!(格力热力泵空调有制冷的效果吗?)

为推动我国热泵产业高质量发展,由中国节能协会热泵专业委员会主办,主题为的“2025年中国热泵行业年会暨第十四届国际热泵行业发展高峰论坛”于2025年7月30日在济南喜来登大酒店隆重召开。目前,格力通过在商业…

格力热泵||连续9年荣获“热泵行业领军品牌”!(格力热力泵空调有制冷的效果吗?)

香港发现首例基孔肯雅热输入病例 12岁男童确诊(香港发现首例基因突变)

8月2日,香港发现首例基孔肯雅热输入病例,患者是一名12岁男童。基孔肯雅热是一种由基孔肯雅病毒引起的急性传染病,主要通过伊蚊叮咬传播,在全球热带和亚热带地区广泛流行,并且其流行范围持续扩大

香港发现首例基孔肯雅热输入病例 12岁男童确诊(香港发现首例基因突变)

电信流量卡办理需要身份证吗?2025避坑时间表(电信流量卡办理推荐)

10-15岁:监护人带户口本+本人身份证线下办,离异家庭需加带离婚协议证明监护权16-18岁:可独立办卡但禁用学生套餐(需学信网认证,休学党直接卡审)单亲妈妈带儿子办卡,忘带离婚证白跑营业厅🔥 银发族年龄…

电信流量卡办理需要身份证吗?2025避坑时间表(电信流量卡办理推荐)

AI驱动的内容生成与SEO适配:从关键词到语义逻辑的突破_一躺科技(ai驱动器)

AI驱动的内容生成通过深度学习和自然语言处理技术,能够实现对用户意图的精准理解,从而生成更具语义价值的内容。其独特的语义逻辑优化算法,使得生成的内容不仅在关键词匹配上表现优异,更能在语义层面与用户需求深度契合…

AI驱动的内容生成与SEO适配:从关键词到语义逻辑的突破_一躺科技(ai驱动器)

深度研究终极指南:从入门到“这玩意儿总算能用了”(深度研究报告怎么写)

作为一个非技术出身的人,这是我第一次看到 AI 把我工作中最核心、也是我最擅长的部分,从头到尾都给自动化了。“研究”这个词听起来可能更像是学术圈或者某些初级岗位的活儿;但你仔细想想,我敢打赌你肯定也花了不少时…

深度研究终极指南:从入门到“这玩意儿总算能用了”(深度研究报告怎么写)