摘要
基底神经节是大脑深部一系列神经功能核团的总称,主要与周围的大脑皮层、丘脑、小脑和脑干相连.基底神经节的主要功能是参与运动调节和随意运动控制,特别是行为的决策确定和动作选择.本文主要介绍基于基底神经节机理的行为决策确定模型,重点综述决策确定和动作选择的理论模型进展.首先介绍了基底神经节的解剖结构,即输入核、输出核、多巴胺系统和中继核,进而描述了基底神经节的功能连接(直接通路、间接通路和超直接通路),然后基于基底神经节的多个皮质-BG回路之间的相互作用,概述了决策模型在运动和行为选择等方面的理论模型,主要有Gurney的选择-控制模型、Humphries的神经元群模型、Frank的认知决策模型、Wang的选择决策模型和Rabinovich相空间动力学选择模型等.最后讨论了这些理论决策模型和大脑疾病(帕金森病)的相互关系等.
基底神经节(Basal ganglia,BG)是指在结构和功能上相互连接的皮质下结构的集合.在过去的三十年里,由于解剖学,电生理学和计算机科学的不断发展,大量的BG计算模型源源不断地被开发出来.研究的不断深入促使我们对BG的结构和功能产生新的认识的同时,也暴露了BG的定性模型在解释当前数据和预测未来实验结果方面的不足.行为决策模型是对BG更为系统的建模.
行为决策是解决竞争性行为选择之间的冲突,或者更简单地说,是解决动物和人工智能体所面临的一个普遍问题,即下一步要做什么.为识别用于行为决策的神经底物和解决这样的一个问题,一方面,需要理解行为生物学基础(行为学、神经生物学和心理学)和构建人工智能体的相关知识.另一方面,需要对BG建立一个计算模型,综合BG的连接结构、电生理和生物化学等方面的相关数据,在全局角度对BG进行相对精确的模拟.因此,我们急需一个连贯的理论框架,将这些数据等信息汇总到一个综合的环境中.把生物神经与数学建模相结合就提供了一个很好的研究方法.而最近几十年里,对行为决策建模的主流思路有两个,一个是解除所需行为动作的抑制,同时保持或增加不希望行为动作的抑制;另一个是解决大脑中行为表达上存在竞争的功能单元之间的冲突.而在建模结构上,受生物解剖结构的启发,可分为两类模型:一类是解剖学和生物学上较为详细的模型,其中包括对神经元和突触内的生物物理过程(例如离子通道)的精确描述;另一类是不太详细的模型,这类模型试图用更简单和紧凑的方程来描述神经元的动态过程和突触学习,但仍然受到神经生物学结构的限
本综述对行为决策模型的介绍将从以下几方面进行组织.首先,我们将介绍行为决策模型的相关生物背景,在这一部分,本综述只会对与行为决策模型较为相关的BG解剖结构和功能团块,以及BG的功能连接和神经回路进行总体概述.在这里主要是类比人工神经网络的结构,将功能团块分为四类:输入核、输出核、多巴胺系统和中继核,再详细描述BG的直接通路、间接通路和超直接通路,这也是多数模型结构启发的来源.其次,我们再来介绍行为决策模型.在这里首先引入在行为决策模型中常用的竞争学习机制:Winner-takes-all竞争学习规则和Adaptive Resonance竞争学习神经网络,而决策模型主要包括Gurney的选择-控制模型、Humphries的神经元群模型、Frank的认知决策模型、Wang的选择决策模型和Rabinovich相空间动力学选择模型.最后介绍小脑和脑干在皮质-BG环路行为决策过程中所起到的作用,以及行为决策在帕金森病的研究过程中的应用.
BG是脊椎动物大脑中一组起源不同的皮质下核,位于前脑底部和中脑顶部.BG的组成结构从功能上的定义主要可以分为纹状体(Striatum,STR)、苍白球(Globus pallidus,GP)、黑质(Substantia nigra,SN)、底丘脑核(Subthalamic nucleus,STN)和腹侧被盖区(Ventral tegmental area,VTA).GP分为苍白球内段(Internal segment of globus pallidus,GPi)和苍白球外段(External segment of globus pallidus,GPe).SN分为黑质致密部(Substantia nigra pars compacta,SNc)、黑质网状部(Substantia nigra pars recitulata,SNr)和黑质外侧部(Substantia nigra pars lateralis,SNL).每个组成结构都有一个复杂的内部解剖结构和神经化学组织,在BG中起到信息传递的作用,BG的整体解剖结构如

图1 BG运动功能解剖结构
Fig.1 Anatomical structure of motor function of BG
BG与大脑皮层、丘脑、脑干以及其他几个脑区紧密相连,且涉及多种重要功能,包括控制自主运动、行为选择、顺序学习、强化学习、工作记忆和认知等.在过去的几十年中,虽然关于细胞水平连接模式的某些问题仍在研究中,但关于BG的解剖学并没有太多争议,更困难的问题是针对BG运动功能相关问题的研究,这也是本综述想要说明的一个主题,即基于BG机理的行为决策模型.
对BG的功能团块的介绍本综述主要分为四个部分来展开:输入核、中继核、多巴胺能系统和输出核.BG接收来自大脑皮层大部分感觉运动区域的输入,然后投射到丘脑,再投射回对应的大脑皮层运动区域.BG的主要输入结构为STR和STN,STR是皮层向BG输入信号的主要靶点.STR接收信号的输入主要有三个来源:①大脑皮层的大部分区域(运动皮层、辅助运动皮层和体感皮层);②丘脑的多核;③中脑多巴胺能细胞(SNc和VTA).STR从前两个结构接收大量和局部的谷氨酸能(兴奋性)输入,从第三个结构接收多巴胺能细胞投射.BG的第二个主要输入结构是ST
STR主要由中型多棘神经元(Medium spiny neurons,MSNs)组成.其中投射神经元占STR神经元的绝大多数,主要接收大脑皮层的投射.MSNs使用GABA作为主要递质并投射到GP的两个部分和SN
BG的第二个输入结构STN在正常和病理条件下的BG活动中起主要作
GPe中观察到的绝大多数神经元是大型投射神经元.传统上,GPe被认为是BG内的中继核,接收STR的输入并投射到STN.与STR一样,GP投射神经元的主要递质是GAB
SNc是STR-SN通路的一部分,是中脑多巴胺能细胞簇之一,SNc包含大的多巴胺细胞,为STR提供多巴胺能输入,是BG多巴胺能系统的重要组成部分.SNc多巴胺能神经元显示不同类型的放电活动.除这些核外,SNc和SNr中的神经元间也调节SNc中的神经放电模式.SNc的多巴胺能投射针对包括STR(背侧)、GPe和STN在内的大脑多个区域,特别是在GPe和STN中调节放电模式.如前所述,多巴胺受体主要位于D1型或D2型.但最近在STR、海马体和皮质中发现了表达D1/D2受体(异质体)的神经元.尽管多种机制对SNc神经元的死亡原因进行了讨论,但在认知和运动领域的PD患者中研究了SNc的多种异常,表明SNc神经元的死亡是引起PD症状的主要原因.
GPi是BG最常见的输出端口,它接收来自表达D1的STR的MSNs和GPe的抑制性GABA输入,以及来自STN的兴奋性谷氨酸输入.GPi整合这些输入和反馈作用的最终选择,所以被称为BG的输出站.GPi神经元的大多数解剖、生理和生化特征与GPe相似.GP神经元运用解除抑制原理工作.由于GP神经元本身对其目标具有抑制作用,因此,STR输入GP的净作用是减少GP细胞对其目标的强直抑制(解除抑制),增加目标的放电率.
SNr是SN系统腹外侧部分的一个核,SNr通过抑制性GABA投射,从表达GPe、STR-MSNs、STN和SNc的多巴胺能细胞、上丘、丘脑腹侧部分和SNc接收输入.在系统层面上,由于其对上丘的投射,SNr主要参与眼动.然而,由于SNr功能的一般相似性,我们将把GPi-SNr视为BG的单一输出阶段.
上一节中我们已经分别介绍了BG的主要组成结构的相关生理学背景,而各功能团块之间又由包含多种谷氨酸能和GABA神经束所连接.使它们之间可以发生相当复杂的相互作用,并产生信息的传递,BG的功能解剖见

图2 BG功能解剖结构
Fig.2 Functional anatomy of BG
在30年前发表的两个关联理论
在BG的皮质-STR-GP通路中,从大脑皮层传递的信号在STR处产生分支,形成两个截然不同的并行通道.因为它们对靶核,即对丘脑的影响以及传递信号的途径的不同,故而这些投射路径被称为直接通路和间接通路.在直接通路中,STR-MSNs将信号直接投射到输出核(GPi-SNr),并选择性表达D1型受
与直接通路中GPi神经元的抑制投射作用相反,间接通路是通过对GPe的抑制投射而形成的,间接通路的活跃度倾向于增加GPi细胞的活跃度,因此,D2受体被激活时,间接通路也被激活,从而解除GPe对STN的抑制.可以把直接通路更形象地比作一个常闭的控制运动的“门”.这个门是由STR的活动打开,抑制GP的输出,允许出现运动,而间接通路是通过解除STN的抑制,关闭了“门”.这种分离式的定义BG信号传输的通路,导致间接通路抑制运动和直接通路促进运动的经典概念,而且这些通路可能参与调节运动参
早期非计算模型(Albin-Delong模型)(

(a) 早期的Albin-DeLong网络
(a) early Albin-DeLong network

(b) 最新的网络(包含超直接通路)
(b) the latest network (including hyper-direct pathway)
图3 皮质-BG盒箭网络
Fig.3 Cortex-BG box-arrow network
已有研究表明STN应该作为第三个超直接通路的一部分,而不仅仅是间接通路中的一个中继站.皮质-STN-GP通路从运动相关皮质区向GP传递兴奋效应,绕过STR,传导时间比通过直接和间接通路传递的效应短.基于这些发现,Nambu等
在文献[

图4 动态的中心-周围模型
Fig.4 Dynamic Center-Surround model
除以上提到的大脑皮层-BG连接的直接、间接和超直接通路以外,通过解剖学的进一步研究,很多研究者发现皮质-BG系统确实由多个并行且分离的回路组成,其中皮质区域投射到BG的不同区域,并行通路之间的相互作用最小且大多不重

(a) 骨骼运动回路、动眼神经回路、联想回路和边缘回路
(a) skeletal motor circuit, oculomotor nerve circuit, associative circuit, limbic circuit.

(b) 运动区、联想区和边缘区结构组织图
(b) the structural organization of the motor, associative and limbic circuits.
图5 BG分离并行组织回路
Fig.5 BG Separated Parallel Organizational Loop
迄今为止,在皮质刺激和运动任务执行过程中观察到的GPe和GPi的神经元活动非常相
Nambu等人对运动皮层进行电刺激,从而导致皮质刺激在GPe和SNr中诱发了三个阶段的反应,即早期、短潜伏的兴奋,随后是抑制,接下来是晚期的兴
另一方面,BG核的化学阻断以及在STN和GPe中的并行记录表明,快速激发是由超直接通路、直接通路的短抑制和长间接通路的迟激发引起的,而且超直接通路的异常快速反应与STN神经元的独特特性有关.而且在STN永久性损伤或阻断来自前额皮质的皮质-STN神经传递后,早期的兴奋消失.由此他们提出超直接通路最快,直接通路较慢,通过间接通路传递的信息最
在BG通路建模计算方面,BG纤维束被细分为直接通路、间接通路和超直接通路,而且BG被提议由一个选择路径以及一个控制路径组成.其中选择路径包含本综述中所称的直接和超直接通路;控制路径包含了本文所称的间接通
已建立的模型中的大多数假设了不同路径之间的清晰解剖分离.虽然这可能是一个简单的解
一直以来,BG的研究者们都认为BG是大脑处理行为决策问题的主要核团,那我们不禁要问,BG的行为决策的选择机制又是什么呢?第1.3节中,我们已经介绍了BG通路的相关概念,从通路的角度考虑,间接通路对GPe形成抑制性投射,从而解除GPe对STN的抑制,进而增加GPi细胞的活跃度;直接通路与之相反,是对输出核增加抑制.在此基础之上多数研究者建立了间接通路抑制运动,直接通路促进运动,这种行为决策的选择机制进一步发展为直接通路用于选择,而间接通路用于控制(具体模型见第2.2.2节,Gurney等人的模型).这种行为决策的选择机制也类似于中心-周围假设模型,即中心-促进;周围-抑制,该假设模型可参考1.3.2节或文献[
从另外一个角度,即根据选择机制是核内选择还是核间选择,模型也分为两大类.核内选择是通过核内神经元之间的横向(或反复)抑制来实现的;而核间选择则是通过不同通路之间的前馈竞争来实现.无论是那种选择机制,它都是以递归神经网络(Recurrent Neural Networks,RNN)为基础的.一些模型集成了两种选择机制,以实现增强的选择过程.为此我们就不得不提到自组织竞争神经网络,下面主要介绍两种竞争学习规则.
核内行为选择模型主要是利用STR中MSNs之间的GABA连接的原理.在这些模型中的行为选择方法的构成基础主要是采用Winner-takes-all(WTA),它使用神经网络收敛到一个单一的Winner.WTA学习规则是一种竞争关系的学习规则,用于无监督学习,一般会在网络结构中确定一个竞争层.该竞争学习规则主要分为三个步骤:
①向量归一化.首先将自组织网络中的当前输入模式向量X和竞争层中各神经元对应的权重向量Wj全部进行归一化处理,处理后分别记为和j.
②寻找Winner神经元.得到归一化的输入模式向量后,竞争层的所有n个神经元对应的权重向量j均与进行相似性比较,将与最相似的权重向量判为Winner神经元,其权重向量记为,而且满足
(1) |
③网络输出与权值调整.WTA学习规则规定,获胜神经元输出为1,其余输出为0.只有获胜神经元才有权调整其权重向量.这三个步骤是循环往复的,直至达到目标.
假设MSNs之间的抑制连接的密集网络构成一个自组织网络,Winner神经元抑制相邻神经元,从而维持单个神经元的活动.这种核内选择过程发生在STR内,且选择的作用通过不同的通路传递到BG的输出层.核内选择模型也被用作Actor-Critic模
在Winner-loses-all(WLA)模型中,间接通路增强了GPi的背景活动,抑制了所有的行为,而使用直接通路抑制单个程序则导致对信号的抑制(因此称为WLA),利用不同通路之间的时间差异来阻止竞争行为,该模型假设存在与神经元池相对应的单元,这些单位是从STR经GP到丘脑的分离信息流的一部
在对人类的心理和认知活动的研究过程中,Carpenter等
在加和的STM方程中添加了一些项,可能是非线性的,这些项决定了神经元活动或电位的变化率xi,满足下式:
(2) |
方程(2)右端从左至右依次为被动衰减项、正反馈项、负反馈项和输入项.和表示与活动相关的非线性信号,Bji和Cji表示连接强度,zji表示自适应权重.
分流的STM方程更接近于模拟单个神经元的分流动力学:
(3) |
方程(3)中B和D为常数,其他参数类似于方程(2).
广义STM方程:
(4) |
方程(2)和(3)为方程(4)的特殊情况.方程(4)中参数C和F均不为0对应分流的STM方程,当存在微弱的分流抑制时参数E=0,而E≠0时描述了超极化分流抑制的情况.当参数C和F均为0时对应加和的模型,兴奋性相互作用项描述了总兴奋性反馈信号加上外部输入,为抑制性相互作用项.
MTM有多种作用.其中一个作用是进行细胞内适应,将对当前输入的响应划分为最近输入强度的时间平均值.另一个相关的作用是通过减少对这个神经元的净输入,防止重复激活持续地选择同一个神经元.MTM作用强度yi通常遵循以下等式模型方程:
(5) |
方程(5)描述变量yi通过H(K-yi)以固定速率H累积到其最大值K,并且通过反馈信号fi(xi)与门控密度yi之间的相互作用来控制失活、习惯化或抑制.

(a) 用于空间模式学习的Outstar网络(左)和用于自下而上的自适应滤波器学习的Instar网络(右)
(a) Outstar network for spatial pattern learning and Instar network for learning of bottom-up adaptive filters

(b) Instar-Outstar联合网络
(b) An Instar-Outstarassociative network
图6 LTM存在的两种变体形式以及它们的联合网络
Fig.6 Two variants of LTM and their associated networks
LTM存在两种变体形式,一种变体称为Instar学习(网络连接方式见
Outstar学习方程:
(6) |
Instar学习方程:
(7) |
当把Outstars和Instars结合起来后,会形成一个三层Instar-Outstar网络,用于学习从任何多维输入空间到任何多维输出空间的多维映射(
以上述理论为基础,Carpenter和Grossberg随后提出ART网络.ART网络构成模式架构的一部分,反过来,模式架构体现了大脑计算的新范式,称为互补计算(Complementary Computing)和层流计算(Laminar Computing).互补计算描述了大脑全局如何被组织成互补的并行处理流,这些流的相互作用产生生物智能行为.层流计算描述了大脑皮层如何被组织成分层的回路,这些回路的特殊功能可以支持所有形式的高阶生物智能.经过不断的研究和改进,ART网络存在以下三种:ART-Ⅰ:处理二进制离散输入信

(a) ART-Ⅰ神经网络的拓扑结构
(a) Topological structure of ART-Ⅰ neural network

(b) Comparison layer of ART-Ⅰ neural network
ART-Ⅰ神经网络的比较层

(c) ART-Ⅰ神经网络的识别层
(c) Recognition layer of ART-Ⅰ neural network
图7 ART-Ⅰ神经网络的拓扑结构
Fig.7 Topological structure of ART-I neural network
ART-Ⅰ神经网络的拓扑结构如

图8 ART-Ⅱ网络结构
Fig.8 Structure of ART-ⅡNeural Network
ART-Ⅱ神经网络的功能结构与ART-Ⅰ的类似,仍分为两层:F1和F2,分别可以对应ART-Ⅰ的比较层和识别层,该网络的F1和F2层的闭合的单神经元正反馈处理模块拓扑结构见

图9 ART-II神经网络
Fig.9 ART-II neural network
(a)Topological structure of single neuron positive feedback processing module of art-ii neural network (b)ART-II网络结构
Carpenter与Grossberg于1990年提出了ART-Ⅲ神经网络,该网络是一种在神经网络层次结构中实现压缩或分布式模式识别码并行搜索的模型.该搜索过程能很好地适应快速学习和慢速学习,并能很好地实时处理异步输入模式序列.在这个网络中整合了化学突触的计算特性,如递质积累、释放、失活和调制.离子的形式类似物,如钠和钙控制的非线性反馈相互作用,使突触前递质动力学能够模拟模式识别码的突触后短期记忆表征.强化反馈可以通过改变ART-Ⅲ警戒参数或直接使用搜索机制来调节搜索过程.搜索过程是一种假设检验形式,能够发现非平稳输入环境的适当表示.ART-Ⅲ系统中的搜索动态如

图10 ART-Ⅲ系统中的搜索动态
Fig.10 Search dynamics in ART-III system

(a)ART-II神经网络的单神经元正反馈处理模块拓扑结构
BG研究人员在过去几十年的工作中,对BG中各组织结构,神经元相互连接的解剖学以及神经递质产生了丰富的新知识.许多假设的理论都是在BG解剖组织的启发下提出来的.解剖成分及其化学相互作用构成了BG的Albin-DeLong模型的基础.在很长一段时间里,研究人员都是在这种Albin-DeLong模型的基础上展开研究和探索的,这也导致了大多数研究者对皮质-BG-皮质环路的研究集中于具有两个竞争要素的反馈回路:一个由直接通路介导的正反馈机制,另一个由间接通路介导的负反馈机制.现在主流的研究认为,直接通路中的活跃度降低和间接通路中的活跃度增强(由于多巴胺耗尽)导致BG输出结构中的活跃度升高,从而导致通过丘脑中继传递来抑制皮质,产生运动机能减退(如PD).另一方面,直接通路中的活跃度增强和间接通路中的活跃度降低会导致输出结构的抑制,进而抑制(即激活)皮层,从而导致超运动力障碍(如HD和偏瘫).Wickens等

图11 通过BG和CB的分布式处理模块
Fig.11 Distributed processing module through BG and CB
虽然盒箭模型是理解BG相关的低运动力和高运动力病理学的一个有价值的工具,但它对健康BG的计算提供了很少的参考,而且该模型也忽视了后面提出来的超直接通路的存在,即在结构上还不够完整.在这种情况下,如若通过在该模型的基础上进行完整核的放电速率仿真,进而分析皮质-BG-皮质环路,势必会忽略复杂的放电模式、每个核内的计算以及不同核连接神经元之间的相互作用.盒箭模型的缺点,以及解剖学、生物化学、生理学、药理学和行为学信息的快速积累暴露了定性模型在解释当前数据和预测实验结果方面的不足,这就促使对BG的研究方向从系统级模型转向更详细的网络级模型,即要从定性分析模型转向对BG生物学各个方面的定量模型.从而进一步了解BG内信息处理的功能动力学、BG核内的相互作用以及它与大脑其他部分的相互作用,以此更加全面地了解BG的正常功能和病理状态.同时,随着计算机的发展,在这些领域工作的实验科学家越来越认识到计算机模拟是处理如此复杂交互作用的一种有用工具.在过去的几十年中,大量的BG定量模型被开发出来,其中很大一部分是通过计算机模拟来演示和探索的.但是当下鲜有人尝试建立一个模型来完整且准确地反映目前已知的BG的解剖结构.本综述的目的是在已知的BG生物结构及功能的背景知识的基础上,概述BG的行为决策模型.每种模型都可以或多或少地与BG的某些功能建立一定的联系,从而从不同的角度探索BG功能障碍.而且这些模型之间具有一个共同的主题,即BG检测皮质活动的背景事件并对这些背景事件做出反应,更简要地说,BG如何选择一组皮质活动.大多数模型将皮质环境的检测与皮质活动的选择或增强结合在一起,这可能是对运动或认知活动的选择或模拟序列生成中活动的调节.
Gurney与其合作
Gurney等
在GPR1中,模型的架构主要是将行为选择放在直接通路上,而将解除选择留在间接通路上,具体的模型结构见

图12 GPR1中显示了选择与控制通路组合的完整模型的模型架构
Fig.12 The model architecture of the complete model for selecting and controlling path combinations in GPR1
该模型编码方式是通过对给定行为动作在标量值中的选择倾向(显著性)进行编码,故而将行为选择转换为信号选择.对于信号选择,他们是通过选择两个分类阈值θ1和θ2(0≤θ1<θ2≤1)将输入信号转换为三个集合:选定集、不确定集和为选定集.而模型的选择机被定义为如下映射:
(8) |
其中,是一组输入信号集,是对应的输出信号集,每个yi地输出满足于以下分段线性压缩映射y(a):
(9) |
其中,ε为一个任意小的正常数.
在GPR2中,基于GPR1的模型架构和信号选择机制进一步构建了一个含有N个STR网络,每个网络中含有n个输入节点,具体的网络连接模式见
(10) |
其中,u为传入输入所产生的总突触后电位,k为取决于细胞膜电容和电阻的速率常数,是平衡活化.在他们的模型中,每个BG结构节点(STR,STN,GP,SN)均应用了上述的神经元模型,并在STR位置还考虑了多巴胺地调制.该模型的详细模拟结果见文献GPR2的第四节.

图13 GPR2中模型参数注释的单个通道结构
Fig.13 Single channel structure of model parameter annotations in GPR2
在Gurney等
①选择在两个空间尺度上;
②选择取决于细胞群之间的相互作用强度;
③选择取决于细胞间连接的加权;
④选择是在低中间神经元密度的情况下实现的.
Gurney及其合作
(11) |

图14 STR中微电路的连接
Fig.14 Connection of microcircuits in STR
v为膜电位,u为恢复变量,C为电容,vr和vt为静息电位和阈值电位,I为电流源,c为复位电位,a、k和b是参数.以此为基础,进一步描述了模型的MSNs、FSIs和固有离子通道的多巴胺能调制.并给出了突出模型(具体模型描述见文献[
在他们的工作中,一方面,他们识别了由STR微电路产生的一种鲁棒瞬态现象,它暂时增强了两个相互竞争的皮质输入之间的差异.并且证明这一瞬态足以调节BG-丘脑-皮质回路的决策.另一方面,他们还发现,瞬态选择是由单个STR-MSNs的一种新的适应效应引起的,这种适应效应可以通过实验验证.最后,将瞬态选择与经典稳态选择模型进行了比较,并解释了关于HD症状,在所有模拟HD条件下,稳态选择均受到损害,但当NMDA受体敏感性有足够的类似HD症状的增加时,瞬态选择得到增强.因此,他们的模型为HD的认知改善机制提供了一个假设.
Gurney等
Gurney等人在BG回路背景下提出的中心选择模型,即STR的皮质输入是用通道来描述的,其中每个通道指的是竞争的资源或行为,并来源于负责处理它的(皮质)神经底物.模型分为选择和控制机制,即只有具有最高显著性的通道仍然保持足够的抑制,以解除对目标的抑制,从而进行选择.在这样一个BG处理的中心环绕模型为BG在动作或运动程序选择中的作用提供了动力.另一方面DA的作用包括在模型中,不同水平的DA影响了控制机制和选择机制.通过模拟,DA在选择和控制通路中表现出的协同效应与Murer等
在Gurney等人的工作中,一方面,结构上大多只包括直接和间接通路之间的交互(例如GPR1和GPR2),没有将超直接通路完全整合到模型中.另一方面,他们的模型多采用漏积分型神经元,虽然这个神经元模型是最简单的,且融合了动态膜电位的概念,同时避免了建立大量离子通道模型的需要且方便了计算,但这也恰恰丢失了一些真实神经元的某方面信息,而且该模型也无法容纳某些功能数据(例如,GPe在PD中的作用).
Humphries等人基于BG的行为决策的相关建模工作是在Gurney等人的理论基础上开发和拓展的.Humphries等人基于90年代以来Gurney等人开发的BG行为选择理论,开发了一个详细的BG系统的Spiking神经元模型,包括所有的主要核的主要特征和许多生理上合理的细
(12) |
其中,R是神经元输入电阻,I(t)是各种电流源(包括突触源)的总和,是膜时间常数.为了模拟单个突触事件对膜电位
(13) |
其中H(x)是单位阶跃函数(Heaviside step function)[即当x<0时,H(x)=0;否则H(x)=1],并且是突触时间常数.

图15 Humphries等
Fig.15 Functional Connection of BG Model in Humphries et al (2006)
为了证明他们的基础模型的一般有效性,他们拟合了三个数据集(强直放电率、低频振荡(Low-frequency oscillator,LFO)和γ-波段振荡).虽然他们的模型中依然是使用相对简单的模型神经元,但该模型能够可靠地拟合BG核的平均强直放电率,为所有其他工作提供一致的基础.他们同样演示了信号之间的选择和切换,这些信号表示动作的显著性,模型显示了行为选择的作用方式.该模型的另一个显著特征是STN-GPe系统的同步振荡,该系统可以通过DA进行调制:在正常或高DA条件下,STN和GPe被解耦,并呈现出非同步振荡;在降低DA条件下,两个核是动态耦合的,显示出与PD条件下病理同步振荡.根据模型计算与分析的结果,在模型的预测方面,他们证明了:①该模型可以在Magill等人(2001)报告的四种实验条件下再现STN和GP的LFO发生率和平均放电率的变化;②模拟的STN神经元在与健康自由运动大鼠相对应的模型条件下具有γ-波段的活动,并且在模拟的D2激动剂注射后,这种活动增强,再现了Brown等人的结果(参见文献[
Humphries等

图16 Humphries等
Fig.16 Functional architecture of BG computing model in Humphries et al (2010)
Frank等人在有关行为选择的研究工作中主要是从认知的综合作用角度来切入,提供了一个神经计算模型,说明了BG、丘脑和皮层与DA和其他神经递质如何基于奖励机制、运动和认知学习任务来相互作用.Frank的框架表明,BG调制整合运动和认知行为,这些行为是在运动和前额皮质编码,在运动域中,这些模型假设到运动前皮层的BG输出负责行为选择.而且Frank等人的研究主要关注两类模型:那些包含更现实生物方面且受功能原理约束的模型,以及更抽象的数学模型,这些模型关注更高层次的BG计算目标.前者可以说更现实,后者在描述系统如何在相对简单的方程组中工作的功能原理方面具有互补优势,但不太适合对特定核和神经生理学作出具体假设.
Frank等

图17 Frank等
Fig.17 Functional architecture of BG computing model in Frank et al. (2001)
对于特性①,即点神经元激活功能,Leabra使用一个点神经元激活功能来模拟真实神经元的电生理特性,同时将其几何结构简化为一个点.如下所述
(14) |
其中,Vm(t):膜电位;g:离子电导;E:反向(驱动)电位;c:四类通道;e:兴奋性输入;l:泄漏电流;i:抑制性输入;h:反映可切换持续兴奋性输入作用的滞后通道);是一常数,用于控制不同电导的相对影响.
对于特性②,即k-WTA抑制功能,Leabra使用k-WTA函数来实现稀疏的分布式表示,该机制计算出同一层中所有单元的抑制电流水平,如下:
(15) |
其中0<q<1,是设置上限和下限之间抑制的参数.这些边界抑制值是将一个单元保持在阈值位置所必需的抑制水平的函数,满足如下关系:
(16) |
其中是没有偏倚权重贡献的兴奋性净输入;这允许偏倚权重覆盖k-WTA约束.
此外,还描述了调节PFC中细胞内维持离子电流的门控方程.如果PFC门控层中的任何单元有超过维持阈值的激活,则PFC维护层中的相应单元将其胞内兴奋电流(gh)设置为传输单元的激活值,从感觉输入层接收兴奋输入量的次数满足如下关系:
(17) |
其中,xi是传输激活,是来自感觉输入的净输入,而是维持阈值.
在上述模型中模拟了兴奋性突触输入通道,抑制性输入通过简单的近似于抑制性中间神经元的作用来计算,还有一个恒定的泄露电流,它代表了
而后,
(18) |
上式表达了传递给其他细胞的激活(yj)是膜电位的阈值(Θ)增益参数(γ)的Sigmoid函数,其中[x]+是阈值函数,如果x<0,返回0;如果x>0,返回x.

图18 BG直接和间接通路的神经网络结构
Fig.18 The neural networkstructure of direct and indirect pathways of BG in Frank et al (2005)

(a) 皮层-BG神经回路
(a) Cortex-BG neural circuit

(b) 皮层-BG计算框架
(b) Cortex-BG computing architecture
图19 Frank等
Fig.19 Functional architecture of BG computing model in Frank et al. (2006)
在
在Frank的模型中,STN在超直接通路中接受来自前/运动皮层的兴奋性投射,同时刺激GPi和GPe;GPe对STN活性具有抑制反馈作用,从而进一步研究考察了STN在BG回路中的作用.该模型还是在前面的模型基础之上进行的拓展,通过x/(x+1)Sigmoid函数对Leabra框架中的集成的膜电位进行阈值化和转换,生成一个速率编码输出,并将其传递给其他单元.每一层都使用一个k-WTA函数,该函数计算一个抑制电导,使大约k个最活跃的单元保持在触发阈值以上,其余的保持在阈值以下.并通过将兴奋性驱动电位(Ee)设为1,泄漏和抑制性驱动电位(El和Ei)设为0,则将平衡电位简化为如下形式:
(19) |
这表明神经元正在计算兴奋与泄漏和抑制的反作用力之间的平衡.方程的平衡形式可以用贝叶斯决策框架来理
(20) |
在本模型中,泄漏电流设置为常数,对于抑制电导分为层间和层内,在层间是通过简单的单元抑制来实现抑制,其中单元的抑制电流gi由传输单元的净输入确定.Leabra使用k-WTA功能来实现各层(区域)内单位之间的抑制竞争,采取的具体计算方式与
(21) |
误差-驱动学习使用对比Hebb学习(Contrastive Hebbian learning,CHL)
(22) |
它服从于一个软权重限制,以保持在0~1范围内:
(23) |
然后将这两项与归一化混合常数khebb相加
(24) |
仿真结果表明,STN在执行响应时进行调制,该模型在响应选择过程中准确地捕捉了不同BG区域的活动动态,STN减少了过早响应,因此对最终选择响应有重大影响,尤其是在存在多个竞争响应时.皮质反应冲突的增加导致通过皮质-STN-GP途径动态地调整反应阈值.此外,在完整和模拟PD状态下,对反应选择过程中不同BG区域的活动动力学进行分析,模拟DA消耗导致BG结构突然出现振荡活动,认为这与PD震颤有关,发现它们与生理上观察到的相同模式有着惊人的关系,这为模型的生物学合理性提供了支持,并进一步深入了解反应选择背后的神经过程.最后,该模型解释了STN损伤对这些振荡的有益影响,但表明这种益处可能以决策受损为代价.文中结合试验研究结果认为直接和短间接通路会影响相对集中的GP表现,而超直接通路和长间接通路可能会产生相对全局的影响.该模型也与大鼠的行为研究结果一致,显示STN损伤恶化,而STN刺激改善,在高冲突选择范式中出现过早反
根据韦伯-费希纳定理,生理上同一刺激差别是必须达到一定阈限,生理才会产生差异感,这个差异关系表述为ΔI/I=k(其中,I为原刺激量,ΔI为此时的差别阈限,k为常数,又称为韦伯率),这表明了心理量和物理量之间的关系.基于韦伯-费希纳准则,Wang提出一个简单的神经决策模型,该模型的决策准则中包含向左和向右的两个选择,选择受到皮层的影响,选择方法由模型的奖励率刻画.显然,Wang模型给出了一个基于韦伯-费希纳准则的选择模型,也可以将模型推广到一般的几个决策模型当中.
在Chung-Chuan

(a) 皮质、上丘和BG相互连接的网络
(a) Interconnected networks of cortex, superior colliculus and BG

(b) 细化的BG内部通
(b) Refined internal pathways of BG
图20 皮质-基底神经节环路决策计算模型
Fig.20 Computational model of cortico–BG circuit decision making
在Wei,Rubin和 Wan
(25) |
研究发现通过皮质-STR连接的可塑性来调节决策阈值的机制是有效的,前提是间接通路在它们对输出核的投射中平衡了直接通路.此外,在他们的模型中,BG连接的变化与PD中出现的变化类似,会引起强烈的β振荡.在以明显的β振荡为特征的PD状态下,与正常状态相比,平均反应时间和阈值变化范围(一种行为灵活性的度量)显著降低.因此,他们的工作揭示了与PD相关的知觉决策障碍的特定回路机制.
捕食-被捕食模型描述生物或生态系统中生物种群数量的相互作用,高维Lotka-Volterra模型是最经典的情形,其相空间动力系统的可能状态有平衡点和轨线等,对应结点、鞍结点、周期轨道、同宿-异宿轨道及其相互转化的情况.而具体到智能体决策问题,一般的,有关环境的信息通常由动物感觉神经系统中的神经元编码成尖峰序列,再由皮下结构组织进一步处理.而且每个感觉刺激都有一个特定的、可重复的跨特定神经元放电序列的特征.对控制神经决策的神经回路,有描述该神经回路的Lotka-Volterra模型,Rabinovich等提出用该神经回路模型相空间的状态变化刻画该神经回路控制神经决策的选择过程.
以上述理论为基础,为建立一个依赖神经回路动力学理论的决策模型,Rabinovich等人基于抑制神经回路的模型,构造了一类无赢竞争(Winnerless competition,WLC)网络的动力学决策模型.该模型与上述模型不同,它是由FitzHugh-Nagumo(FHN)神经元模型组成的WLC系统级网
(26) |
其中,xi(t)表示第i个神经元的膜电位;yi(t)表示第i个神经元的恢复变量;zi(t)为一阶动力学模型下的突触电流,表示神经元突触之间的抑制关系;G(x)为单位阶跃函数(G(x)=0,x≤0;G(x)=1,x>0);Si表示第i个神经元的外界刺激;gji表示突触抑制连接强度(如果第j个神经元对第i个神经元存在抑制,则gji=2,否则为0);其他参数为a=0.7,b=0.8,τ1=0.08,τ2=3.1和v=-1.5.Rabinovich等人以WLC为基础的决策思路可以概括为

图21 Rabinovich的动力学决策框架
Fig.21 Rabinovich's dynamic decision-making framework
在文献[
神经科学家和认知科学家普遍认为BG负责行为决策.即BG基于某种背景事件给予的相关信号,对于每个可能的行为动作给出一个效用值,然后选择当前效用值最高的动作.然而,从生物学的角度,我们可以提出以下问题:①进行行为决策的神经底物是什么?②这种神经底物功能性操作是如何进行的?
除了以上介绍的主要以皮质-BG环路作为行为决策的神经底物来展开建模的计算研究外,Houk等

图22 PFC、CB和BG相互连接的网络
Fig.22 The interconnected network of PFC,CB and BG

图23 BG、PFC和CB的分布式模块结构
Fig.23 Distributed module architecture of BG,PFC and CB
有关行为选择的皮层下基质的探索,



图24 包含mRF的集成行为选择机制的备选方案
Fig.24 Options for an integrated behavior selection mechanism with mRF
除了上述提到的大脑结构外,在文献[
PD是一种进行性神经系统退行性疾病,主要的临床特征包括震颤、僵直、运动失调等.关于发病原因,实验数据表明,多巴胺能系统的损伤导致如下情况:①STR神经元中Dl和D2多巴胺受体mRNA的差异表达;②神经调节因子(如P物质、脑啡肽)在STR中表达的产生差异;③通过增强间接通路的响应和降低直接通路的活性而使GPi活性饱和;④由于直接通路中神经元活性低于正常水平,导致GPi活性动态范围丢失,致使调节性输入不足,进而引起GPi缺乏调节正常运动输出的调节输入;⑤GPi细胞过度抑制丘脑靶神经元产生低动力障碍.
从分子细胞水平分析,PD主要是SNc的多巴胺能神经元退行性变导致的神经元死亡而引起的.而触发SNc的多巴胺能神经元的退行性过程可能是线粒体缺陷、氧化应激和细胞蛋白聚集等相互作用导致了谷氨酸能的异常(PD发病机制的相关因素见

图25 PD发病机制
Fig.25 Parkinson's pathogenesis

(a) 正常BG的神经通路
(a) Neural pathways in normal BG

(b) PD患者的BG的功能连接
(b) Functional connections of BG in Parkinson patients
图26 正常和帕金森病患者BG功能连接图
Fig.26 Functional connectivity of BG in normal and PD's disease patients
总而言之,PD是由于多巴胺能系统中SNc损伤,导致DA耗竭,引起BG内的直接通路和间接通路之间的平衡发生紊乱.更具体地讲,DA分别作用于STR中的MSNs,在正常的情况下,D1细胞参与的直接通路和D2细胞参与的间接通路的活性是彼此平衡的.而在PD的状态下,由于SN细胞释放的DA减少,使D1、D2介导的两条通路受到不同程度的影响,二者之间的活性平衡遭到严重破坏,引发由D1神经元介导的直接通路兴奋性减少,而由D2神经元受体介导间接通路兴奋性增加,致使无法正常地对高级运动中枢的指令做出响应.从而产生PD的一系列临床症状.
从早期对BG模型的研究开始,研究者们不仅仅停留在结构和功能上,而且还关注了BG在神经和精神方面的作用,例如PD和HD.在第2.2.2节中介绍的模型都不同程度地探讨了PD和HD的发病原因和具体病灶的位置,他们模型的行为与观察到的人类DA消耗与PD几种症状之间的关系一致,其中包括运动迟缓和运动机能减退,这两种症状通常被归入运动缺乏症的范畴,可以被视为运动决策和执行能力的缺陷.
在Gurney的模型实验中,分为三种情况讨论DA在PD中的作用:在DA水平较低的情况下,PD患者无法在选定的运动通道上适当释放GPi-SNr的强直抑制输出而导致的运动机能减退.与Gurney的选择-控制模型中选择通道的选择失败相一致.类似地,在DA水平中等的情况下,Gurney的模型中的选择限制可以迫使两个高度突出的通道相互对抗,从而导致两个通道的选择都比只有一个具有相同突出性的通道更弱,这表明PD患者(相对于对照组)在双运动任务上的表现比他们在单独任务上的表现更差.随着DA水平超过正常水平,他们的模型预测同时释放抑制(从而选择通道)的机会也会增加.他们预计两个相关行为之间会有快速的转换,而不是真正地进行行为选择.这可能会导致其他病症,例如HD.
在Humphries的模型模拟中,改变模拟强直性DA的水平会导致选择和转换特性的恶化.DA耗竭后,模拟的SNr输出没有充分减少到信号选择状态,这意味着很难启动运动.增加模拟DA会导致SNr输出仍然受到抑制,即使引入了一个相互竞争的显著动作,这意味着无法切换到一个新的动作.这与全身或STR内注射DA兴奋剂或STR内注射非选择性多巴胺激动剂后大鼠表现出的行为定势相一致.因此,模型中DA耗竭和多巴胺过量的影响都与这些操作的已知行为影响一致.
在Frank的认知决策模型中尝试将PD的各种认知缺陷联系在一起.具体地说,他们的模型假定在误差反馈期间DA的阶段性变化对于在BG中调制促进或抑制运动命令执行的Go/NoGo表示是至关重要的.因此,在正反馈和负反馈过程中,DA的爆发和下降会不同程度地驱动对刚刚执行的反应的学习.Frank等人的实验也支持了对模型的核心预测,即停药的PD患者在从正强化到负强化的学习上受损,而没有停药的相同患者则表现出相反的学习偏差模式.在Frank的模型中,模拟的非药物PD状态显示了负性的增强,而不是正性的,强化学习和模拟的DA药物可以逆转这种偏差.而且Frank的模型还表明,通过以不自然的高频率刺激STN,深度脑刺激(Deep brain stimulation,DBS)有效地消除了STN的动态功能(类似于病变),因此消除了全局NoGo信号.在训练过程中,完整的网络学习如何在概率分类任务中做出响应,就像健康的参与者一样.当模型SNc的DA层75%的单元受到损伤,以模拟PD患者的损伤程度时,模型的损伤程度与患者相似.
在Wang的模型中,BG连接的变化与PD中的变化相似,会导致强烈的β振荡.具体来说,β振荡是由间接通路中STN和GPe相互作用的异常增强引起的,其振荡频率取决于对STN的兴奋性皮层输入和STR对GPe的抑制性输入.在以显著β振荡为特征的PD状态下,与正常状态相比,平均反应时间和阈值变化范围(一种行为灵活性的测量)显著减少.以此为背景,在他们的仿真过程中研究了正常状态是如何转变成一个PD状态(增强的β振荡).其实,振荡是在STN-GPe子回路中产生的.为了模拟PD状态,需要将STN-GPe回路中的突触效率更新为另一组值.因此,Wang的研究揭示了PD相关的知觉决策障碍的一种特殊的回路机制.
另外,在文献[
本综述首先从BG的生物背景入手,简要概述BG的功能解剖和当下对BG通路的主流研究结构和思路.其次,介绍了有关BG决策模型的主要竞争机制,即WTA和ART竞争学习机制.在此基础之上根据主流学派的建模思路的侧重点,着重介绍了Gurney的选择-控制模型、Humphries的神经元群模型、Frank的认知决策模型、Wang的决策选择模型和Rabinovich的相空间动力学选择模型.进而对皮质-BG回路的行为决策的神经底物和有关BG的大脑疾病进行了探讨.通过对上述内容的纵向梳理和横向比较,给我们带来了一些思考.
首先,基于BG的决策模型的研究趋势越来越明朗了.通过回顾2.2.2节中的决策模型,多数模型都是采用了更符合生物学实际的神经元模型,同时采用计算密集的神经回路模型或单个神经元的房室模型,例如在文献[
其次,通过对不同研究者的建模结构和建模思路的比较.在基于BG的决策模型结构组织方面,不难发现,大多数理论家认为,BG各结构之间的纤维束连接产生了不同的路径,这些路径履行不同的功能.一方面,他们大多同意BG的直接通路激活特定的皮质表征,但间接和超直接通路的功能仍在激烈争论中.一般来说,行为选择假设是基于输出核的BG直接和间接通路的联合作用,而超直接通路主要作为一个全局停止信号.另一方面,虽然不同模型在以间接通路与超直接通路为基础的周围抑制的机制不同(一些研究者是通过间接通路来实现抑制,另一些研究者是通过超直接通路来实现抑制),但是它们的效果基本相同(激活中央皮质表征,而抑制其周围表征,即竞争对手).在过去几十年开发的BG模型大多不包含所有3种主要通路.而且除了从直接通路、间接通路和超直接通路的角度研究皮质-BG的信息流的处理方式外,还有研究者从并行回路的角度来研究.
所以这就留给了我们以下两个问题:①皮质-BG回路是如何组织的?我们已经清楚,在BG核内,从大脑皮层感觉区域传入到BG的信息流,经过STR和STN传入,再经GPi-SNr传出,通过丘脑回到皮层.但是这种多信息的输入和单信息的输出的并行处理方式,在各通路之间是否有严格的分界,是否有重叠区域,如果有重叠又位于什么结构内,BG对信息流的汇聚输入和输出的收敛处理的功能是如何实现的,都还不得而知.而在BG核外,CB在大脑决策过程中起到什么样的作用呢?虽然来自BG和CB的信息独立地到达运动皮质,在丘脑中没有相互作用.但是不能排除通过丘脑中间神经元和丘脑网状核的两个输入之间的局部相互作用的可能性,BG和CB之间的相互作用也通过CB-丘脑-STR途径被提出.②现有的以直接通路和间接通路为基础的决策模型是否合理呢?首先,最近提出的超直接通路通过STN接收直接的皮层输入,传递强烈的兴奋信号,传导速度快于直接通路和间接通路这已经是个不争的事实.其次,在间接通路中,GPe不仅将GABA投射到GPi-SNr,还通过局部轴突脉络将GABA投射到STR和GPe本身.因此,GPe可以看作是一个中央核投射到BG内的多个位置.这也是本文1.3.1节中把间接通路进一步分为长间接通路和短间接通路的依据.再者,STN和GPe通过STN-GPe兴奋性和GPe-STN抑制性投射有密切的联系,STN和GPe相互耦合,共同对决策过程起作用.
再者,基于BG的行为决策模型的建立和研究,除了对健康者的大脑结构和功能的探索外,对于具有大脑疾病的患者的发病机制的探索也至关重要,例如在第4.2节中提到的PD疾病.虽然PD的患病机制和治疗方法还不太清楚,但在决策模型的研究过程中发现,DBS对PD患者的治疗的性能与电极位置有关,随着电极位置的改变,模型会从基于奖励的学习转向基于惩罚的学习.所以建立计算模型的目的之一就是了解某些大脑疾病的病理机制,帮助其诊断和治疗.
最后,除了本文提到的一些在决策方面研究起步比较早的模型,近几年,
以往的皮层-BG的通路之间相互作用的计算模型主要集中在模拟静态环境中的认知过程、学习或简单行为选择,而不考虑认知因素可能如何影响运动动作.未来的决策模型应该模拟大脑皮层是如何表示多个输入(包括感知和认知),这些输入是反馈给BG的,这对于行为决策很重要.未来的模型也应该更为动态,将多个通路整合到一起,它们相互作用的同时也能各司其职,这样它们就可以不断地从环境中接收和更新感知输入,并产生运动输出,然后将模型转换为更加完整,更加连续,更加真实的系统.例如在文献[
参 考 文 献
Cohen M X,Frank M J. Neurocomputational models of basal ganglia function in learning,memory and choice. Behavioural Brain Research,2009,199(1):141~156 [百度学术]
Sebastien H,Srinivasa C,Moustafa A A. Exploring the cognitive and motor functions of the basal ganglia:an integrative review of computational cognitive neuroscience models. Frontiers in Computational Neuroscience,2013,7:174 [百度学术]
Atsushi N,Hironobu T,Ikuma H,et al. Excitatory cortical inputs to pallidal neurons via the subthalamic nucleus in the monkey. Journal of Neurophysiology,2000,84(1):289~300 [百度学术]
Nambu A,Takada M,Inase M,et al. Dual somatotopical representations in the primate subthalamic nucleus:evidence for ordered but reversed body-map transformations from the primary motor cortex and the supplementary motor area. The Journal of Neuroscience,1996,16(8):2671~2683 [百度学术]
Gerfen C,Engber T,Mahan L,et al. D1 and D2 dopamine receptor-regulated gene expression of striatonigral and striatopallidal neurons.Science,1990,250(4986):1429~1432 [百度学术]
Nambu A,Tokuno H,Takada M. Functional significance of the cortico-subthalamo-pallidal 'hyperdirect' pathway. Neuroscience Research,2002,43(2):111~117 [百度学术]
DeLong M R, Georgopoulos A P. Motor Functions of the Basal Ganglia. New York: John Wiley & Sons, Inc,2011:1017~1061 [百度学术]
Mugnaini E,Oertel W H. Immunocytochemical studies of GABAergic neurons in rat basal ganglia and their relations to other neuronal systems. Neuroscience Letters,1984,47(3):233~238 [百度学术]
Albin R L,Young A B,Penney J B. The functional-anatomy of basal ganglia disorders. Trends in Neurosciences,1989,12(10):366~375 [百度学术]
Delong M R. Primate models of movement disorders of basal ganglia origin. Trends in Neurosciences. 1990:13(7): 281~285 [百度学术]
Alexander G E,DeLong M R,Strick P L. Parallel organiz- ation offunctionally segregated circuits linking basal ganglia and cortex. Annual Reviews in Neuroscience,1986,9:357~381 [百度学术]
Delong M,Wichmann T. Changing views of basal ganglia circuits and circuit disorders. Clinical EEG and Neuroscience,2010,41(2):61~67 [百度学术]
Henning S,Hamker F H. Computational models of basal-ganglia pathway functions:focus on functional neuroanatomy. Frontiers in Systems Neuroscience,2013,7:122 [百度学术]
Contreras-Vidal J L,Stelmach G E . Effects of Parkins- onism on motor control. Life Sciences,1996,58(3):165~176 [百度学术]
Schroll H,Vitay J,Hamker F H. Dysfunctional and compensatory synaptic plasticity in Parkinson's disease. European Journal of Neuroscience,2014,39(4):688~702 [百度学术]
Brown J W,Bullock D,Grossberg S. How laminar frontal cortex and basal ganglia circuits interact to control planned and reactive saccades. Neural Networks,2004,17(4):471~510 [百度学术]
Gillies A J,Willshaw D J. A massively connected subth- alamic nucleus leads to the generation of widespread pulses. Proceedings of the Royal Society B:Biological Sciences,1998,265(1410):2101~2109 [百度学术]
Frank M J. Hold your horses: a dynamic computational role for the subthalamic nucleus in decision making. Neural Networks,2006,19(8):1120~1136 [百度学术]
Baston C,Ursino M. A biologically inspired computa- tional model of basal ganglia in action selection. Computational Intelligence and Neuroscience,2015,2015(4):187417 [百度学术]
Stocco A,Lebiere C,Anderson J R.Conditional routing of information to the cortex: a model of the basal ganglia's role in cognitive coordination. Psychological Review,2010,117(2):541~574 [百度学术]
Frank M J,Samanta J,Moustafa A A,et al. Hold your horses:impulsivity, deep brain stimulation, and medication in parkinsonism. Science,2007, 318(5854):1309~1312 [百度学术]
Aron A R. From reactive to proactive and selective control:developing a richer model for stopping inappropriate responses. Biological Psychiatry,2011,69(12):55~68 [百度学术]
Wiecki T V,Frank M J. A computational model of inhibitory control in frontal cortex and basal ganglia. Psychological Review,2013,120(2):329~355 [百度学术]
Gurney K,Prescott T J,Redgrave P. A computational model of action selection in the basal ganglia. I. A new functional anatomy. Biological Cybernetics,2001,84(6):401~410 [百度学术]
Humphries M D,Stewart R D,Gurney K N. A physiologically plausible model of action selection and oscillatory activity in the basal ganglia. Journal of Neuroscience,2006,26(50):12921~12942 [百度学术]
Alexander G E, Crutcher M D. Functional architecture of basal ganglia circuits:Neural substrates of parallel processing. Trends in Neurosciences,1989,13(7):266~271 [百度学术]
Joel D,Weiner I. The connections of the dopamineergic system with the striatum in rats and primates:an analysis with respect to the functional and compartmental organization of the striatum. Neuroscience,2000,96(3):451~474 [百度学术]
Nambu A. A new dynamic model of the cortico-basal ganglia loop. Progress in Brain Research,2004,143:461~466 [百度学术]
Gurney K,Prescott T J,Redgrave P. A computational model of action selection in the basal ganglia. II. Analysis and simulation of behaviour. Biological Cybernetics,2001,84(6):411~423 [百度学术]
Lévesque M,Parent A. The striatofugal fiber system in primates: a reevaluation of its organization based on single-axon tracing studies. Proceedings of the National Academy of Sciences,2005,102(33):11888~11893 [百度学术]
Kita H,Kita T. Cortical stimulation evokes abnormal responses in the Dopamine-Depleted rat basal ganglia. Journal of Neuroscience,2011,31(28):10311~10322 [百度学术]
Redgrave P. The basal ganglia:a vertebrate solution to the selection problem? Neuroscience,1999,89(4):1009~1023 [百度学术]
Houk J C. A model of how the basal ganglia generate and use neural signals that predict reinforcement. In: Models of Information Processing in the Basal Ganglia, MITP, 1994, 249~270 [百度学术]
Baldassarre G. A modular neural-network model of the basal ganglia's role in learning and selecting motor behaviours. Cognitive Systems Research,2002,3(1):5~13 [百度学术]
Fukai T,Tanaka S. A simple neural network exhibiting selective activation of neuronal ensembles: From Winner-Take-All to Winners-Share-All. Neural Computation,1997,9(1):77~97 [百度学术]
Bernsz S,Sejnowskil T J. How the basal ganglia make decisions. Damasio A R, Damasio H, Christen Y. Neurobiology of decision-making. Berlin: Springer,1996 [百度学术]
Humphries M D,Gurney K N. The role of intra-thala mic and thalamocortical circuits in action selection. Network:Computation in Neural Systems, 2002,13(1):131~156 [百度学术]
Grossberg S. Adaptive pattern classification and univer- sal recoding:I. Parallel development and coding of neural feature detectors. Biological Cybernetics,1976,23(3):121~134 [百度学术]
Grossberg S. Adaptive pattern classification and univer- sal recoding. II:Feedback,expectation,olfaction,illusions. Biological Cybernetics,1976,23(4):187~202 [百度学术]
Carpenter G A,Grossberg S. A massively parallel archit- ecture for a self-organizing neural pattern recognition machine. Computer Vision, Graphics, and Image Processing, 1987,37(1): 54~115 [百度学术]
Carpenter G A,Grossberg S. ART 2:self-organization of stable category recognition codes for analog input patterns. Applied Optics,1987,26(23):4919~4930 [百度学术]
Carpenter G A,Grossberg S. ART 3:Hierarchical search using chemical transmitters in self-organizing pattern recognition architectures. Neural Networks,1990,3(2):129~152 [百度学术]
Wickens J R,Alexander M E,Miller R. Two dynamic modes of striatal function under dopaminergic-cholinergic control:Simulation and analysis of a model. Synapse (New York),1991,8(1):1~12 [百度学术]
Wickens J R,Arbuthnott G W. Chapter 21 The cortico- striatal system on computer simulation: an intermediate mechanism for sequencing of actions. Progress in Brain Research,1993,99:325~339 [百度学术]
Jeff W. Basal ganglia:structure and computations. Network:Computation in Neural Systems,1997,8(4):R77~R109 [百度学术]
Houk J C,Wise S P. Feature article:Distributed modular architectures linking basal ganglia,cerebellum,and cerebral cortex:Their role in planning and controlling action. Cerebral Cortex, 1995,5(2):95~110 [百度学术]
Houk J C. Agents of the mind. Biological Cybernetics,2005,92(6):427~437 [百度学术]
Gurney K N,Prescott T J,Redgrave P. The basal ganglia viewed as an action selection device. In: ICANN 98. London:Springer,1998 [百度学术]
Arbib M A. The handbook of brain theory and neural networks. London: The MIT Press,1995 [百度学术]
Gurney K N,Overton P G. A model of short and long range selective processing in neostriatum. Neurocompu- ting,2004,58-60:555~562 [百度学术]
Adam T,Eleni V,Christian B,et al. Transient and steady-state selection in the striatal microcircuit. Frontiers in Computational Neuroscience,2014,7:192 [百度学术]
Izhikevich E M. Simple model of spiking neurons. IEEE Transactions on Neural Networks,2003,14(6):1569~1572 [百度学术]
Gurney K N,Humphries M D,Redgrave P,et al. A new framework for cortico-striatal plasticity:behavioural theory meets in vitro data at the reinforcement-action interface. PLoS Biology,2015,13(1):e1002034 [百度学术]
Mogenson G,Jones D,Yim C. From motivation to action:Functional interface between the limbic system and the motor system. Progress in Neurobiology,1980,14(2-3):69~97 [百度学术]
Reynolds J N J,Wickens J R. Dopamine-dependent plasticity of corticostriatal synapse. Neural Networks,2002,15(4-6):507~521 [百度学术]
Murer M G,Riquelme L A,Tseng K Y,et al. D1-D2 dopamine receptor interaction:an in vivo single unit electrophysiological study. Neuroreport, 1997,8(3):783 [百度学术]
Brown P,Kupsch A, Magill P J,et al. Oscillatory local field potentials recorded from the subthalamic nucleus of the alert rat. Experimental Neurology,2002,177(2):581~585 [百度学术]
Magill P,Sharott A,Bolam J,et al. Brain state-dependency of coherent oscillatory activity in the cerebral cortex and basal ganglia of the rat. Journal of Neurophysiology,2004,92(4):2122~2136 [百度学术]
Humphries M D,Prescott T J. The ventral basal ganglia,a selection mechanism at the crossroads of space,strategy,and reward. Progress in Neurobiology,2010,90(4):385~417 [百度学术]
Mark H. Dopaminergic control of the exploration exploitation trade-off via the basal ganglia. Frontiers in Neuroscience,2012,6:9 [百度学术]
Frank M J,Loughry B,O'Reilly R C. Interactions between frontal cortex and basal ganglia in working memory: a computational model. Cognitive Affective & Behavioral Neuroscience,2001,1(2):137~160 [百度学术]
O'Reilly R C,Munakata Y. Computational explorations in cognitive neuroscience:understanding the mind by simulating the Brain. London: The MIT Press, 2000 [百度学术]
Frank M J. Dynamic dopamine modulation in the basal ganglia: a neurocomputational account of cognitive deficits in medicated and non-medicated parkinsonism. London: MIT Press,2005 [百度学术]
Stewart T C,Trevor B,Chris E. Learning to select actions with spiking neurons in the basal ganglia. Frontiers in Neuroscience,2012,6:2 [百度学术]
Lo C C,Wang X J. Cortico-basal ganglia circuit mechanism for a decision threshold in reaction time tasks. Nature Neuroscience,2006,9(7):956~963 [百度学术]
Gold J I,Shadlen M N. Banburismus and the brain:Decoding the relationship between sensory stimuli,decisions,and reward.Neuron,2002,36(2):299~308 [百度学术]
Brown E,Gao J,Holmes P,et al. Simple neural networks that optimize decision. International Journal of Bifurcation and Chaos,2005,15(3):803~826 [百度学术]
John P,Huk A C,Shadlen M N. The effect of stimulus strength on the speed and accuracy of a perceptual decision. Journal of Vision,2005,5(5):376~404 [百度学术]
Wei W,Rubin J E,Wang X J. Role of the indirect pathway of the basal ganglia in perceptual decision making. Journal of Neuroscience,2015,35(9):4052~4064 [百度学术]
Smith G D,Cox C L,Murray S S,et al. Fourier analysis of sinusoidally driven thalamocortical relay neurons and a minimal integrate-and-fire-or-burst model. Journal of Neurophysiology,2000,83(1):588~610 [百度学术]
Rabinovich M I,Volkovskii A,Lecanda P,et al. Dynamical encoding by networks of competing neuron groups:winnerless competition. Physical Review Letters,2001,87(6):068102 [百度学术]
Varona P,Rabinovich M I,Selverston A I,et al. Winnerless competition between sensory neurons generates chaos: a possible mechanism for molluscan hunting behavior. Chaos,2002,12(3):672~677 [百度学术]
Levi R,Varona P,Arshavsky Y I,et al. Dual sensory-motor function for a molluskan statocyst network. Journal of Neurophysiology,2004,91(1):336~345 [百度学术]
Rabinovich M I,Huert,Ramón,et al. Dynamics of sequential decision making. Physical Review Letters,2006,97(18):188103 [百度学术]
Houk J C. Neurophysiology of frontal-subcortical loops. Lichter D G, Cummings J L. Frontal-subcortical circuits in psychiatry and neurology, New York: Guilford Publications, 2001 [百度学术]
Houk J C,Bastianen C,Fansler D,et al. Action selection and refinement in subcortical loops through basal ganglia and cerebellum. Philosophical Transactions of the Royal Society B:Biological Sciences,2007,362(1485):1573~1583 [百度学术]
Humphries M D,Gurney K,Prescott T J. Is there a brainstem substrate for action selection? Philosophical Transactions of the Royal Society B: Biological Science,2007,362(1485):1627~1639 [百度学术]
汪雷,刘深泉.大脑中神经回路的电位发放比较.动力学与控制学报,2010, 8(3):277~283 [百度学术]
Wang L,Liu S Q. Comparison of potential firing in brain neural circuit. Journal of Dynamics and Control,2010, 8 (3): 277~283 (in Chinese) [百度学术]
Blandini F. An update on the potential role of excitotox- icity in the pathogenesis of Parkinson disease. Functional Neurology,2010,25(2):65~71 [百度学术]
贾洪军,王江,于海涛.丘脑底核-苍白球神经元群网络模型的动力学分析.动力学与控制学报,2011, 9(4):374~377 [百度学术]
Jia H J,Wang J,Yu H T. Dynamic behaviors of a neuron population model for subthalamic nucleus globuspallidum. Journal of Dynamics and Control,2011, 9 (4):374~377(in Chinese) [百度学术]
孟盼,陆启韶,赵勇,等.两房室神经元模型的同步簇放电的动力学分析.动力学与控制学报,2016,14(6):566~570 [百度学术]
Meng P,Lu Q S,Zhao Y,et al. Dynamic analysis of synchronous bursting in two compartment neuron model. Journal of Dynamics and Control,2016,14 (6):566~570 (in Chinese) [百度学术]
Magdoom K N,Subramanian D,Chakravarthy V S,et al. Modeling basal ganglia for understanding parkinsonian reaching movements. Neural Computation,2011,23(2):477~516 [百度学术]
Guthrie M,Leblois A,Garenne A,et al. Interaction between cognitive and motor cortico-basal ganglia loops during decision making: a computational study. Journal of Neurophysiology, 2013,109(12):3025~3040 [百度学术]
Leblois A. Competition between feedback loops underlies normal and pathological dynamics in the basal ganglia. Journal of Neuroscience,2006,26(13):3567~3583 [百度学术]