‘壹’ 脑网络分析的指标
1. 边( link,edge) ,脑区间的功能连接
2. 节点(vertex 或 node) ,脑区
3. 节点度(degree) ,度ki,直接连接在一个节点的边的个数, 节点的度越大则该节点的连接就越多, 节点在网络中的地位也就越重要.
4. 度分布(degree distribution) , 度分布P(k) 是网络最基本的一个拓扑性质, 它表示在网络中等概率随机选取的节点度值正好为k 的概率, 实际分析中一般用 网络中度值为k 的节点占总节点数的比例近似表示 . 拥有不同度分布形式的网络在面对网络攻击时会表现出截然不同的网络行为。
5. 区域核心节点(provincial hub)
6. 连接中枢点( connector hub)
7. 中心度(centrality) 中间中心度bi(centrality). 一个节点对网络中其他节点的信息流的影响。中心度是一个用来 刻画网络中节点作用和地位的统计指标 , 中心度最大的节点被认为是网络中的 核心节点(hub) .
8. 度中心度(degree centrality) ,最常用的 度中心度以节点度刻画其在网络中的中心程度
9. 介数中心度( betweenness centrality) ,介数中心度(betweenness centrality)则从信息流的角度出发定义节点的中心程度. 介数中心性用来确定网络中最中心的节点,即网络中起桥梁作用的节点。hub脑区大多数位于接受多个脑区信息的联络皮层,比如豆状核,海马,颞中回,顶上回,额上回等。 节点i 的介数 Bi 定义为通过该节点的最短路径的数目。归一化介数可通过如下公式计算:
介数越大的节点代表网络中越关键的节点(如 hub 节点),在该研究中我们定义网络的hub 节点为 bi 大于 1.5 倍的所有节点的介数平均值。
对于网络G 中的任意一点i, 其介数中心度的计算公式如下
10. 节点强度( node strength) , 加权网络中由于考虑了边的权值,无权网络中的度与度的分布特征在加权网络中进一步推广为强度与强度的分布。与节点度相比, 节点强度不仅考虑了与节点连接的边的数目,更进一步考虑了与节点连接的相应的边的权值 ,能够更加科学的衡量作者的局部网喊卜络特征,在采用累积频次加权的作者合作加权网络中,节点强度是指作者与其合作对象的累积绝对合作频次。
11. 最短路径长度(shortest path length) ,最短路径长度,(shortest path length).最短路径郑或穗对网络的信息传输起着重要的作用, 是描述网络内部结构非常重要的一个参数. 最短路径刻画了网络中某一节点的信息到达另一节点的最优路径,通过最短路径可以更快地传输信息, 从而节省系统资源. 两个节点i,j之间边数最少的一条通路称为此两点之间的最短路径, 该通路所经过团庆的边的数目即为节点i,j之间的最短路径长度, lij. 网络最短路径长度L 描述了网络中任意两个节点间的最短路径长度的平均值
12. 特征路径长度( characteristic path length) Lp ,网络整体路由效率的程度。对于特征路径长度的计算,有断键重连的标准小世界网络方法和添加长键转化小世界网络方法。 该指标衡量了网络的信息并行处理的能力或全局效率(1/ Lp),特征路径长度的增加说明了脑区之间的信息传输和交互效率降低。 一个网络的特征路径长度 Lp , 是网络中任意两节点的最短路径的平均 :
13. 聚类系数( clustering coefficient) ,聚类系数Cp,网络的聚类程度,集群系数衡量的是网络的集团化程度, 是度量网络的另一个重要参数, 表示某一节点i 的邻居间互为邻居的可能. 节点i 的集群系数Ci的值等于该节点邻居间实际连接的边的数目(ei)与可能的最大连接边数(ki(ki–1)/2)的比值。 该指标衡量了网络的局部聚集性或者信息传输的局部效率。 网络中所有节点集群系数的平均值为网络的集群系数。
14.局部效率(local efficiency) ,局部效率Eloc,衡量如何高效的传播信息通过节点的直接相邻节点,由于集群系数只考虑了邻居节点间的直接连接, 后来有人提出局部效率(local efficiency)Eloc的概念. 集群系数和局部效率度量了网络的局部信息传输能力, 也在一定程度上反映了网络防御随机攻击的能力。任意节点i 的局部效率为
该指标描述了网络的容错能力,表明当移除节点 i 后它直接相邻的节点间的通信效率。
15.全局效率( global efficiency) ,全局效率 Eglob 描述了网络对于信息并行处理的能力,定义为任意两节点的最短路径的调和平均值的倒数,全局效率Eglob,衡量如何有效的通过整个网络传播信息,通常最短路径长度要在某一个连通图中进行运算, 因为 如果网络中存在不连通的节点会导致这两个节点间的最短路径长度值为无穷 . 因此有人提出了全局效率(global efficiency)Eglob的概念。最短路径长度和全局效率度量了网络的全局传输能力. 最短路径长度越短, 网络全局效率越高, 则网络节点间传递信息的速率就越快. 全局效率的降低说明脑区之间的信息传输和交互效率降低。
16.外径(Diameter) ,The longest of all the geodesics, and the geodesics is a shortest path between two nodes. If we are looking for the diameter of a network, we are really looking at all the shortest paths and then choosing the longest one.
17.平均最短路径(Average path length) , It's calculated by finding the shortest path between all the nodes, adding them up, and then dividing by the total number of pairs. It will show us the number of steps on average it takes to get from one member to another in the network. For example, 721 million users with an average path length of just 4.74, in these network, we show that it is at once both global and local, it connects nodes which are far away but also has the dense local structure, and this is called the small world phenomena.
18.AAL模板, AAL全称是Anatomical Automatic Labeling,AAL分区是由 Montreal Neurological Institute (MNI)机构提供的。AAL模板一共有116个区域,但只有90个属于大脑,剩余26个属于小脑结构,研究的较少。
19.MNI空间, 是Montreal Neurological Institute根据一系列正常人脑的磁共振图像而建立的坐标系统。Native空间就是原始空间。图像没有做任何变换时就是在原始空间。在这个空间中图像的维度、原点、voxel size等都是不同的, 不同被试的图像之间不具有可比性 , 计算出来的任何特征都不能进行统计分析 ,或是用于机器学习。所以 必须对所有被试的图像进行配准标准化到同一个模板上,这样所有被试的维度、原点、voxel size就一样了。 使用MNI标准模板,就表示把图像转换至MNI空间了。 一般而言MNI模板是最常用的,研究的比较多。 标准空间的图像也是指MNI空间的图像。
20.Talairach空间, 和MNI空间的坐标有对应的关系,很多软件都提供这个功能,如Mricron、REST等。Talairach空间只要是为了判别当前坐标在什么结构上,注意Talairach atlas and Talairach coordinates 就是Stereotaxic space.
21.全局网络度Kp ,节点 i 的连接度 Ki 定义为与该节点直接相连的边的数目,高度连接的节点的度较大。该指标用来描述一个网络的稀疏度。全局网络的度Kp 为网络中所有节点的度的平均:
22.小世界属性,基于体素和基于脑区的研究都表明人脑功能网络都具有高效的小世界属性。 For example, 721 million users with an average path length of just 4.74, in these network, we show that it is at once both global and local, it connects nodes which are far away but also has the dense local structure, and this is called t he small world phenomena . 小世界网络( small-world network) 网络的小世界属性:高的聚类系数和短的特征路径长度。小世界的拓扑结构支持大脑信息处理的分化和整合功能,是一种经济型的结构,支持高度复杂动态结构的同时,使得配线代价最低。具有小世界属性的动态系统通常有较好的抗攻击性,而且表现出比较高的信息传输速度,计算能力和同步性。
23. 攻击性, 用来定量描述某个节点的失败对网络行为的影响。节点 i 的攻击性Vi 定义为: 当去掉节点 i 及其连接的边后网络全局效率的变化 ,可通过如下公式计算:
其中 Eglob’表示去掉节点 i 及其连接的边后网络的全局效率。 攻击性同介数中心性一样也是反映了节点在网络中的重要性。
24.节点效率ei, 衡量一个节点与其他节点通信的效率
25.结构性连接,
26.模块化结构,
27.结构性脑网络( structural brain networks 或anatomical brain networks)
28.功能性脑网络( functional brain networks)
29.因效性脑网络( effective brain networks)
30.无标度网络( scale-free network)
31.随机网络( random network)
32.规则网络( regular network)
33.无向网络( undirected network)
34.加权网络( weighted network)
35.相位同步( phase synchronization)
36.连接密度(connection density/cost)
37.互相关分析( cross-correlation analysis)
38.因果关系分析( Causality analysis)
39.直接传递函数分析( Directed Transfer Function,DTF)
40.部分定向相干分析( Partial Directed Coherence,PDC)
多变量自回归建模( multivariate autoregressivemodel,MVAR)
独立成分分析( independent component analysis,ICA)
步似然性(synchronization likelihood, SL)
结构方程建模(structural equationmodeling, SEM)
动态因果建模(dynamic causalmodeling, DCM)
心理生理交互作用模型(Psychophysiological interaction model)
非度量多维定标(non-metric multidimensional scaling)
体素形态学(voxel-based morphometry,VBM)
统计参数映射(statistical parametric mapping,SPM)
皮尔逊相关系数(Pearson correlation)
偏相关系数(Partial correlation)
脑功能连接,度量空间上分离的不同脑区间在时间上和相关性和功能活动的统计依赖关系,是描述脑区之间协同工作模式的有效手段。
方法学:(1)定义被试的节点的方法:AAL模板和自动配准;(2)定义边:确定性的纤维跟踪算法,HARDI,DSI,概率跟踪算法;(3)二值网和加权网的选择;
最大连通子图大小,SOBCC(Size of Biggest Connected Component),代表网络连通分量的大小。
‘贰’ 复杂网络 --- 社会网络分析
“社会网络”指的是社会成员及其相互关系的集合。社会网络中所说的“点”是各个社会成员,而社会网络中的“边”指的是成员之间的各种社会关系。成员间的关系可以是有向的,也可以是无向的。同时,社会关系可以表现为多种形式,如人与人之间的朋友关系、上下级关系、科研合作关系等,组织成员之间的沟通关系,国家之间的贸易关系等。社会网络分析(Social Network Analysis)就是要对社会网络中行为者之间的关系进行量化研究,是社会网络理论中的一个具体工具。
因此,社会网络分析关注的焦点是关系和关系的模式,采用的方式和方法从概念上有别于传统的统计分析和数据处理方法。
社会网络通常表达人类的个体通过各种关系连接起来,比如朋友、婚姻、商业等,这些连接宏观上呈现出一定的模式。很早的时候,一些社会学家开始关注人们交往的模式。Ebel等进行了一个电子邮件版的小世界问题的实验,完成了Kiel大学的5000个学生的112天电子邮件连接数据,节点为电子邮件地址,连接为消息的传递,得到带指数截断的幂律度分布,指数为r=1.18。同时证明,该网络是小世界的,平均分隔为4.94。
社会网络分析,可以解决或可以尝试解决下列问题:
“中心性”是社会网络分析的重点之一,用于分析个人或组织在其社会网络中具有怎样的权力,或者说居于怎样的中心地位,这一思想是社会网络分析者最早探讨的内容之一。
点度中心度表示与该点直接相连的点的个数,无向图为(n-1),有向图为(入度,出度)。
个体的中心度(Centrality)测量个体处于网络中心的程度,反映了该点在网络中的重要性程度。网络中每个个体都有一个中心度,刻画了个体特性。除了计算网络中个体的中心度外,还可以计算整个网络的集中趋势(可简称为中心势,Centralization)。网络中心势刻画的是整个网络中各个点的差异性程度,一个网络只有一个中心势。
根据计算方法的不同,中心度和中心势都可以分为3种:点度中心度/点度中心势、中间中心度/中间中心势、接近中心度/接近中心势。
在一个社会网络中,如果一个个体与其他个体之间存在大量的直接联系,那么该个体就居于中心地位,在该网络中拥有较大的“权力”。在这种思想的指导下,网络中一个点的点度中心性就可以用网络中与该点之间有联系的点的数目来衡量,这就是点度中心度。
网络中心势指的是网络中点的集中趋势,其计算依据如下步骤:首先找到图中的最大点度中心度的数值,然后计算该值与任何其他点的中心度的差值,再计算这些“差值”的总和,最后用这个总和除以各个“差值”总和的最大可能值。
在网络中,如果一个个体位于许多其他两个个体之间的路径上,可以认为该个体居于重要地位,因为他具有控制其他两个个体之间的交往能力,这种特性用中间中心度描述,它测量的是个体对资源控制的程度。一个个体在网络中占据这样的位置越多,代表它具有很高的中间中心性,就有越多的个体需要通过它才能发生联系。
中间中心势定义为网络中 中间中心性最高的节点的中间中心性与其他节点的中间中心性的差距,用于分析网络整体结构。中间中心势越高,表示该网络中的节点可能分为多个小团体,而且过于依赖某一个节点传递关系,说明该节点在网络中处于极其重要的地位。
接近中心性用来描述网络中的个体不受他人“控制”的能力。在计算接近中心度的时候,我们关注的是捷径,而不是直接关系。如果一个点通过比较短的路径与许多其他点相连,我们就说该点具有较高的接近中心性。
对一个社会网络来说,接近中心势越高,表明网络中节点的差异性越大;反之,则表明网络中节点间的差异越小。
注:以上公式都是针对无向图,如果是有向图则根据定义相应修改公式即可
当网络中某些个体之间的关系特别紧密,以至于结合成一个次级团体时,这样的团体在社会网络分析中被称为凝聚子群。分析网络中存在多少个这样的子群,子群内部成员之间关系的特点,子群之间关系特点,一个子群的成员与另一个子群成员之间的关系特点等就是凝聚子群分析。
由于凝聚子群成员之间的关系十分紧密,因此有的学者也将凝聚子群分析形象地称为“小团体分析”或“社区现象”。
常用的社区检测方法主要有如下几种:
(1)基于图分割的方法,如Kernighan-Lin算法,谱平分法等;
(2)基于层次聚类的方法,如GN算法、Newman快速算法等;
(3)基于模块度优化的方法,如贪婪算法、模拟退火算法、Memetic算法、PSO算法、进化多目标优化算法等。
凝聚子群密度(External-Internallndex,E-IIndex)主要用来衡量一个大的网络中小团体现象是否十分严重,在分析组织管理等问题时非常有效。
最差的情形是大团体很散漫,核心小团体却有高度内聚力。另外一种情况是,大团体中有许多内聚力很高的小团体,很可能就会出现小团体间相互斗争的现象。凝聚子群密度的取值范围为[-1,+1]。该值越向1靠近,意味着派系林立的程度越大;该值越接近-1,意味着派系林立的程度越小;该值越接近0,表明关系越趋向于随机分布,未出现派系林立的情形。
E-I Index可以说是企业管理者的一个重要的危机指数。当一个企业的E-I Index过高时,就表示该企业中的小团体有可能结合紧密而开始图谋小团体私利,从而伤害到整个企业的利益。其实E-I Index不仅仅可以应用到企业管理领域,也可以应用到其他领域,比如用来研究某一学科领域学者之间的关系。如果该网络存在凝聚子群,并且凝聚子群的密度较高,说明处于这个凝聚子群内部的这部分学者之间联系紧密,在信息分享和科研合作方面交往频繁,而处于子群外部的成员则不能得到足够的信息和科研合作机会。从一定程度上来说,这种情况也是不利于该学科领域发展的。
核心-边缘(Core-Periphery)结构分析的目的是研究社会网络中哪些节点处于核心地位,哪些节点处于边缘地位。核心-边缘结构分析具有较广的应用性,可用于分析精英网络、论文引用关系网络以及组织关系网络等多种社会现象。
根据关系数据的类型(定类数据和定比数据),核心—边缘结构有不同的形式。定类数据和定比数据是统计学中的基本概念,一般来说,定类数据是用类别来表示的,通常用数字表示这些类别,但是这些数值不能用来进行数学计算;定比数据是用数值来表示的,可以用来进行数学计算。如果数据是定类数据,可以构建离散的核心-边缘模型;如果数据是定比数据,可以构建连续的核心-边缘模型。
离散的核心-边缘模型,根据核心成员和边缘成员之间关系的有无及紧密程度,又可分为3种:核心-边缘全关联模型、核心-边缘局部关联模型、核心-边缘关系缺失模型。如果把核心和边缘之间的关系看成是缺失值,就构成了核心-边缘关系缺失模型。
这里介绍适用于定类数据的4种离散的核心-边缘模型:
参考