1.基本定义
1.1香农定义
香农定义:S=-k’lnP
S:信息 单位:比特
P:通信所叙述事物的可能状态数目
k’lnP:使得对具有两种等可能性的事件做出明确判断时所需的信息为一个“比特”。
香农信息表示从系统的各种可能状态中确定一个所需信息的比特数。香农信息强调在人为干预下从多种可能状态向少数或者唯一状态的过度。
1.2序参量
序参量(相变的重要参量):ξ=R WR+W \xi = \frac{R\,W}{R + W} ξ=R+WRW
连续相变的序参量在临界点附近都遵循普遍的幂律(无标度律):
ξ∝∣ t−tc ∣β
\xi \propto \left|\, t - t_{c} \,\right|^{\beta}
ξ∝∣t−tc∣β
t是温度或者其他参量
tc是相变的临界参量值
无穷自相似 指的是一个物体或图形在其自身的不同部分,在不同尺度上,都重复出现相同或相似的结构。
1.3关节特征
-
尺度不变性:无论你将它放大多少倍,看到的细节结构都和整体看起来一样。没有所谓的“最基础”的单元,结构在所有尺度上都重复出现。
-
递归性:它通常可以通过一个简单的、不断重复的规则或过程来生成(在数学上,这通常是一个递归或迭代过程)。
简单来说,康托尔三分集的维数是一个分数(约为0.6309),这意味着它的维数在0(一个点)和1(一条线)之间。 这种维数被称为 分形维数(更具体地说,是豪斯多夫维数)。
无限复杂的、介于点与线之间的中间物。
康托尔集之所以著名,是因为它拥有许多看似矛盾的性质:
-
是无穷的,但长度为0:
-
长度为零:最初线段长度为1。第一步后剩下2/3,第二步后剩下(2/3)²,第n步后剩下(2/3)n。当n趋近于无穷大时,(2/3)n 的极限是 0。所以,康托尔集的“测量长度”(勒贝格测度)为0。
-
点却无限多:首先,每一步操作中,我们只去除了开区间的内部,而端点(如0, 1, 1/3, 2/3, 1/9, 2/9, …)是永远会被保留的。这些端点有无穷多个。更重要的是,还有大量不是端点的点也留了下来(比如所有三进制表示中只包含0和2的数对应的点)。
-
-
不可数:
- 虽然它的长度为0,但康托尔集中的点和整个 [0, 1] 区间上的点一样多!这在数学上称为“等势”。这意味着你无法像数自然数(1,2,3…)一样把所有康托尔集中的点一个个列出来。它是一个不可数无穷集。这证明了无穷也有大小之分,并且一个“看起来很小”的集合(长度为0)也可以拥有非常多的点。
-
无处稠密(或完全不连通):
- 在康托尔集中,你找不到任何一小段“连续”的区间。其中的每一个点都是孤立的,或者说点与点之间充满了被“挖掉”的鸿沟。无论你取多么短的一个区间,它里面都包含不属于康托尔集的点。所以,它在拓扑上是“稀疏”的。
-
完美的自相似性:
- 这是它与您上一个问题“无穷自相似”的直接联系。如果你看康托尔集在 [0, 1/3] 上的部分,把它放大3倍,它看起来和整个康托尔集一模一样。同样,在 [2/3, 1] 上的部分放大3倍后,也和整体一模一样。这种自相似性在所有尺度上都成立,是无穷无尽的。因此,康托尔集是一个典型的分形。
l是标尺长度 M是标尺个数
- 这是它与您上一个问题“无穷自相似”的直接联系。如果你看康托尔集在 [0, 1/3] 上的部分,把它放大3倍,它看起来和整个康托尔集一模一样。同样,在 [2/3, 1] 上的部分放大3倍后,也和整体一模一样。这种自相似性在所有尺度上都成立,是无穷无尽的。因此,康托尔集是一个典型的分形。
-
数学家豪斯多夫正是从上述关系中,精确定义了维度
D。我们从上面的关系式可以解出D:
M’(k) ≈ k^D * M
两边取对数:log(M’(k)) ≈ D * log(k) + log(M)
因此,维度D可以表示为:
D ≈ log(M’(k) / M) / log(k) -
最简洁的形式就是:
D = log(段数增加倍数) / log(尺子缩小倍数)- 对于康托尔集:尺子每次缩小3倍(
k=3,log(3)),我们看到的段数增加2倍(log(2)),所以D = log(2)/log(3)。
分形维数D描述了这样一个事实:当你用越来越精确的“显微镜”(更短的标尺l)去观察一个分形物体时,你所能看到的“细节数量”M会以一种特定的速率增长。这个增长率由D决定。D越大,说明这个物体越是“支离破碎”、“充满细节”,占据空间的能力越强(但又不完全充满)。
- 对于康托尔集:尺子每次缩小3倍(
2.原胞自动机(元胞自动机(Cellular Automata简称CA)
一、核心定义
原胞自动机是一个由离散的、规则划分的“细胞”格网组成的系统,每一个细胞都处于一种有限的状态中。整个系统按照统一的、局部的规则在离散的时间步上同步更新。
可以将它想象成一个由无数个小格子组成的棋盘,每个格子就像一个“细胞”。所有细胞遵循同一套简单的规则,根据自己和邻居当前的状态,决定自己下一刻的状态。整个棋盘就这样一步步地演化下去。
二、四大基本要素(构成一个CA的必要条件)
任何一个原胞自动机都由以下四个基本部分定义:
-
细胞空间:
-
细胞的排列方式。最常见的是一维(一条直线上的细胞)或二维(一个平面上的细胞,如棋盘格)网格。
-
维度是它的“舞台”。
-
-
状态集:
-
每个细胞在任意时刻只能处于有限多种状态中的一种。
-
最简单、最常见的是二进制状态,例如:“生”/“死”、“1”/“0”、“黑”/“白”。
-
更复杂的模型可以有多种状态(如多种颜色)。
-
-
邻居关系:
-
规则定义的依据。一个细胞的下一个状态取决于它自身当前状态和其邻居细胞的状态。
-
常见的邻居定义:
-
一维:通常取左右相邻的细胞(如半径为1的邻居,包括自己共3个细胞)。
-
二维:最常见的是冯·诺依曼邻居(上下左右4个)和摩尔邻居(周围8个)。
-
-
-
演化规则:
-
这是CA的灵魂。它是一个函数,规定了对于“当前细胞状态”和“其邻居状态组合”的每一种可能情况,该细胞在下一个时间步应该变成什么状态。
-
规则是局部的(只查看附近邻居)、并行的(所有细胞同时根据当前状态计算下一状态)、一致的(所有细胞使用同一规则)
-
三、核心思想与要点
-
简单的局部规则可产生复杂的全局行为:
这是CA最深刻、最迷人的思想。每个细胞本身是“愚蠢”的,它只知道一个非常简单的、关于自己和邻居的规则。但当成千上万个这样的细胞并行运作时,整个系统却能涌现出极其复杂的、意想不到的宏观模式(如有序结构、混沌、螺旋波等)。这为复杂性和涌现现象的研究提供了理想模型。 -
离散性:
CA在空间(细胞网格)、时间(离散时间步)和状态(有限种状态)上都是完全离散的。这使得它非常适合在计算机上进行模拟和计算。 -
并行性:
所有细胞在同一时刻同步更新。这意味着下一个状态的计算只依赖于当前时刻的状态,与“正在计算”的其他细胞无关。这种大规模并行性是CA强大计算能力的来源。 -
时空动力学:
观察一个CA的演化,最好的方式是看它的时空图(尤其是一维CA)。通常纵轴是时间(向下演化),横轴是空间(所有细胞)。初始状态(第一行)经过规则演化,产生出下一行,如此往复,形成一个动态的图案。这个图案揭示了系统的内在动力学特性。
类型 I:平稳型(或均匀型)
-
核心特征:快速收敛到一个统一的、稳定的平衡态。
-
行为描述:无论初始状态多么随机、多么复杂,整个系统都会非常迅速地(通常在几个时间步内)演化到一种状态,其中所有细胞都变得完全相同,并且不再随时间改变。
-
比喻:就像一滴墨水在静水中最终会扩散均匀,变成一杯颜色一致的溶液。系统“忘记”了它的初始状态。
-
系统熵:熵变得非常低,高度有序。
-
对应世界:类似热力学中的平衡态。
-
示例规则:规则 0, 32, 160 等。(规则编号是沃尔夫勒姆对一维二元邻居自动机的编号系统)
类型 II:周期型(或重复型)
-
核心特征:演化出稳定的、简单的周期性或固定结构。
-
行为描述:系统会演化出一些稳定的、不变的结构,或者开始周期性地在几种模式之间循环。这些结构是局部的,并且与同样结构的副本整齐排列。行为高度可预测。
-
比喻:就像晶体生长一样,形成有规律的、重复的晶格结构。或者像一个钟摆,永远以固定的周期摆动。
-
系统熵:熵较低,有序。但比 I 类更具结构性。
-
对应世界:类似周期性运动,如行星轨道、晶体结构。
-
示例规则:规则 4, 50, 108 等。
类型 III:混沌型
-
核心特征:产生非周期的、看似随机的、混乱的行为。
-
行为描述:即使从一个非常简单的初始状态(比如只有一个黑点)开始,系统也会迅速演化出看似随机、毫无规律可言的模式。微小的初始变化(例如改变一个细胞的状态)会被迅速放大,导致后续演化完全不同(对初始条件高度敏感)。
-
比喻:就像烟雾的运动或天气预报——本质上不可长期预测。
-
系统熵:熵很高,无序。
-
对应世界:类似混沌系统,如湍流、天气。
-
示例规则:规则 30, 90, 126 等。规则30甚至被用作伪随机数生成器。
类型 IV:复杂型
-
核心特征:在有序和混沌的边缘,产生出复杂的、局域化的、长期演化的结构。
-
行为描述:这是最有趣、最神秘的一类。系统会产生高度复杂的结构,这些结构既不是完全有序的,也不是完全混沌的。它们会形成孤子(稳定的、能传播的“碎片”)、螺旋等结构,这些结构能够持续存在、移动、并且相互发生作用(碰撞、湮灭、产生新结构)。这些相互作用可以视为一种信息处理。
-
比喻:就像生命本身。细胞相互作用形成组织、器官和有机体。信息在这些结构中传递和处理。
-
系统熵:处于中等水平,在有序和无序的临界点上。
-
对应世界:类似生命系统、生态系统、经济系统或大脑。这些系统复杂但并非完全随机,能够处理和存储信息。
-
示例规则:规则 110, 和著名的康威的生命游戏(它是二维的,但属于此类)。规则110已被证明是图灵完备的,意味着它理论上可以执行任何计算机能完成的计算。
3.复杂性的统计度量
复杂性的统计度量可以写作为CLMCC_{LMC}CLMC=HDHDHD
3.1洛伦茨映像
是一种分析数据的方法,不仅可以用于分析洛伦茨系统的输出,还可以用于分析其他混沌系统,他有事也被称为“回归图”或者“峰值图”。
CLMCC_{LMC}CLMC=HDHDHD,其中HHH=-klnpklnpklnp,表示1,2节介绍过的,系统状态的香农信息。系统越是无序,香农信息越大,CLMCC_{LMC}CLMC越大,对于具有N个可能状态{x1,x2,.....,xi}\{x_{1},x_{2},.....,x_{i}\}{x1,x2,.....,xi} 的系统,若其中每个xix_{i}xi状态出现的概率为pip_{i}pi,,容易推导出更普遍的表达式
H=−k′∑Ni=1pilnpiH=-k^{'}\sum_{N}^{i=1}p_{i}lnp_{i}H=−k′∑Ni=1pilnpi
定义中的第二项:
D=−∑Ni=1(pi−1/N)2D=-\sum_{N}^{i=1}(p_{i}-1/N)^2D=−∑Ni=1(pi−1/N)2
表示“远离平衡的程度”,这是由于1/N1/N1/N表示的是“每个状态等概率出现”这种极端情况下各态出现的概率,也就是平衡态理想气体每个气体出现的概率。因此平衡态的理想气体信息熵达到最大(也就是H最大),理想的平衡状态D等于0,最小。系统越是原理平衡,D越大。
3.2 复杂性的简单度量
归一化(Normalization) 是一种将不同尺度的数据映射到统一尺度的数据预处理方法。
它的核心目的是消除数据特征之间的量纲(Unit) 和取值范围的差异,让所有特征处于一个大致相同的数值范围内,从而避免某些特征仅仅因为数值大而对模型产生不成比例的影响。
3.2.1度量复杂网络的信息论方法:
1. 图熵(Graph Entropy) - 基础度量
这是最直接的方法,将香农信息熵的概念应用到图的结构属性上。核心思想是:根据网络的某种结构特征(如度分布、距离分布等)的不确定性来定义其熵值。熵越高,表示该结构特征越不确定、越随机(但也可能越无序);熵越低,表示越确定、越有序。
常用的图熵包括:
-
度分布熵(Degree Distribution Entropy):
这是最常用的一种。它计算节点度数的香农熵。-
公式: Hdeg=−∑k=pminpmaxp(k)logp(k)H_{deg} = -\sum_{k=p_{min}}^{p_{max}} p(k) \log p(k)Hdeg=−∑k=pminpmaxp(k)logp(k)
-
含义: p(k)p(k)p(k) 是网络中度为 kkk 的节点所占的比例。
-
解释:
-
对于一个规则网络(每个节点度数相同),度分布是一个脉冲,熵为 0(完全有序,无不确定性)。
-
对于一个完全随机网络(ER网络),度分布近似泊松分布,具有一个中等程度的熵值。
-
对于一个无标度网络(如互联网、社交网络),度分布是重尾的,其熵值通常高于随机网络,因为它要描述从低到高极其广泛的度数可能性。
-
-
-
其他分布熵:
-
距离分布熵: 基于所有节点对之间最短路径长度的分布来计算熵。它反映了网络节点间距离的“不可预测性”。
-
特征值熵(或谱熵): 基于网络拉普拉斯矩阵或邻接矩阵的特征值分布来计算熵。它捕获了网络振动模式的多样性。
-
局限性: 单纯依靠某种分布的熵可能会丢失大量结构信息。两个结构完全不同但度分布相同的网络,会有相同的度分布熵。
2. 压缩复杂度(Compressibility) - 柯尔莫哥洛夫复杂性的实践
柯尔莫哥洛夫复杂性定义:一个对象的复杂性是产生该对象的最短计算机程序的长度。但对于网络,这几乎是不可计算的。
实践方法:使用现实中的压缩算法(如LZ77, gzip)来近似。
-
如何操作:将网络的表示(例如,邻接矩阵按行展开成一个长长的二进制字符串)进行压缩。
-
度量:压缩比 = 压缩后大小 / 压缩前大小。
-
解释:
-
压缩比越低,说明网络的结构中存在越多的规律性和冗余,因此更容易被压缩,其复杂性通常较低(例如,规则网格)。
-
压缩比越高(接近1),说明网络数据越随机,难以压缩。完全随机的网络具有极高的压缩比,但其复杂性真的是“高”吗?这引出了下一个关键概念。
-
3. 逻辑深度(Logical Depth)与有效复杂度(Effective Complexity)
这是对“复杂性”更哲学和精细的界定,旨在区分 “纯粹的随机” 和 “有结构的复杂”。
-
纯粹的有序(如晶体): 低熵,易于描述,低复杂性。
-
纯粹的随机(如白噪声): 高熵,难以压缩,但同样低复杂性,因为它缺乏结构,只需一句“完全随机”即可描述。
-
有结构的复杂(如生命、大脑): 处于两者之间。它既有非随机的结构,又有一定的随机变异。它不容易被简短描述(高熵),但其结构又不是完全随机的。
如何度量:
-
逻辑深度: 产生该网络所需计算资源的多少(时间/步骤)。一个需要漫长演化过程(如生物进化)才能产生的网络,其逻辑深度很深,复杂性高。
-
有效复杂度 (由 Murray Gell-Mann 提出): 大致定义为描述系统规律性(而不是其随机特征)所需的信息量。它寻找的是对数据集的最佳“理论”描述,该理论能捕捉其所有规律,而将剩余部分视为随机噪声。
在网络中,这可能体现为寻找网络模块/社区结构的描述长度。描述一个具有清晰模块结构的网络,只需要说明模块的内部规则和模块间的连接规则,这比逐一描述每条边要简短得多。
4. 路径熵(Path Entropy)与随机游走复杂性
这种方法不关注网络的静态快照,而是关注其动态过程中涌现出的复杂性。
-
思想:在一个网络上进行随机游走,分析游走路径的统计特性。
-
度量:
-
随机游走熵率: 衡量随机游走过程中产生信息速率的上限。它量化了在网络上“探索”时的不确定性。
-
访问节点熵: 随机游走者访问各个节点的稳态分布的概率熵。它反映了游走者行为的可预测性。
-
-
解释:
-
在一个完全连通的网络上,游走者可以去任何地方,熵率很高(高度不确定)。
-
在一个链状网络上,游走者只能向左或向右,熵率很低(很确定)。
-
一个小世界网络可能具有较高的熵率,因为游走者可以通过捷径突然跳到很远的地方,增加了路径的不可预测性。
-
3.2.2 梅的逻辑斯谛模型
1. 什么是逻辑斯谛模型(Logistic Model)?
它最初是一个描述种群增长的生态学模型,是马尔萨斯指数增长模型的修正版。
-
马尔萨斯模型:假设资源无限,种群数量以指数形式增长。公式为:Nt+1=rNtN_{t+1} = r N_tNt+1=rNt (
N是种群数量,r是增长率)。 -
逻辑斯谛模型:考虑到资源有限,存在环境承载力(
K),种群增长会随着数量接近K而减慢,最终稳定在K附近。其微分方程形式(连续时间)为:
dNdt=rN(1−NK)\frac{dN}{dt} = r N (1 - \frac{N}{K})dtdN=rN(1−KN)
其中,(1 - N/K)项体现了密度制约效应。
2. 梅的贡献:离散化的逻辑斯谛映射
梅的关键一步是研究这个模型的离散化形式,即用差分方程来描述一代一代的种群变化。这个离散形式被称为逻辑斯谛映射(Logistic Map):
Xn+1=rXn(1−Xn)X_{n+1} = r X_n (1 - X_n)Xn+1=rXn(1−Xn)
参数解释:
-
XnX_nXn:第
n代的种群数量,被归一化到 [0, 1] 之间。0代表灭绝,1代表环境承载力K。 -
rrr:增长率参数,是关键的控制参数,通常在 [0, 4] 区间内变化。这个参数决定了系统的最终命运。
3. 梅的发现:参数r的变化导致行为的极大丰富性
梅通过计算机迭代计算这个简单的方程,并观察随着参数r增大,系统行为 XnX_nXn 的长期变化(即 n→∞n \to \inftyn→∞ 时的情况)。他发现了令人震惊的结果:
-
平衡(0 < r < 1):
- 种群最终会灭绝(Xn→0X_n \to 0Xn→0)。因为增长率太低,无法维持种群。
-
稳定点(1 < r < 3):
-
种群数量会稳定到一个固定的值(不动点)。例如
r=2.0时,无论初始值如何,最终都会稳定在 0.5。 -
这是经典的“S型”增长曲线。
-
-
周期振荡(3 ≤ r < ~3.57):
-
当
r超过 3 时,稳定点失稳,种群开始在不同值之间周期振荡。 -
倍周期分岔(Period-doubling Bifurcation):
r=3时,变为2点周期;r≈3.449时,变为4点周期;r≈3.544时,变为8点周期……周期长度以倍数的形式增加。
-
-
混沌(~3.57 ≤ r < 4):
-
当
r超过约 3.57 后,周期行为消失,系统进入混沌(Chaos) 状态。 -
混沌的特征:
-
对初始条件的极端敏感性:即所谓的“蝴蝶效应”。两个无限接近的初始值,经过多次迭代后会指数发散,导致长期行为完全无法预测。
-
确定性内在随机性:系统本身是完全确定性的(没有随机项),但其输出结果看起来是随机的、非周期的、不可预测的。
-
有序的窗口:在混沌区中,某些特定的
r值下又会突然出现稳定的周期行为(如3点周期),这被称为混沌中的周期窗口。
-
-
-
完全混沌(r=4):
- 混沌行为充满整个 [0,1] 区间
一个简单、确定性的规则(鱼生小鱼),自身就蕴含着产生巨大复杂性和不可预测性的能力。
4.一些有关复杂网络研究的统计物理学方法
居里点(Curie temperature,Tc)是磁性材料中自发磁化强度降为零时的温度值。
4.1 连续相变平均场理论
-
自由能展开式
F(T,μ)=F0(T)+12a(T)μ2+14b(T)μ4+⋯ F(T,\mu) = F_{0}(T) + \tfrac{1}{2}a(T)\mu^{2} + \tfrac{1}{4}b(T)\mu^{4} + \cdots F(T,μ)=F0(T)+21a(T)μ2+41b(T)μ4+⋯自由能取决于温度T和序参量μ\muμ,假设在相变点附近,自由能可以写成 μ\muμ 的偶次幂级数。因为体系具有对称性,奇次幂项一般消失。
-
平衡条件
∂F∂μ=0,∂2F∂μ2>0 \frac{\partial F}{\partial \mu} = 0, \quad \frac{\partial^{2} F}{\partial \mu^{2}} > 0 ∂μ∂F=0,∂μ2∂2F>0
这是极小值条件:自由能在平衡态下对序参导数为0,并且二阶导数大于0,保证是极小点
3. 系数的温度依赖性
a=a0(T−Tc),b>0
a = a_{0}(T - T_{c}), \quad b > 0
a=a0(T−Tc),b>0
这里假设 a(T) 随温度线性变化,临界点在 Tc=TT_{c}=TTc=T。
当Tc<T,a>0T_{c}<T,a>0Tc<T,a>0,当Tc>T,a<0T_{c}>T,a<0Tc>T,a<0,这正好对应序参量是否出现自发非零解。
4.2 自组织临界现象的平均场理论
自组织临界现象指的是:某些复杂系统在不断受到外部缓慢驱动、内部又存在能量释放机制时,会自然演化到临界状态,而不需要外部人为调节控制参数。
在临界状态下,系统会表现出 幂律分布、长程相关性和标度不变性 等特征。
例子:
- 沙堆模型:砂砾不断缓慢落下,当局部高度超过阈值就会下滑,形成从小到大的雪崩事件,其规模服从幂律分布。
- 网络流量拥塞:当网络流量积聚超过局部阈值时可能导致级联崩溃。
**关键点:**SOC系统可以自发“调节”到临界点,无须外界改变温度、压强等控制参数。
4.3 主方程
4.3.1 马尔可夫过程
未来只取决于现在,与过去无关
关键要素:
- 状态空间:所有状态的可能性
- 状态转移概率:从一个状态转移到另一个状态的概率,通常用一个转移概率矩阵来表示。(矩阵的每一行概率之和都为0)
- 初始状态分布:状态开始时处于每个状态的概率。
马尔可夫过程的常见类型:
根据时间和状态是离散的还是连续的,马尔科夫过程有几个重要的特例:
- 马尔可夫链:时间和状态都是离散的
- 连续时间马尔可夫过程:时间是连续的,状态是离散的
- 马尔可夫决策过程:在基础马尔可夫过程上加入了“动作”和“奖励”。智能体在某个状态下选择一个动作,这种动作不仅会影响转移到下一个状态的概率,还会带来一个奖励。这是强化学习的理论基础
- 隐马尔可夫模型:系统的真实状态是隐藏的,不可见的,但是我们能观察到一些有这些隐藏状态发出的可见的信号。
重要性:无记忆性大大简化了复杂系统的建模,使其在众多的领域有广泛作用。
- 自然语言处理:将文本看做一个马尔可夫链,例如,下一个词出现的概率只依赖于他前面的一个词和几个词。
- 强化学习:智能体与环境的交互被称为马尔可夫决策过程
- 网络排序算法:Goole的pageRank算法的核心思想是将网络的链接跳转视为马尔可夫过程,计算每个网页稳态概率作为状态的得分。
5. 博弈论及演化网络博弈
5.1 博弈论的分类与重要概念
5.1.1 合作博弈与非合作博弈
一、非合作博弈(Non-cooperative Game)
定义:
非合作博弈是指各参与者独立决策、相互竞争的博弈,没有外部机制保证他们能履行协议。每个玩家都追求自己的最大收益。
关键特征:
- 玩家独立行动;
- 不能签订具有约束力的协议;
- 典型解法是 纳什均衡(Nash Equilibrium);
- 强调个体理性与策略选择。
举例:
- 囚徒困境(Prisoner’s Dilemma)
两个囚犯是否互相揭发。虽然合作能使双方更好,但由于互不信任,他们最终都选择背叛。 - 价格竞争(Bertrand 竞争)
两个公司独立定价,最终可能把价格压到接近成本。
形式化表示(战略式博弈):
G=⟨N,(Si)i∈N,(ui)i∈N⟩G = \langle N, (S_i)_{i \in N}, (u_i)_{i \in N} \rangleG=⟨N,(Si)i∈N,(ui)i∈N⟩
其中:
- NNN:玩家集合;
- SiS_iSi:第 i 个玩家的策略集合;
- uiu_iui:第 i 个玩家的收益函数。
** 🤝 二、合作博弈(Cooperative Game)**
定义:
合作博弈是指参与者可以协商并达成具有约束力的协议,形成联盟(coalition)以实现整体利益,然后再协商如何分配。
关键特征:
- 可以形成联盟;
- 关注联盟收益与分配问题;
- 解法包括:
- 核心(Core)
- Shapley 值(Shapley Value)
- 纳什谈判解(Nash Bargaining Solution)
举例:
- 公司联合投标项目
多家公司合作中标,再协商利润如何分配。 - 多方分摊成本问题
几个城市合建污水处理厂,如何公平分摊建设成本。
G = ⟨ N, (Si)i∈N, (ui)i∈N ⟩
G \;=\; \langle\, N,\; (S_i)_{i\in N},\; (u_i)_{i\in N} \,\rangle
G=⟨N,(Si)i∈N,(ui)i∈N⟩
其中:
- NNN:玩家集合;
- SiS_iSi:第 (i) 个玩家的策略集合;
- uiu_iui:第 (i) 个玩家的收益函数。
** 三、主要区别总结**
| 项目 | 非合作博弈 | 合作博弈 |
|---|---|---|
| 能否达成协议 | ❌ 不可达成约束性协议 | ✅ 可达成并执行协议 |
| 分析单位 | 个体策略 | 联盟或整体 |
| 数学表示 | 战略形式 | 特征函数形式 |
| 目标 | 各自最大化收益 | 整体收益最大化与公平分配 |
| 典型解概念 | 纳什均衡 | 核心、Shapley 值、谈判解 |
| 示例 | 囚徒困境、价格竞争 | 联合投资、成本分摊 |
5.1.2 完全信息博弈和不完全信息博弈
** 一、完全信息博弈(Complete Information Game)**
定义:
完全信息博弈指的是:
在博弈中,每个参与者都清楚地知道所有玩家的收益函数、可选策略集合以及行动顺序。
也就是说,每个人对整个博弈的结构和规则完全了解。
⚠️ 注意:“完全信息”不等于“完全观察”!
还需要区分“完全信息(complete information)”与“完全可观博弈(perfect information)”。
✅ 特征
- 每个玩家知道:
- 所有参与者的收益函数;
- 所有参与者的可行策略集合;
- 博弈的结构和顺序;
- 玩家之间没有信息不对称;
- 可用于求解 纳什均衡、子博弈精炼均衡(Subgame Perfect Equilibrium) 等。
💡 举例
-
国际象棋 / 围棋
- 每个玩家都知道棋盘状态、规则、对方可能的行动。
- 属于“完全信息 + 完全可观”博弈。
-
价格竞争模型(Bertrand / Cournot 模型)
- 每个公司都知道对手的成本函数、策略空间等。
📘 数学描述
G=⟨N,(Si)i∈N,(ui)i∈N⟩G = \langle N, (S_i)_{i \in N}, (u_i)_{i \in N} \rangleG=⟨N,(Si)i∈N,(ui)i∈N⟩
其中所有玩家 iii 都知道:
- 玩家集合 NNN;
- 每个玩家的策略集合SiS_iSi;
- 每个玩家的收益函数 uiu_iui。
🔒** 二、不完全信息博弈(Incomplete Information Game)**
定义:
不完全信息博弈指的是:
至少有一个玩家对其他玩家的类型(Type)、收益函数或策略空间不了解。
即存在信息不对称(Information Asymmetry)。
在这种博弈中,玩家需要根据**概率或信念(belief)**去推测对方的类型。
✅ 特征
- 至少有一方对:
- 对手的收益函数;
- 或对手的可行策略;
- 或博弈规则中部分信息
不完全掌握;
- 通常使用 贝叶斯博弈(Bayesian Game) 框架分析;
- 解的概念是 贝叶斯纳什均衡(Bayesian Nash Equilibrium)。
💡 举例
-
拍卖(Auction)
- 每个竞标者只知道自己的估值,不知道他人的估值。
- 属于典型的不完全信息博弈。
-
市场信号传递(Signaling Game)
- 公司知道自己的产品质量,但消费者不知道,只能根据广告等信号推测。
-
招聘博弈(Job Market Signaling)
- 员工知道自己的能力水平,公司只能通过学历、简历推测。
📘数学表示(贝叶斯博弈)
G=⟨N,(Si)i∈N,(Ti)i∈N,p(t),(ui)i∈N⟩G = \langle N, (S_i)_{i \in N}, (T_i)_{i \in N}, p(t), (u_i)_{i \in N} \rangleG=⟨N,(Si)i∈N,(Ti)i∈N,p(t),(ui)i∈N⟩
其中:
- NNN:玩家集合;
- SiS_iSi:第 i 个玩家的策略集合;
- TiT_iTi:第 i 个玩家的类型集合;
- p(t)p(t)p(t):类型组合的先验概率;
- ui(s,t)u_i(s,t)ui(s,t):当类型为 ttt,策略为 sss 时的收益。
⚖️ 三、主要区别总结
| 项目 | 完全信息博弈 | 不完全信息博弈 |
|---|---|---|
| 信息对称性 | ✅ 信息完全对称 | ❌ 存在信息不对称 |
| 玩家了解情况 | 知道所有人的收益函数与策略 | 只知道自己的类型,对他人不完全了解 |
| 分析方法 | 普通博弈论方法(如纳什均衡) | 贝叶斯博弈、信号博弈 |
| 典型模型 | 囚徒困境、价格竞争 | 拍卖、信号传递、逆向选择 |
| 解概念 | 纳什均衡 / 子博弈精炼均衡 | 贝叶斯纳什均衡 |
| 应用领域 | 静态竞争、完全公开博弈 | 信息经济学、拍卖理论、机制设计 |
💡 四、补充:完全信息 ≠ 完全可观
| 概念 | 说明 | 示例 |
|---|---|---|
| 完全信息(Complete Information) | 所有人都知道规则、收益函数、策略空间 | 拍卖、价格竞争 |
| 完全可观(Perfect Information) | 玩家能观察到之前所有行动 | 国际象棋、井字棋 |
| 关系 | “完全可观” ⊂ “完全信息” | 前者更严格 |
5.1.3 🎯 静态博弈与动态博弈
🧩 一、静态博弈(Static Game)
定义:
静态博弈是指所有玩家同时(或在不知道他人选择的情况下)作出决策的博弈。
每个参与者只能基于对他人策略的预期来决定自己的最优行动。
又称“同时行动博弈”(Simultaneous-Move Game)。
✅ 特征
- 各方同时决策;
- 玩家无法观察他人行动;
- 强调策略的相互依赖性;
- 典型解法:纳什均衡(Nash Equilibrium)。
💡 举例
- 囚徒困境
两个囚犯在不知道对方选择的情况下同时决定“坦白”或“沉默”。 - 价格竞争模型(Bertrand 模型)
两家公司同时定价,价格最低者赢得市场。
📘 数学表示(战略式博弈)
G=⟨ N, (Si)i∈N, (ui)i∈N ⟩
G = \langle\, N,\; (S_i)_{i\in N},\; (u_i)_{i\in N} \,\rangle
G=⟨N,(Si)i∈N,(ui)i∈N⟩
其中:
- NNN:玩家集合;
- SiS_iSi:第 (i) 个玩家的策略集合;
- uiu_iui:收益函数;
- 所有玩家同时选择策略。
🎯** 解的概念**
纳什均衡(Nash Equilibrium):
没有任何玩家在其他人策略固定时有动力单方面改变自己的策略。
ui(si∗,s−i∗)≥ui(si,s−i∗),∀i,∀si∈Si
u_i(s_i^*, s_{-i}^*) \ge u_i(s_i, s_{-i}^*), \quad \forall i, \forall s_i \in S_i
ui(si∗,s−i∗)≥ui(si,s−i∗),∀i,∀si∈Si
⏳ 二、动态博弈(Dynamic Game)
定义:
动态博弈是指玩家按顺序(或多阶段)依次作出决策,每个玩家在决策时可能观察到前人的行动。
因此,行动具有时间结构与信息结构。
又称“序贯博弈”(Sequential Game)。
✅ 特征
- 玩家分阶段决策;
- 后行动者可能观察前行动者的行为;
- 强调策略的时间依赖性;
- 典型解法:子博弈精炼纳什均衡(Subgame Perfect Nash Equilibrium, SPNE)。
💡 举例
- 斯塔克伯格(Stackelberg)竞争模型
一家公司先定价,另一家公司观察后再定价。 - 谈判博弈(Bargaining Game)
各方轮流提出报价与接受条件。 - 进入威慑博弈(Entry Deterrence Game)
现有企业先选择是否降价,后进者再决定是否进入市场。
📘 数学表示(扩展式博弈)
G=⟨ N, H, P, (ui)i∈N ⟩
G = \langle\, N,\; H,\; P,\; (u_i)_{i\in N} \,\rangle
G=⟨N,H,P,(ui)i∈N⟩
其中:
- HHH:历史(行动序列)集合;
- P(h)P(h)P(h):到达历史 (h) 时的行动者;
- uiu_iui:收益函数;
- 信息集(Information Set)定义了玩家可观察到的历史。
🎯 解的概念
子博弈精炼纳什均衡(SPNE):
要求每个子博弈中都满足纳什均衡,防止“空威胁”(non-credible threats)。
⚖️ 三、主要区别总结
| 项目 | 静态博弈 | 动态博弈 |
|---|---|---|
| 决策时机 | 同时行动 | 顺序行动 |
| 信息结构 | 玩家不观察他人行动 | 后行动者可观察前行动者 |
| 模型形式 | 战略式 | 扩展式(博弈树) |
| 主要解概念 | 纳什均衡 | 子博弈精炼纳什均衡 |
| 代表模型 | 囚徒困境、Bertrand竞争 | Stackelberg竞争、进入威慑、谈判 |
| 强调 | 策略相互依赖 | 策略与时间序列 |
🎯 5.2 完全信息静态博弈与纳什均衡
🧩 一、完全信息静态博弈(Static Game with Complete Information)
定义:
完全信息静态博弈是指:
- 所有玩家同时或在不知道他人决策的情况下作出选择(静态);
- 所有玩家都清楚地知道整个博弈的结构(完全信息),包括:
- 参与者集合;
- 每个参与者的策略空间;
- 每个参与者的收益函数。
✅ 换句话说:
玩家知道对手“能干什么、想干什么”(收益函数),
但不知道对手“实际做了什么”(行动同时进行)。
📘 数学形式(战略式博弈表示)
G=⟨ N, (Si)i∈N, (ui)i∈N ⟩ G = \langle\, N,\; (S_i)_{i\in N},\; (u_i)_{i\in N} \,\rangle G=⟨N,(Si)i∈N,(ui)i∈N⟩
其中:
- NNN:玩家集合;
- SiS_iSi:第 ( i ) 个玩家的策略集合;
- ui:S1×S2×⋯×Sn→Ru_i : S_1 \times S_2 \times \cdots \times S_n \to \mathbb{R}ui:S1×S2×⋯×Sn→R:第 ( i ) 个玩家的收益函数。
玩家的目标:
maxsi∈Siui(si,s−i)
\max_{s_i \in S_i} u_i(s_i, s_{-i})
si∈Simaxui(si,s−i)
其中 (s_{-i}) 表示除玩家 (i) 外其他玩家的策略组合。
💡 举例:囚徒困境(Prisoner’s Dilemma)
| 对方沉默 © | 对方坦白 (D) | |
|---|---|---|
| 我沉默 © | (-1, -1) | (-10, 0) |
| 我坦白 (D) | (0, -10) | (-5, -5) |
- 两人同时选择是否坦白;
- 双方都知道收益矩阵;
- 但无法观察对方的当期选择;
- 属于典型的完全信息静态博弈。
🧠 二、纳什均衡(Nash Equilibrium)
定义:
纳什均衡是一组策略组合
s∗=(s1∗,s2∗,…,sn∗)
s^* = (s_1^*, s_2^*, \ldots, s_n^*)
s∗=(s1∗,s2∗,…,sn∗)
使得对于任意玩家 iii,在其他人策略固定的情况下,
玩家 iii 无法通过单方面改变策略获得更高收益。
数学形式:
ui(si∗,s−i∗)≥ui(si,s−i∗),∀si∈Si, ∀i∈N
u_i(s_i^*, s_{-i}^*) \ge u_i(s_i, s_{-i}^*), \quad \forall s_i \in S_i,\ \forall i \in N
ui(si∗,s−i∗)≥ui(si,s−i∗),∀si∈Si, ∀i∈N
💬 直观理解:
“在纳什均衡点上,没有人愿意先动手改变自己的策略。”
它体现的是一种相互最优、相互稳定的状态。
没有外力干预时,博弈系统会自然停留在此状态。
💡 举例:囚徒困境中的纳什均衡
- 双方的占优策略都是“坦白DDD”;
- 因此均衡策略组合为:
(D,D) (D, D) (D,D) - 该结果虽然不是全局最优(合作收益更高),但无人有动力单方面改变。
⚖️ 三、完全信息静态博弈与纳什均衡的关系
| 项目 | 完全信息静态博弈 | 纳什均衡 |
|---|---|---|
| 性质 | 一类博弈模型 | 一种解的概念 |
| 信息结构 | 所有玩家了解他人收益函数 | 与信息结构无关(但计算依赖信息) |
| 决策方式 | 同时决策、无观察 | 可应用任何静态博弈 |
| 含义 | 给出博弈规则 | 给出稳定结果 |
| 代表关系 | “框架/环境” | “均衡解” |
简而言之:
完全信息静态博弈提供舞台,纳什均衡是舞台上的稳定结局。
5.3 完全信息动态博弈与子博弈精炼纳什均衡
5.3.1 子博弈精炼纳什均衡
子博弈的概念
子博弈类似于“象棋”或“围棋”的对弈过程,每一步都构成一个新的局面。
在动态博弈中,每个玩家在某一步的选择不仅取决于当前收益,还取决于对未来局势的预测。
因此,一个完整的动态博弈包含了所有玩家在所有阶段的策略选择。
精炼均衡的含义
若动态博弈的每一个子博弈都达到纳什均衡,则整个动态博弈被称为子博弈精炼纳什均衡(Subgame Perfect Nash Equilibrium,简称 SPNE)。
动态博弈中常涉及“威胁”策略。
当一方提出威胁(如:若对方不合作则采取惩罚行动)时,另一方必须判断此威胁是否可信。
若实施威胁会使威胁者自身受损,则该威胁不可置信;
若实施威胁不会导致自身损失,则该威胁可信。
只有去除“不可信威胁”的策略组合,所形成的纳什均衡才是精炼的。
5.3.2 博弈树
由于动态博弈通常分为多个阶段,无法用单一的收益矩阵描述,因此需用**博弈树(Game Tree)**来刻画整个过程。
每个节点代表一个玩家的决策点,分支代表可能的行动,叶节点对应各自的最终收益。
这种图形化方式可清晰地反映玩家间的顺序关系与可观察信息。
5.3.3 例子分析
(1)“市场进入—阻挠”博弈
假设一个新企业计划进入市场:
- 进入成本为 10;
- 若成功进入,双方平分市场利润,各得 50;
- 若老企业(在位者)选择降价竞争以阻挠,双方利润均为 0。
则单阶段收益矩阵为:
| 进入者 \ 在位者 | 默许(合作,C) | 斗争(背叛,D) |
|---|---|---|
| 进入 © | 50, 40 | -10, 0 |
| 不进入 (D) | 0, 300 | 0, 300 |
收益解读:
- 进入者若选择进入,收益取决于在位者反应;
- 在位者若选择斗争,则双方陷入零利润;
- 若在位者选择默许,则市场共享,双方受益。
进入者的效用函数:
U进入=(40,−10),U不进入=(0,0)
U_{\text{进入}} = (40, -10), \quad U_{\text{不进入}} = (0, 0)
U进入=(40,−10),U不进入=(0,0)
在位者的效用函数:
U默许=(50,300),U斗争=(0,300)
U_{\text{默许}} = (50, 300), \quad U_{\text{斗争}} = (0, 300)
U默许=(50,300),U斗争=(0,300)
分析:
该博弈属于典型的“先动—后动”结构,进入者先决策是否进入,
在位者再根据进入情况选择行动。
若斗争成本高而威胁不可信,则进入者倾向选择“进入”,均衡策略为:
进入者:进入;
在位者:默许。
此为子博弈精炼纳什均衡(去除了不可置信威胁)。
(2)“求婚”博弈
设某城市中一位女孩深爱上一个贫穷青年,但她的母亲(守寡多年)强烈反对,声称:
“如果你敢嫁给他,我就与您断绝母女关系!”
母女二人的决策关系可构建如下博弈树:
| 女儿 \ 母亲 | 母亲默许 | 母亲断绝关系 |
|---|---|---|
| 偷婚 | (100, -10) | (-100, -100) |
| 中断恋爱 | (-100, 20) | (-100, -100) |
收益解释:
- 若女儿坚持偷婚,母亲若不阻止则短暂痛苦(-10),女儿幸福(+100);
- 若母亲真的断绝关系,双方永久不幸(-100, -100);
- 若女儿听母亲劝而中断恋爱,则女儿内心痛苦(-100),母亲短期高兴(+20)。
分析:
- 母亲的威胁“断绝关系”若实施会使自己长期痛苦,因此不可信;
- 当女儿判断威胁不可置信时,会选择“偷婚”;
- 故精炼纳什均衡为:女儿偷婚,母亲默许。
5.3.4 小结
| 概念 | 含义 |
|---|---|
| 动态博弈 | 玩家顺序决策,后行动者可观察前行动者选择 |
| 子博弈精炼纳什均衡 | 每个子博弈都满足纳什均衡的稳定策略组合 |
| 威胁可信性 | 若实施威胁使威胁者自身受损,则威胁不可置信 |
| 市场进入博弈 | 进入者与在位者间的顺序决策博弈 |
| 求婚博弈 | 情感与威胁可信性结合的社会性动态博弈案例 |
💡 子博弈精炼纳什均衡消除了“不可置信威胁”,
使动态博弈分析更贴近理性现实,体现了顺序决策中的可信策略。
📘 5.4 不完全信息静态博弈与贝叶斯纳什均衡
🧩 一、基本概念
在实际经济环境中,参与者通常无法完全掌握对方的全部信息。
信息不对称导致了“不完全信息博弈”(Incomplete Information Game),典型例子包括:
- 市场进入与阻挠博弈;
- 婚姻选择博弈;
- 企业竞争与投标决策。
在此类博弈中,玩家往往只能根据概率与信念去推测他人的“类型”(type),即对方的成本、能力或偏好等。
🧠 二、海萨尼转化(Harsanyi Transformation)
思想来源:
Harsanyi 提出,可以将“不完全信息博弈”转化为“完全信息博弈”,只需引入一个**“自然状态”或“类型分布”**的概念。
核心思路:
- 设有一类称为“类型空间”的变量,用来表示不同玩家可能的类型;
- 每种类型的出现具有一定概率;
- 玩家知道这种概率分布(即公共信念),但不知道对方的具体类型;
- 博弈变为“先由自然界决定类型 → 各玩家根据所知类型选择策略”的过程。
💡 海萨尼转化将“非科学的问题(不确定)”变为“概率科学问题”,
使得贝叶斯博弈可以在标准博弈论框架内分析。
⚖️ 三、贝叶斯纳什均衡(Bayesian Nash Equilibrium)
定义:
在贝叶斯博弈中,每个玩家的策略不仅取决于他能选择的动作,还取决于他所拥有的“类型”信息。
贝叶斯纳什均衡要求:
对每个玩家的每种类型,在其关于他人类型的信念下,该玩家选择的策略能最大化其期望收益。
形式表达:
Et−i[ ui(si∗(ti),s−i∗(t−i),ti,t−i) ]≥Et−i[ ui(si′(ti),s−i∗(t−i),ti,t−i) ]
E_{t_{-i}}[\,u_i(s_i^*(t_i), s_{-i}^*(t_{-i}), t_i, t_{-i})\,] \ge
E_{t_{-i}}[\,u_i(s_i'(t_i), s_{-i}^*(t_{-i}), t_i, t_{-i})\,]
Et−i[ui(si∗(ti),s−i∗(t−i),ti,t−i)]≥Et−i[ui(si′(ti),s−i∗(t−i),ti,t−i)]
对所有 (i) 和类型 (t_i) 成立。
📊 四、案例分析:市场进入与阻挠博弈
1️⃣ 模型设定
假设市场中存在:
- 进入者(Entrant)
- 在位者(Incumbent)
在位者可能是:
- 高成本型(H)
- 低成本型(L)
进入者无法直接观察其类型,只知道高成本型的概率为 (α)。
两类在位者与进入者的一次性收益矩阵如下:
高成本在位者
| 在位者选择:默许© | 在位者选择:斗争(D) | |
|---|---|---|
| 进入者进© | 50, 40 | 300, 0 |
| 进入者不进(D) | 0, 0 | 0, 0 |
低成本在位者
| 在位者选择:默许© | 在位者选择:斗争(D) | |
|---|---|---|
| 进入者进© | 100, 30 | 140, -10 |
| 进入者不进(D) | 0, 0 | 0, 0 |
2️⃣ 分析与解释
- 若在位者为低成本型,其斗争成本小,仍能维持部分利润;
- 若在位者为高成本型,斗争代价高,选择合作(默许)更优;
- 因此,进入者若无法确定在位者类型,将面临不完全信息的风险决策问题。
📈 五、不完全信息下的贝叶斯纳什均衡求解
设:
- 高成本型概率为 (α)
- 低成本型概率为 (1-α)
进入者进入市场的期望收益为:
E(进入)=40α+(−10)(1−α)
E(进入) = 40α + (-10)(1 - α)
E(进入)=40α+(−10)(1−α)
进入者不进入市场的收益为:
E(不进入)=0
E(不进入) = 0
E(不进入)=0
只有当:
E(进入)>0
E(进入) > 0
E(进入)>0
即:
40α−10(1−α)>0⇒α>0.2
40α - 10(1 - α) > 0 \quad \Rightarrow \quad α > 0.2
40α−10(1−α)>0⇒α>0.2
时,进入者的最优策略是“进入”;
否则,选择“不进入”。
✅ 六、结论
-
当进入者对高成本型在位者的信念概率 (α > 0.2) 时:
- 进入者的期望利润为正;
- 进入市场是最优决策;
- 形成一个不完全信息下的贝叶斯纳什均衡。
-
若 (α < 0.2),进入期望收益为负;
- 进入者选择“不进入”;
- 市场维持原有格局。
🔍 贝叶斯纳什均衡刻画了:
在信息不对称环境下,参与者如何基于信念与概率进行最优决策。
🧩 七、小结
| 内容 | 含义 |
|---|---|
| 不完全信息 | 玩家对他人类型(成本、能力)不确定 |
| 海萨尼转化 | 用“类型概率”将不完全信息转为完全信息 |
| 贝叶斯纳什均衡 | 基于信念与期望收益的最优稳定策略 |
| 案例结论 | 当高成本概率 > 0.2 时进入市场,否则不进入 |
5.5 不完全信息动态博弈与精炼贝叶斯纳什均衡
5.5.1 精炼贝叶斯纳什均衡
贝叶斯法则(Bayes’ Rule)
在不完全信息环境下,玩家依据对他人类型的信念来决策。
若博弈是动态的,则玩家会在观察到他人行动后不断修正自己的信念。
这种修正遵循 贝叶斯法则:
Posterior belief=Prior belief×LikelihoodTotal probability \text{Posterior belief} = \frac{\text{Prior belief} \times \text{Likelihood}}{\text{Total probability}} Posterior belief=Total probabilityPrior belief×Likelihood
即:
P(A∣B)=P(B∣A)P(A)P(B)
P(A|B) = \frac{P(B|A) P(A)}{P(B)}
P(A∣B)=P(B)P(B∣A)P(A)
玩家通过贝叶斯更新,不断修正对他人类型的概率预测,以便在每个信息节点上做出最优决策。
精炼贝叶斯纳什均衡(Refined Bayesian Nash Equilibrium)
定义:
当所有玩家都依据贝叶斯法则修正信念,并在每个阶段根据当前信念选择最优策略时,形成的策略组合即为精炼贝叶斯纳什均衡。
特征:
- 玩家信念随博弈进展动态更新;
- 策略需在每个信息集上最优;
- 排除了不可信的威胁与非理性策略。
例子:不完全信息动态囚徒困境博弈
(1)问题背景
传统囚徒困境假定双方完全理性、完全自私。
在一次性静态博弈中,纳什均衡是“双双背叛”,合作无法实现。
然而,实验发现:
- 实际人类在重复博弈中往往会出现合作倾向;
- 这促使学者提出“不完全信息动态囚徒困境”模型来解释现实合作现象。
(2)类型划分与人类行为假设
根据大量实验结果,玩家可分为三类:
- 利润型(self-interested type)
- 追求自身收益最大化;
- 利他型(altruistic type)
- 希望总收益(集体利益)最大;
- 超理智型(hyper-rational type)
- 在收益最大化同时追求与对方收益差距最小化。
(3)KMRW 模型(Kreps, Milgrom, Roberts & Wilson, 1982)
目标:
解释为何在不完全信息下,即使一次性博弈中背叛是理性选择,
在重复博弈中仍可能出现持续合作。
** 模型设定**
- 两位玩家 (A) 和 (B) 进行多次重复囚徒困境博弈;
- 玩家 (B) 无法确定 (A) 是理性还是“非理性”(即总会合作型);
- 设 (A) 为非理性的概率为 (p)。
一次博弈的收益矩阵:
| 乙 \ 甲 | 合作 © | 背叛 (D) |
|---|---|---|
| 合作 © | 1, 1 | a, b |
| 背叛 (D) | b, a | 0, 0 |
其中:
- (a, b > 0),且 (a + b \le 1)。
推导分析
1️⃣ 若乙选择合作©,其期望收益为:
EC=p(1+a)+(1−p)b
E_C = p(1 + a) + (1 - p)b
EC=p(1+a)+(1−p)b
2️⃣ 若乙选择背叛(D),其期望收益为:
ED=pa
E_D = pa
ED=pa
3️⃣ 当乙预估甲为非理性的概率 (p) 满足:
p(1+a)+(1−p)b>pa
p(1 + a) + (1 - p)b > pa
p(1+a)+(1−p)b>pa
即:
p>b1−b
p > \frac{b}{1 - b}
p>1−bb
时,乙会选择合作,从而实现双方合作均衡(对抗避免)。
多轮动态推理
- 若第一轮合作,则双方更新信念,认为对方非理性概率提高;
- 结果是“合作行为自我强化”;
- 若背叛发生,信念下降,合作瓦解。
因此,不完全信息动态博弈中合作能持续的关键在于:
“信念概率足够高”使得合作成为理性选择。
最终结论
在多轮囚徒困境中,只要理性玩家相信对方有足够概率属于非理性(合作)类型,
就可能持续维持合作。其形式条件为:
p>b1−b,p>a−1a,a+b≤1 p > \frac{b}{1 - b}, \quad p > \frac{a - 1}{a}, \quad a + b \le 1 p>1−bb,p>aa−1,a+b≤1
当这些条件成立时:
- 玩家之间形成精炼贝叶斯纳什均衡;
- 合作成为理性可持续的结果。
5.5.2 小结
| 概念 | 含义 |
|---|---|
| 不完全信息动态博弈 | 玩家逐步观察对方行为、更新信念、修正策略的博弈 |
| 贝叶斯法则 | 用概率修正对他人类型的信念 |
| 精炼贝叶斯均衡 | 信念动态更新下每阶段的最优策略组合 |
| KMRW模型 | 解释重复囚徒困境中合作可能出现的机制 |
| 核心条件 | 当 (p)(对方非理性概率)足够高时,合作成为理性选择 |
📘 精炼贝叶斯均衡在理论上连接了“理性行为”与“信念修正”,
使得博弈论能解释现实中的长期合作与信任形成机制。
5.6 演化网络博弈
5.6.1 演化网络博弈简介
- 背景:解释人类社会和自然界中自私个体之间合作的涌现现象,是博弈论的重要应用。
- 定义:演化网络博弈涉及大量局中人(数量 N→∞N \to \inftyN→∞)位于复杂网络上,随时间演化与邻居进行博弈。
- 核心特点:
- 局中人数量无限,分布在复杂网络上。
- 局中人基于邻居进行局部互动,策略更新规则称为“策略的策略”(更新频率慢于博弈)。
- 局中人可感知环境、吸取信息,根据经验更新策略。
- 策略更新受网络拓扑结构影响。
- 形式化表达:
- 用 n=1,⋯ ,Nn=1,\cdots,Nn=1,⋯,N 表示局中人,Sn={en1,en2,⋯ ,enQ}S_n = \{e_{n1}, e_{n2}, \cdots, e_{nQ}\}Sn={en1,en2,⋯,enQ} 表示策略空间。
- 策略构形为 (s1,⋯ ,sN)(s_1, \cdots, s_N)(s1,⋯,sN),效益函数为 un(s1,⋯ ,sN)u_n(s_1, \cdots, s_N)un(s1,⋯,sN)。
- 演化博弈表述为 G={s1,⋯ ,sN;u1,⋯ ,uN}G = \{s_1, \cdots, s_N; u_1, \cdots, u_N\}G={s1,⋯,sN;u1,⋯,uN}。
- 研究现状:已有大量研究成果,如文献[17-28];重点包括囚徒困境博弈和雪堆博弈在网络上演化的研究(因二局中人模型可简化分析)。
6.数理统计简介
6.1一些基本概念
6.1.1 统计学的一些重要概念
6.1.1.1 统计总体和统计样本
统计总体是统计研究的对象;统计样本是指在受到测量条件限制、时间和经费条件限制的情况下,从总体中随机选取的一部分个体。
当总体中每个个体都能被观察到并得到数据时,称为总体调查;
当只调查总体中的一部分样本时,称为抽样调查。
统计样本与统计总体的结果密切相关。
若样本随机性好、样本量足够大,则样本结果可近似反映总体特征;
若样本代表性差,则会产生抽样误差。
6.1.1.2 统计数据的描述
(1)均值(Mean)
样本均值计算公式:
overlineX=1N∑i=1NXioverline{X} = \frac{1}{N} \sum_{i=1}^{N} X_ioverlineX=N1∑i=1NXi
其中:
- XiX_iXi:第 i 个样本值(观测值)
- NNN:样本大小
均值表示所有观测值的算术平均值,反映数据的整体水平。
(2)中位数(Median)
设样本量为 NNN,将样本值按大小排列:
- 若 N=2k+1N = 2k + 1N=2k+1,则中位数为
M=X(k+1) M = X_{(k+1)} M=X(k+1) - 若 N=2kN = 2kN=2k,则中位数为
M=X(k)+X(k+1)2 M = \frac{X_{(k)} + X_{(k+1)}}{2} M=2X(k)+X(k+1)
中位数是使得样本在它两侧数量相等的值。
它不受极端值影响,适合用于偏态分布的数据。
(3)众数(Mode)
众数:样本中出现频率最高的数值。
若样本分布对称,众数、均值、中位数三者相同;
若样本偏态,则三者一般不相同。
(4)极差(Range)
极差定义为:
R=Xmax−Xmin R = X_{\max} - X_{\min} R=Xmax−Xmin
极差表示数据中最大值与最小值的差距,反映离散程度。
但它仅依赖两个端点值,易受异常值影响。
若将样本按大小排序,去掉前 1/4 和后 1/4 的数据后再求差,称为四分位极差。
6.1.2 概率论的一些重要概念
(1)概率(数据出现频率)
概率定义为:
P(xi)=n(xi)N P(x_i) = \frac{n(x_i)}{N} P(xi)=Nn(xi)
其中:
- n(xi)n(x_i)n(xi):取值为 xix_ixi 的数据个数
- NNN:样本总数
概率即事件出现的相对频率。
(2)频率分布
在大量重复实验中,每一个结果出现的频率趋近于某个稳定值,该稳定值即为事件的概率。
对每一个样本结果 xix_ixi:
P(xi)=n(xi)N P(x_i) = \frac{n(x_i)}{N} P(xi)=Nn(xi)
且所有样本结果的概率总和为:
∑iP(xi)=1
\sum_i P(x_i) = 1i∑P(xi)=1
当样本量足够大时,频率分布可用连续概率分布近似表示。
(3)累计出现频率
累计频率(或累计频率率)是指将所有数据按从小到大的顺序排列后,计算:
P(xi)=∑j≤in(xj)N P(x_i) = \frac{\sum_{j \leq i} n(x_j)}{N} P(xi)=N∑j≤in(xj)
其中:
- $n(x_j):取值为 xjx_jxj 的样本频数
- NNN:样本总数
这样的好处是:
- 可以避免对分布描述的单纯性;
- 不仅能体现数据量,还能反映样本的整体分布特征。
累计频率曲线常用于描述样本的分布趋势,例如通过累计曲线可得知超过(或低于)某数值的数据比例。
常见的如 帕累托分布(Pareto 分布),它描述了社会收入分布或商品销售比例等。
举例:
若 20% 的人拥有 80% 的财富,即为典型的帕累托规律(“二八定律”)。
(4)条件概率
条件概率的定义如下:
P(B∣A)=P(AB)P(A) P(B|A) = \frac{P(AB)}{P(A)}P(B∣A)=P(A)P(AB)
其中:
- (P(B∣A)( P(B|A)(P(B∣A):在事件 A 发生的条件下,事件 B 发生的概率;
- P(AB)P(AB)P(AB):事件 A 与事件 B 同时发生的概率;
- P(A)P(A)P(A):事件 A 发生的概率。
6.1.3 关于随机变量的一些重要概念
(1)随机变量的数学期望
随机变量 XXX的数学期望为:
E(X)=∑ixi p(X=xi) E(X) = \sum_i x_i \, p(X = x_i)E(X)=i∑xip(X=xi)
其中:
- XXX:随机变量;
- xix_ixi:可能取到的值;
- p(X=xi)p(X = x_i)p(X=xi):取到该值的概率。
数学期望反映了随机变量的平均水平。
(2)随机变量的方差
方差定义为:
σ2(X)=∑i[xi−E(X)]2 p(X=xi)=E[(X−E(X))2]
\sigma^2(X) = \sum_i [x_i - E(X)]^2 \, p(X = x_i) = E[(X - E(X))^2]
σ2(X)=i∑[xi−E(X)]2p(X=xi)=E[(X−E(X))2]
方差反映了随机变量与其期望之间的偏离程度。
(3)随机变量的标准差
标准差定义为:
σ(X)=E[(X−E(X))2]=σ2(X) \sigma(X) = \sqrt{E[(X - E(X))^2]} = \sqrt{\sigma^2(X)} σ(X)=E[(X−E(X))2]=σ2(X)
标准差是方差的平方根,直观反映了波动范围的大小。
方差与标准差越大,说明数据分布越分散;越小,则说明数据越集中。
(4)两个随机变量的协方差
协方差定义为:
Cov(X,Y)=E[(X−E(X))(Y−E(Y))] \text{Cov}(X, Y) = E[(X - E(X))(Y - E(Y))] Cov(X,Y)=E[(X−E(X))(Y−E(Y))]
协方差描述两个随机变量之间的联合变化趋势:
- 若 Cov(X,Y)>0\text{Cov}(X, Y) > 0Cov(X,Y)>0:表示两者正相关;
- 若 Cov(X,Y)<0\text{Cov}(X, Y) < 0Cov(X,Y)<0:表示负相关;
- 若 Cov(X,Y)=0\text{Cov}(X, Y) = 0Cov(X,Y)=0:表示不相关(独立时必然不相关,反之不一定)。
(5)两个随机变量的相关系数
相关系数定义为:
ρ(X,Y)=Cov(X,Y)σ(X)σ(Y) \rho(X, Y) = \frac{\text{Cov}(X, Y)}{\sigma(X)\sigma(Y)} ρ(X,Y)=σ(X)σ(Y)Cov(X,Y)
性质:
- −1≤ρ(X,Y)≤1-1 \leq \rho(X, Y) \leq 1−1≤ρ(X,Y)≤1
- 当ρ=1\rho = 1ρ=1:完全正相关(一个变量增大,另一个也按比例增大);
- 当ρ=−1\rho = -1ρ=−1:完全负相关(一个变量增大,另一个按比例减小);
- 当ρ=0\rho = 0ρ=0:两者不相关(线性无关)。
相关系数越接近 ±1,说明线性关系越强;越接近 0,说明线性关系越弱。
6.2 统计假设及其检验
本节主要讨论如何通过搜集数据、处理数据,来研究变量间的统计关系问题。
6.2.1 统计假设及其检验的基本概念
统计假设是指对随机变量关系或分布参数的假定。
假设检验是用来决定是否接受或否定统计假设的过程。
一般步骤:
- 提出假设原假设H0H_0H0 和备择假设 H1H_1H1;
- 利用样本数据对假设进行检验;
- 根据统计量与显著性水平,决定是否拒绝原假设。
6.2.2 分布
(1)标准正态分布
概率密度函数为:
f(x)=12πe−12x2,x∈(−∞,+∞) f(x) = \frac{1}{\sqrt{2\pi}} e^{-\frac{1}{2}x^2}, \quad x \in (-\infty, +\infty)f(x)=2π1e−21x2,x∈(−∞,+∞)
记为:
X∼N(0,1) X \sim N(0, 1)X∼N(0,1)
(2)卡方分布(χ2χ²χ2 分布)
设 X1,X2,…,XnX_1, X_2, \ldots, X_nX1,X2,…,Xn 相互独立,且各服从 ( N(0,1) ),则:
χ2=∑i=1nXi2 \chi^2 = \sum_{i=1}^{n} X_i^2χ2=i=1∑nXi2
称为自由度为 n 的卡方分布,记为:
χ2(n) \chi^2(n)χ2(n)
其概率密度函数为:
f(x)=12n/2Γ(n/2)xn/2−1e−x/2,x>0 f(x) = \frac{1}{2^{n/2}\Gamma(n/2)}x^{n/2-1}e^{-x/2}, \quad x > 0f(x)=2n/2Γ(n/2)1xn/2−1e−x/2,x>0
(3)ttt 分布
设 X∼N(0,1)X \sim N(0,1)X∼N(0,1),Y∼χ2(n)Y \sim \chi^2(n)Y∼χ2(n),且二者相互独立,则:
t=XY/n t = \frac{X}{\sqrt{Y/n}}t=Y/nX
称为自由度为 n 的 t 分布。其概率密度为:
f(t)=Γ(n+12)nπΓ(n2)(1+t2n)−n+12 f(t) = \frac{\Gamma\left(\frac{n+1}{2}\right)}{\sqrt{n\pi}\Gamma\left(\frac{n}{2}\right)}\left(1 + \frac{t^2}{n}\right)^{-\frac{n+1}{2}} f(t)=nπΓ(2n)Γ(2n+1)(1+nt2)−2n+1
当 n→∞n \to \inftyn→∞ 时,t 分布趋近于标准正态分布。
(4)中心极限定理
设随机变量序列 X1,X2,…,XnX_1, X_2, \ldots, X_nX1,X2,…,Xn 相互独立,且数学期望为 E(Xi)=μE(X_i)=\muE(Xi)=μ,标准差为σ(Xi)=σ\sigma(X_i)=\sigmaσ(Xi)=σ。
则样本均值:
X‾=1n∑i=1nXi \overline{X} = \frac{1}{n}\sum_{i=1}^{n} X_i X=n1i=1∑nXi
当 n→∞n \to \inftyn→∞时,有:
Z=X‾−μσ/n∼N(0,1) Z = \frac{\overline{X} - \mu}{\sigma / \sqrt{n}} \sim N(0,1) Z=σ/nX−μ∼N(0,1)
意义: 多数统计量在样本量足够大时,都可近似服从正态分布。
6.2.4 统计量
设样本 X1,X2,…,XnX_1, X_2, \ldots, X_nX1,X2,…,Xn 来自正态总体 N(μ,σ2)N(\mu, \sigma^2)N(μ,σ2),则:
-
样本均值:
X‾=1n∑i=1nXi \overline{X} = \frac{1}{n}\sum_{i=1}^{n} X_i X=n1i=1∑nXi -
样本方差:
S2=1n−1∑i=1n(Xi−X‾)2 S^2 = \frac{1}{n-1}\sum_{i=1}^{n}(X_i - \overline{X})^2 S2=n−11i=1∑n(Xi−X)2
若总体服从正态分布,则有:
t=X‾−μS/n∼t(n−1) t = \frac{\overline{X} - \mu}{S / \sqrt{n}} \sim t(n-1) t=S/nX−μ∼t(n−1)
6.2.5 检验
检验的一般步骤:
-
提出假设:
- 原假设 H0H_0H0:总体均值为某值;
- 备择假设H1H_1H1:总体均值不等于该值。
-
选取显著性水平(如 α=0.05)。
-
计算检验统计量:
t=X‾−μ0S/n t = \frac{\overline{X} - \mu_0}{S / \sqrt{n}} t=S/nX−μ0 -
查表确定拒绝域:
若 |t| > t(α/2, n−1),则拒绝原假设。
示例说明:
某批产品样本 n = 25,测得:
X‾=6.85,S=1.0 \overline{X} = 6.85, \quad S = 1.0 X=6.85,S=1.0
检验假设:H0:μ=7.0H_0 : \mu = 7.0H0:μ=7.0,显著性水平 α = 0.05。
计算统计量:
t=6.85−7.01/25=−0.75 t = \frac{6.85 - 7.0}{1 / \sqrt{25}} = -0.75 t=1/256.85−7.0=−0.75
查表$ t_{0.025,24} = 2.06$。
由于 −2.06<−0.75<2.06-2.06 < -0.75 < 2.06−2.06<−0.75<2.06,即在接受域内,因此不能拒绝原假设,说明总体均值可认为等于 7.0。

2232

被折叠的 条评论
为什么被折叠?



