耶鲁博弈论第1节导论——五个入门结论

最新推荐文章于 2025-08-15 11:17:10 发布

原创最新推荐文章于 2025-08-15 11:17:10 发布 · 792 阅读

3 ·

本内容遵循CC 4.0 BY-SA版权协议

博弈论专栏收录该内容

2 篇文章

订阅专栏

Python3.8

Python 是一种高级、解释型、通用的编程语言，以其简洁易读的语法而闻名，适用于广泛的应用，包括Web开发、数据分析、人工智能和自动化脚本

耶鲁博弈论第1节导论——五个入门结论

本系列笔记来自耶鲁博弈论，课程视频来自b站耶鲁大学：博弈论，笔记不定期更新。

一、开胃菜——成绩博弈

开场游戏：你和你的同桌在完全不知情的情况下，填写自己的成绩 $α$ 和 $β$ ，然后老师将所有同学随机分成两两一组，你的成绩将按照以下情况给出：
(1)若你填写 $α$ 你的对手填写 $β$ ，你将得到 $A$ 等级，你的对手将得到 $C$ 等级
(2)若你填写 $α$ 你的对手填写 $α$ ，你将得到 $B -$ 等级，你的对手将得到 $B -$ 等级
(3)若你填写 $β$ 你的对手填写 $β$ ，你将得到 $B +$ 等级，你的对手将得到 $B +$ 等级
(4)若你填写 $β$ 你的对手填写 $α$ ，你将得到 $C$ 等级，你的对手将得到 $A$ 等级

课堂上老师询问了几个选 $α$ 的同学的理由，第一个人觉得对方也会填 $α$ ，所以我要填 $α$ ；第二个人的理由是，填 $α$ 的结果总要优于填 $β$ .
而选择 $β$ 的同学觉得选择 $β$ 成绩波动较小，（会从B+波动到C）（实际上选择 $α$ 波动和 $β$ 一样，从A到B-）；另一个觉得一开始大家可以合作，都填 $β$ 获得最大利益。

目前我们涉及到博弈的行为、策略、参与人，但是忽略了一个博弈的必备要素：动机(objectives).

下面我们用效用矩阵表示收益（Possible Payoffs）：

可能情况	Pair
Me	α,α	α,β
Me	β,α	β,β

效用	Pair
Me	0, 0	3,-1
Me	-1,3	1, 1

前提是所有人只在乎自己的成绩，并且努力想取得更高的成绩。这里显然能够看出，不管对手选择什么，选择 $α$ 的效益始终大于 $β$ $（ 0 > - 1, 3 > 1 ）$

我们称这种始终不会取得劣势的选择称作严格优势策略

因此得到第一个结论：1.不要选择严格劣势策略，原因很简单，the payoffs are lower.
但似乎这样的结论有些过于简单而不值得讨论。

但是如若别人也是这样想，选择了 $β$ ，那么你们都将获得 1 的效用，而 1 是大于 0 的，因此选择 $β$ 是更好的选择，这似乎与第一个结论有些矛盾。

实际上这种说法有两个问题，其一，我的想法实际上是无法影响到你的想法，也就是我的选择无法左右你的选择，其二，建立在第一个假设上，若我的想法能够左右你的想法，那么为了争取最大的效用，我应该选择 $α$ 而不是 $β$

由此得到第二个结论：2.理性的选择（严格优势策略）往往使得结果变得糟糕
协商难以达成的原因不是缺少沟通，而是没有强制力

（囚徒困境，三个和尚没水吃，企业价格战）

换种情况，若效用矩阵变成下面这样：

效用	Pair
Me	0, 0	-1,-1
Me	-3, 3	1, 1

若我选择 $α$ ，而对手选择了 $β$ ，但是我感到愧疚，良心受到谴责，减去我的负罪感的负效用后只得到了 -1（把他称作负罪感）。相反我选择 $β$ ，而对手选择了 $α$ ，觉得不服气只得到了 C，因此下次要好好学习，表现出了雄心壮志，并且这个成绩是因为对手选了 $α$ 所致，在道义上的谴责又减去了一些效用，最终变成了 -3.

选 $α$ 的人觉得这样可以最小化损失，而选 $β$ 的人觉得这样有机会获得最大效用 1.

当对方选择 $α$ 时，我应该选择 $α$ 才能获得最大效用，相反，当对方选择 $β$ 时，我也应该选择 $β$ 才能得到最大效用。因此，这种情况下没有严格优势策略，而这也仅仅是改变了博弈的收益，并没有改变博弈的结构和结果，但是我们的目的被改变了。第一种情况我们显然应该选择 $α$ ，而第二种情况我们却不知道该选什么，这种博弈叫 协和谬误