第12章: 机制设计与市场设计

第11章提问：给定偏好和禀赋，竞争性市场能否产生有效结果？答案——是的，在福利定理条件下——将市场机制视为既定。本章反转这个问题：给定期望结果，我们能否设计一个机制来实现它？

机制设计常被称为"逆向博弈论"。不是预测博弈的结果，而是设计博弈以产生期望结果。市场设计将这些思想应用于现实制度：拍卖、匹配市场、频谱分配、肾脏交换。

前置知识：第7章（博弈论基础、纳什均衡）和第10章（福利定理、一般均衡）。

12.1 社会选择与显示原理

社会选择函数

挑战在于：代理人的类型是私人信息。我们如何让他们如实披露其类型？

机制

机制设计者选择规则（消息空间和结果函数）以实现期望的社会选择函数。

显示原理

直接机制要求每个代理人简单地报告其类型（其私人信息）。如果如实报告是均衡策略——没有代理人能从撒谎中获益——则该机制是激励相容的（IC）。

这是机制设计中最强大的简化。原则上，可能的机制空间是无限大的。拍卖可以有任意数量的轮次、任意竞标规则、任意支付公式。匹配算法可以以任何可想象的方式运行。在所有可能的机制中搜索最优者似乎毫无希望。

显示原理指出：你不必搜索。无论任何机制能实现什么结果，一个直接机制（只需要求每个人如实报告）可以实现相同的结果。因此，机制设计问题简化为：找到最优的分配规则和支付规则作为报告类型的函数，受制于如实报告是最优的约束。这将一个无限广泛的搜索转化为一个明确定义的优化问题。

直觉模式

这说明了什么： If some elaborate game can reach an outcome, then a plain "just tell the truth" game can reach the same outcome — so there is never any need to study elaborate mechanisms. We only ever study truthful direct mechanisms, where each agent simply reports their private type. "Incentive compatible" then means exactly one thing: honesty is the agent's best move.

为什么这很重要： The two strengths differ in how robust that honesty is. Dominant-strategy (DSIC) honesty holds no matter what anyone else does — you never need to guess others' types. Bayesian (BIC) honesty holds only on average, assuming everyone else is also telling the truth; it is weaker but lets the designer implement more outcomes. The revelation principle is what turns an impossibly large search over all conceivable auctions, algorithms, and rules into one well-posed problem: find the allocation-and-payment rule that makes truth-telling optimal.

In Full Mode, Eq. 12.1 (DSIC) and Eq. 12.2 (BIC) state the two incentive-compatibility conditions formally.

12.2 吉巴德-萨特斯韦特定理

这是机制设计中对应阿罗不可能定理的结果。它表明，在一般社会选择设定下，没有非独裁机制能在占优策略中引出真实偏好。

突破口：限制定义域。在准线性偏好（$U_i = v_i(a) + t_i$，其中 $t_i$ 是货币转移）下，吉巴德-萨特斯韦特障碍被突破。VCG机制通过转移支付实现效率和DSIC。

12.3 VCG机制

维克里-克拉克-格罗夫斯（VCG）机制通过货币转移，以如实报告为占优策略实现有效分配。

有效分配最大化总价值：$a^*(\theta) = \arg\max_a \sum_i v_i(a, \theta_i)$。

代理人 $i$ 支付她对他人施加的外部性：有她和没有她时其他人福利的差额。

为什么如实报告是占优策略？在如实报告下，代理人 $i$ 的收益为：

$$v_i(a^*(\theta)) + t_i = v_i(a^*(\theta)) + \sum_{j \neq i} v_j(a^*(\theta_{-i})) - \sum_{j \neq i} v_j(a^*(\theta))$$

这简化为 $\sum_j v_j(a^*(\theta)) - \sum_{j \neq i} v_j(a^*(\theta_{-i}))$。第二项不依赖于 $i$ 的报告。因此 $i$ 通过选择报告来最大化 $\sum_j v_j(a^*(\theta))$ 以最大化其收益，而这恰好在她如实报告时发生，因为 $a^*$ 已经最大化了总价值。

直觉模式

这说明了什么： You pay the harm your presence imposes on everyone else — the difference between what the others could have achieved without you and what they achieve with you in the room. That bill depends only on the others' values, never on your own report, so you cannot shrink it by shading what you say.

为什么这很重要： Because your payment is locked by the others, your only remaining lever is to help the mechanism pick the outcome that maximizes total value — and that outcome is best for you precisely when you report your true value. Lying can only steer the allocation away from the efficient one, which can never make you better off. That is why truth-telling is a dominant strategy: it works regardless of what anyone else does. In the single-object case this rule is exactly the second-price (Vickrey) auction — the winner pays the runner-up's bid.

In Full Mode, the algebra shows the second term of the payoff is independent of agent $i$'s report.

例 12.1 — 公共物品的VCG

三位市民对一座桥的估值分别为 $v_1 = 30$、$v_2 = 25$、$v_3 = 15$。成本为 $C = 60$。

若 \$\sum v_i > C\$ 则建造：\\$10 > 60\$ → 是。

克拉克税支付：

$t_1 = C - (v_2 + v_3) = 60 - 40 = 20$（代理人1必须补足差额）
$t_2 = C - (v_1 + v_3) = 60 - 45 = 15$
$t_3 = C - (v_1 + v_2) = 60 - 55 = 5$

总收取：\\$10 + 15 + 5 = 40 < 60\$。存在20的预算赤字；VCG通常不能实现预算平衡。每个代理人支付其"枢纽"贡献。

12.4 最优拍卖与收入等价

拍卖形式

形式	规则	获胜者支付
英式（升序）	竞标者提高出价；最后竞标者获胜	第二高价值（近似）
荷兰式（降序）	价格下降直到有人认领	其出价
第一价格密封投标	最高出价获胜	其出价
第二价格密封投标（维克里）	最高出价获胜	第二高出价

维克里拍卖（第二价格密封投标）是DSIC的：每个竞标者的占优策略是按其真实价值 $v_i$ 出价。高于 $v_i$ 出价有以高于价值的价格中标的风险；低于 $v_i$ 出价有在第二高出价低于 $v_i$ 时错失的风险。

收入等价

含义：在这些条件下，拍卖形式之间的差异（公开与密封、升序与降序、第一价格与第二价格）对期望收入没有影响。

互动：拍卖模拟器

设置竞标者数量及其价值分布。运行单次拍卖查看个别结果，或运行100轮观察收入等价（各种形式的平均收入趋于一致）。调整风险厌恶滑块以打破等价。

竞标人数量：

最大价值 (Uniform[0, max])：

风险厌恶 (CRRA $\rho$)：0.00 （风险中性——收入等价成立）

风险中性 (0) 中等 (0.4) 高 (0.8)

点击按钮运行拍卖模拟器。

图 12.3.拍卖结果。在单次运行中，由于随机性，各种形式的收入不同。经过100次运行，平均收入趋于一致，展示了收入等价。增加风险厌恶（$\rho > 0$）可以打破等价：第一价格收入高于第二价格。

迈尔森最优拍卖

当卖方想要最大化收入（而非效率）时，迈尔森证明了最优机制使用虚拟价值：

$$\psi(\theta_i) = \theta_i - \frac{1 - F(\theta_i)}{f(\theta_i)}$$ (Eq. 12.4)

其中 $F$ 是竞标者价值分布的CDF，$f$ 是PDF。

$$\text{Allocate to highest virtual value if } \psi(\theta_i) > 0$$ (Eq. 12.5)

最优拍卖将物品分配给虚拟价值最高的竞标者，前提是其为正值。如果所有虚拟价值均为负，卖方保留物品。这意味着一个保留价：卖方设置等于 $\psi^{-1}(0)$ 的最低出价。

$$r^*: \quad \psi(r^*) = r^* - \frac{1 - F(r^*)}{f(r^*)} = 0$$ (Eq. 12.6)

直觉模式

这说明了什么： A revenue-maximizing seller does not treat a bid at face value. Each bid is mentally discounted by the "information rent" the seller must concede to keep bidders honest — the discounted figure is the bidder's virtual value. The seller awards the item to the highest virtual value, and only sells at all when even that discounted value clears zero.

为什么这很重要： That zero-crossing cutoff IS the optimal reserve price. Below it, holding the item beats selling, because the extra revenue squeezed from high-value bidders by keeping the reserve high outweighs the lost sales to low-value bidders. This is why even a seller who values the object at nothing should sometimes refuse to sell — the reserve is a strategic commitment, not a cost floor. The same logic reappears in optimal income taxation: the planner discounts each taxpayer by the incentive cost of taxing them, and only redistributes where the discounted gain stays positive.

In Full Mode, Eqs. 12.4–12.6 define the virtual value $\psi(\theta)$ and the reserve condition $\psi(r^*) = 0$.

例 12.2 — 最优保留价

价值在 $[0, 1]$ 上均匀分布：$F(\theta) = \theta$，$f(\theta) = 1$。

$\psi(\theta) = \theta - (1-\theta)/1 = 2\theta - 1$

$\psi(\theta) = 0 \implies \theta = 1/2$。最优保留价 = $1/2$。

带保留价 $1/2$ 的第二价格拍卖是最优的：只有当至少一个竞标者的估值超过 $1/2$ 时，物品才会售出。

互动：迈尔森最优拍卖

对于从Uniform$[0, V_{\max}]$中抽取的价值，虚拟价值为 $\psi(\theta) = 2\theta - V_{\max}$。拖动保留价滑块。收入曲线显示期望收入作为保留价的函数。最优保留价（最大化期望收入）被突出显示。

竞标人数量 ($n$)：2

保留价格 ($r$)：0.50

无保留价 (0) 最优 ($r^*$) 最大值 (1)

加载中……

图 12.4a。虚拟价值函数 $\psi(\theta) = 2\theta - 1$（对于 $U[0,1]$）。保留价设在 $\psi(r) = 0$ 处。估值 $\theta < r$ 的竞标者被排除（红色阴影区域）。

图 12.4b。期望收入作为保留价的函数。绿色圆点标记最大化期望收入的最优保留价。您选择的保留价显示为蓝色圆点。

例 12.4 — 激励相容检验

政府向两家公司之一分配许可证。公司 $i$ 的私人价值 $\theta_i \in \{L, H\} = \{10, 50\}$，各以等概率出现。

将许可证分配给报告更高价值的公司；平局时分配给公司1。获胜者支付30。

检验高价值公司（$\theta = 50$）的IC：

如实报告（$H$）：以3/4概率获胜（对手为$L$或平局时获胜）。收益 = $1/4 \times (50 - 30) = 15$。
报告$L$：仅当对手也报告$L$且你是企业1时获胜，否则失败。期望收益 $\leq 1/4 \times 20 = 5$。

如实报告更优。IC对类型 $H$ 成立。

检验低价值公司（$\theta = 10$）的IC：

如实报告（$L$）：很可能失败。期望收益 $\approx 0$。
报告$H$：以3/4概率获胜但支付30 > 10。收益 = $1/4 \times (10 - 30) = -15$。

如实报告更优。IC对类型 $L$ 成立。该机制是激励相容的。

例 12.5 — 收入等价验证

两个竞标者的价值独立地从 $U[0, 100]$ 中抽取。

第二价格拍卖：期望收入 = $E[\text{2nd highest value}] = 100/3 \approx 33.33$。

第一价格拍卖：2个竞标者的最优出价：$b(\theta) = \theta/2$。期望收入 = $E[\max(b_1, b_2)] = E[\max(\theta_1/2, \theta_2/2)] = E[\max(\theta_1, \theta_2)]/2 = (200/3)/2 = 100/3 \approx 33.33$。

两种形式都产生 \\$100/3\$ 的期望收入，验证了收入等价。第一价格拍卖产生较低的收入波动（每个获胜者恰好支付其价值的一半），而第二价格拍卖的波动较高（支付取决于第二高价值，可能变化很大）。

迈尔森-萨特斯韦特不可能性

卖方想要夸大其成本（以获取更高价格）。买方想要低报其价值（以少付款）。激励相容要求向双方留下"信息租金"。这些租金成本高昂，在预算平衡下，没有足够的剩余来支付双方的租金并确保所有有效交易发生。

私人信息下的现实谈判总是涉及某些低效率：工资谈判、二手车购买、并购交易。发布价格、声誉系统和标准化合同等制度缓解了这一问题，但无法完全消除。

12.5 匹配市场

某些物品不能通过价格分配：我们不会（或不该）出售学校入学名额、器官移植或住院医师职位。匹配市场使用算法替代。

Gale-Shapley延迟接受算法

直觉模式

这说明了什么： Watch the deferred-acceptance algorithm run: proposers always walk down their preference lists (each rejection sends them to a less-preferred choice), while responders always trade up (they only ever swap a tentative partner for a better one). Nobody is ever revisited after a rejection, so the process cannot loop forever — it must stop, and it does so quickly (in at most $n^2$ rounds).

为什么这很重要： When it stops, the matching is stable: there is no pair who both prefer each other to their assigned partners, so no one has an incentive to "elope." Stability is exactly what makes a match self-enforcing — it stays put without any prices or payments. That is why the same algorithm runs the medical-residency match, school choice, and kidney exchange: it manufactures a stable outcome in markets where money cannot do the allocating.

In Full Mode, Eq. 12.8 states the termination bound and the stable-matching guarantee.

定理（Gale & Shapley, 1962）。该算法在最多 $n^2$ 轮内终止，并产生稳定匹配：没有未匹配的配对双方都偏好对方而非其当前匹配。

现实世界的市场设计

学生	偏好	学校	偏好
A	W > X > Y > Z	W	B > A > D > C
B	X > W > Y > Z	X	A > B > C > D
C	W > Y > X > Z	Y	C > D > A > B
D	Y > W > X > Z	Z	D > C > B > A

阿尔文·罗斯（2012年诺贝尔奖，与劳埃德·沙普利共享）将此描述为"经济学家即工程师"的方法：运用经济理论不仅解释世界，还设计改善人们生活的现实制度。

市场不是自发产生的自然物体。它们是被设计的制度：决定谁获得什么、以什么价格、通过什么过程的规则、算法和执行机制。设计选择决定了结果。

主线案例：玛雅的企业

该市决定拍卖在市中心黄金地段经营柠檬水摊的专营权。三位潜在供应商：玛雅（$v_M = 50$/天）、内特（$v_N = 35$/天）、奥利维亚（$v_O = 20$/天）。价值从 $U[0, 60]$ 中抽取。

第二价格拍卖（维克里）：占优策略是如实竞标。玛雅出价50，内特出价35，奥利维亚出价20。玛雅获胜，支付35。

最优拍卖（迈尔森）：虚拟价值，其中 $F(\theta) = \theta/60$，$f(\theta) = 1/60$：

$\psi(\theta) = \theta - (60 - \theta) = 2\theta - 60$

保留价：$\psi(\theta) = 0 \implies \theta = 30$。

玛雅的虚拟价值：\\$1(50) - 60 = 40\$。内特的：\\$10\$。奥利维亚的：\$-20\$（被最优拍卖排除）。

在保留价为30的第二价格拍卖中：玛雅获胜，支付 $\max(35, 30) = 35$。

历史视角

Roth的"经济学家即工程师"。阿尔文·罗斯（2012年诺贝尔奖）将机制设计从纯理论转化为重新设计真实市场的实用学科。他的工作表明，市场是被设计的制度，而非自然现象。

全国住院医师匹配项目（NRMP）：Roth诊断了原始住院医师匹配失败的原因（不稳定性、策略操纵），并使用延迟接受算法重新设计。新系统每年匹配约40,000名住院医师。

肾脏交换：Roth、Sönmez和Ünver设计了交换协议，允许不兼容的供体-患者配对通过移植链交换供体，挽救了数千人的生命。这是纯粹的市场设计：在没有价格的情况下创建一个本不存在的市场。

择校：Roth及其同事用策略防护系统替代了波士顿可操纵的学校分配机制。在旧系统下，如实报告偏好的家长会受到惩罚；在新系统下，诚实总是最优的。

频谱拍卖：Milgrom和Wilson（2020年诺贝尔奖）为FCC设计了组合拍卖，在有效分配频谱许可证的同时筹集了数十亿美元。2017年的激励拍卖单独筹集了\\$198亿。

共同线索：经济理论提供蓝图，但实施需要理解具体的制度背景，即纯理论所抽象掉的那些"细节"。

See mechanism design positioned in the wider genealogy of economic ideas — and the lineage from von Neumann's game theory to the design of real markets — in the intellectual-genealogy graph (History of Economic Thought timeline).

The intellectual lineage behind this apparatus — Hurwicz's incentive-compatibility program, Maskin and Myerson on implementation and optimal auctions, Roth on matching, Milgrom and Wilson on auction design (the 2007 and 2020 Nobel Prizes) — is the subject of the History of Economic Thought, Ch. 11 (Information economics and the game-theory revolution) (chapter forthcoming). This chapter teaches the modern apparatus; that chapter tells where it came from.

Hurwicz framed mechanism design as a response to a problem the Austrians posed first: how can decentralized agents, each holding private information, be induced to act on knowledge no central planner possesses? For that older debate — Hayek's "knowledge problem" and the idea that competition is a discovery process rather than a designable end-state — see the Austrian tradition (History of Economic Thought, Ch. 6).

结论

机制设计反转博弈论：不是预测结果，而是设计博弈以实现期望结果。
显示原理表明，任何可实现的结果都可以通过代理人如实报告的直接机制来实现。这极大地简化了设计问题。
吉巴德-萨特斯韦特：没有转移支付时，只有独裁是一般意义上的DSIC。在准线性偏好下，VCG机制以占优策略真实报告实现效率。
收入等价：具有相同分配规则的标准拍卖产生相同的期望收入。迈尔森最优拍卖使用虚拟价值和保留价来最大化卖方收入。
迈尔森-萨特斯韦特不可能性：在私人信息下的双边贸易不能同时实现有效、激励相容、个体理性和预算平衡。
匹配市场（Gale-Shapley）产生不使用价格的稳定匹配。该算法对提议方是策略防护的，并在多项式时间内终止。
市场设计将这些思想应用于现实制度：住院医师匹配、择校、肾脏交换、频谱拍卖。

标签	方程	描述
式 12.1	$U_i(\theta_i, \theta_i) \geq U_i(\hat{\theta}_i, \theta_i)$ for all $\hat{\theta}_i, \theta_{-i}$	DSIC
式 12.2	$E[U_i(\theta_i, \theta_i)] \geq E[U_i(\hat{\theta}_i, \theta_i)]$	BIC
式 12.3	$t_i = \sum_{j \neq i} v_j(a^(\theta_{-i})) - \sum_{j \neq i} v_j(a^(\theta))$	VCG支付
式 12.4	$\psi(\theta) = \theta - (1-F(\theta))/f(\theta)$	迈尔森虚拟价值

练习题

基础练习

一个不可分割物品拍卖给两个竞标者，价值 $v_1 = 10$、$v_2 = 7$。计算以下各情形的获胜者和支付：(a) 第一价格密封投标（假设每个竞标者削价一半），(b) 第二价格密封投标，(c) 英式拍卖。
三个投票者对三个备选方案 {A, B, C} 进行排序。构造偏好档案，使得：(a) 多数规则产生循环（孔多塞悖论），(b) 独裁规则避免循环。
对以下设定运行Gale-Shapley（学生提议）：学生 {1,2,3}，学校 {X,Y,Z}。偏好：1: X>Y>Z, 2: Y>X>Z, 3: X>Y>Z。学校：X: 1>2>3, Y: 2>3>1, Z: 3>1>2。

应用练习

政府希望有效分配碳排放许可。比较：(a) VCG机制（企业报告减排成本），(b) 标准拍卖，(c) 限额交易市场。在什么条件下它们产生相同的分配？
解释为什么eBay使用第二价格拍卖（代理出价）而非第一价格拍卖。维克里结果与eBay的设计有何关联？
波士顿择校机制（改革前）惩罚那些列出热门学校但不具高优先级的家长。解释为什么这不是策略防护的，以及延迟接受如何解决这一问题。
迈尔森-萨特斯韦特定理表明，在私人信息下有效的双边贸易是不可能的。然而eBay、Craigslist和二手车市场每天促成数百万笔交易。这些制度如何缓解不可能性结果？

挑战题

推导 $n$ 个竞标者的第二价格拍卖的最优保留价，其价值独立同分布于 $U[0, 1]$。证明保留价为 $1/2$，与 $n$ 无关。期望收入作为 $n$ 的函数是什么？
证明Gale-Shapley算法产生稳定匹配。（提示：假设存在阻塞对。证明这与算法的拒绝逻辑矛盾。）
一个卖方有两件相同物品和三个竞标者，价值 $v_1 > v_2 > v_3$。为这个多单位拍卖设计VCG机制。每个获胜者支付多少？
考虑一个匹配市场，其中一方有严格偏好但另一方对某些匹配无差异（平局）。Gale-Shapley是否仍然产生稳定匹配？如果平局被随机打破，结果是否唯一？

第12章机制设计与市场设计

引言

12.1 社会选择与显示原理

社会选择函数

机制

显示原理

12.2 吉巴德-萨特斯韦特定理

12.3 VCG机制

互动：VCG支付计算器

12.4 最优拍卖与收入等价

拍卖形式

收入等价

互动：拍卖模拟器

迈尔森最优拍卖

互动：迈尔森最优拍卖

迈尔森-萨特斯韦特不可能性

12.5 匹配市场

Gale-Shapley延迟接受算法

互动：Gale-Shapley逐步演示

互动：提议方优势

学生提议（学生最优）

学校提议（学校最优）

现实世界的市场设计

主线案例：玛雅的企业

历史视角

结论

关键公式

练习题

基础练习

应用练习

挑战题

Sources

你已完成第四部分 —— 方法与高级微观

你现在可以评估：

你可以探索的大问题：