第11章提问:给定偏好和禀赋,竞争性市场能否产生有效结果?答案——是的,在福利定理条件下——将市场机制视为既定。本章反转这个问题:给定期望结果,我们能否设计一个机制来实现它?
机制设计常被称为"逆向博弈论"。不是预测博弈的结果,而是设计博弈以产生期望结果。市场设计将这些思想应用于现实制度:拍卖、匹配市场、频谱分配、肾脏交换。
前置知识:第7章(博弈论基础、纳什均衡)和第10章(福利定理、一般均衡)。
挑战在于:代理人的类型是私人信息。我们如何让他们如实披露其类型?
图 12.1.机制设计时间线。
机制设计者选择规则(消息空间和结果函数)以实现期望的社会选择函数。
直接机制要求每个代理人简单地报告其类型(其私人信息)。如果如实报告是均衡策略——没有代理人能从撒谎中获益——则该机制是激励相容的(IC)。
这是机制设计中最强大的简化。原则上,可能的机制空间是无限大的。拍卖可以有任意数量的轮次、任意竞标规则、任意支付公式。匹配算法可以以任何可想象的方式运行。在所有可能的机制中搜索最优者似乎毫无希望。
显示原理指出:你不必搜索。无论任何机制能实现什么结果,一个直接机制(只需要求每个人如实报告)可以实现相同的结果。因此,机制设计问题简化为:找到最优的分配规则和支付规则作为报告类型的函数,受制于如实报告是最优的约束。这将一个无限广泛的搜索转化为一个明确定义的优化问题。
这说明了什么: If some elaborate game can reach an outcome, then a plain "just tell the truth" game can reach the same outcome — so there is never any need to study elaborate mechanisms. We only ever study truthful direct mechanisms, where each agent simply reports their private type. "Incentive compatible" then means exactly one thing: honesty is the agent's best move.
为什么这很重要: The two strengths differ in how robust that honesty is. Dominant-strategy (DSIC) honesty holds no matter what anyone else does — you never need to guess others' types. Bayesian (BIC) honesty holds only on average, assuming everyone else is also telling the truth; it is weaker but lets the designer implement more outcomes. The revelation principle is what turns an impossibly large search over all conceivable auctions, algorithms, and rules into one well-posed problem: find the allocation-and-payment rule that makes truth-telling optimal.
In Full Mode, Eq. 12.1 (DSIC) and Eq. 12.2 (BIC) state the two incentive-compatibility conditions formally.DSIC更强但更难实现。BIC更弱但允许更多机制。
Auction theory and mechanism design were partly a Cold-War product — RAND, von Neumann, and the strategic-rationality program shaped the field.
这是机制设计中对应阿罗不可能定理的结果。它表明,在一般社会选择设定下,没有非独裁机制能在占优策略中引出真实偏好。
突破口:限制定义域。在准线性偏好($U_i = v_i(a) + t_i$,其中 $t_i$ 是货币转移)下,吉巴德-萨特斯韦特障碍被突破。VCG机制通过转移支付实现效率和DSIC。
维克里-克拉克-格罗夫斯(VCG)机制通过货币转移,以如实报告为占优策略实现有效分配。
Is competition an end-state to be engineered, or a discovery process that resists design? Hurwicz's incentive-compatibility program sits right on that fault line.
有效分配最大化总价值:$a^*(\theta) = \arg\max_a \sum_i v_i(a, \theta_i)$。
代理人 $i$ 支付她对他人施加的外部性:有她和没有她时其他人福利的差额。
为什么如实报告是占优策略?在如实报告下,代理人 $i$ 的收益为:
$$v_i(a^*(\theta)) + t_i = v_i(a^*(\theta)) + \sum_{j \neq i} v_j(a^*(\theta_{-i})) - \sum_{j \neq i} v_j(a^*(\theta))$$
这简化为 $\sum_j v_j(a^*(\theta)) - \sum_{j \neq i} v_j(a^*(\theta_{-i}))$。第二项不依赖于 $i$ 的报告。因此 $i$ 通过选择报告来最大化 $\sum_j v_j(a^*(\theta))$ 以最大化其收益,而这恰好在她如实报告时发生,因为 $a^*$ 已经最大化了总价值。
这说明了什么: You pay the harm your presence imposes on everyone else — the difference between what the others could have achieved without you and what they achieve with you in the room. That bill depends only on the others' values, never on your own report, so you cannot shrink it by shading what you say.
为什么这很重要: Because your payment is locked by the others, your only remaining lever is to help the mechanism pick the outcome that maximizes total value — and that outcome is best for you precisely when you report your true value. Lying can only steer the allocation away from the efficient one, which can never make you better off. That is why truth-telling is a dominant strategy: it works regardless of what anyone else does. In the single-object case this rule is exactly the second-price (Vickrey) auction — the winner pays the runner-up's bid.
In Full Mode, the algebra shows the second term of the payoff is independent of agent $i$'s report.输入代理人对单一不可分割物品的估值。计算器计算VCG支付(对单物品等同于第二价格拍卖)。
图 12.2.代理人估值与VCG支付。每个代理人支付其对他人施加的外部性。获胜者支付第二高价值(在单物品拍卖中,VCG简化为维克里拍卖)。
三位市民对一座桥的估值分别为 $v_1 = 30$、$v_2 = 25$、$v_3 = 15$。成本为 $C = 60$。
若 \$\sum v_i > C\$ 则建造:\\$10 > 60\$ → 是。
克拉克税支付:
总收取:\\$10 + 15 + 5 = 40 < 60\$。存在20的预算赤字;VCG通常不能实现预算平衡。每个代理人支付其"枢纽"贡献。
| 形式 | 规则 | 获胜者支付 |
|---|---|---|
| 英式(升序) | 竞标者提高出价;最后竞标者获胜 | 第二高价值(近似) |
| 荷兰式(降序) | 价格下降直到有人认领 | 其出价 |
| 第一价格密封投标 | 最高出价获胜 | 其出价 |
| 第二价格密封投标(维克里) | 最高出价获胜 | 第二高出价 |
维克里拍卖(第二价格密封投标)是DSIC的:每个竞标者的占优策略是按其真实价值 $v_i$ 出价。高于 $v_i$ 出价有以高于价值的价格中标的风险;低于 $v_i$ 出价有在第二高出价低于 $v_i$ 时错失的风险。
含义:在这些条件下,拍卖形式之间的差异(公开与密封、升序与降序、第一价格与第二价格)对期望收入没有影响。
收入等价在以下常见情形中失效:
设置竞标者数量及其价值分布。运行单次拍卖查看个别结果,或运行100轮观察收入等价(各种形式的平均收入趋于一致)。调整风险厌恶滑块以打破等价。
图 12.3.拍卖结果。在单次运行中,由于随机性,各种形式的收入不同。经过100次运行,平均收入趋于一致,展示了收入等价。增加风险厌恶($\rho > 0$)可以打破等价:第一价格收入高于第二价格。
当卖方想要最大化收入(而非效率)时,迈尔森证明了最优机制使用虚拟价值:
其中 $F$ 是竞标者价值分布的CDF,$f$ 是PDF。
最优拍卖将物品分配给虚拟价值最高的竞标者,前提是其为正值。如果所有虚拟价值均为负,卖方保留物品。这意味着一个保留价:卖方设置等于 $\psi^{-1}(0)$ 的最低出价。
这说明了什么: A revenue-maximizing seller does not treat a bid at face value. Each bid is mentally discounted by the "information rent" the seller must concede to keep bidders honest — the discounted figure is the bidder's virtual value. The seller awards the item to the highest virtual value, and only sells at all when even that discounted value clears zero.
为什么这很重要: That zero-crossing cutoff IS the optimal reserve price. Below it, holding the item beats selling, because the extra revenue squeezed from high-value bidders by keeping the reserve high outweighs the lost sales to low-value bidders. This is why even a seller who values the object at nothing should sometimes refuse to sell — the reserve is a strategic commitment, not a cost floor. The same logic reappears in optimal income taxation: the planner discounts each taxpayer by the incentive cost of taxing them, and only redistributes where the discounted gain stays positive.
In Full Mode, Eqs. 12.4–12.6 define the virtual value $\psi(\theta)$ and the reserve condition $\psi(r^*) = 0$.价值在 $[0, 1]$ 上均匀分布:$F(\theta) = \theta$,$f(\theta) = 1$。
$\psi(\theta) = \theta - (1-\theta)/1 = 2\theta - 1$
$\psi(\theta) = 0 \implies \theta = 1/2$。最优保留价 = $1/2$。
带保留价 $1/2$ 的第二价格拍卖是最优的:只有当至少一个竞标者的估值超过 $1/2$ 时,物品才会售出。
对于从Uniform$[0, V_{\max}]$中抽取的价值,虚拟价值为 $\psi(\theta) = 2\theta - V_{\max}$。拖动保留价滑块。收入曲线显示期望收入作为保留价的函数。最优保留价(最大化期望收入)被突出显示。
图 12.4a。虚拟价值函数 $\psi(\theta) = 2\theta - 1$(对于 $U[0,1]$)。保留价设在 $\psi(r) = 0$ 处。估值 $\theta < r$ 的竞标者被排除(红色阴影区域)。
图 12.4b。期望收入作为保留价的函数。绿色圆点标记最大化期望收入的最优保留价。您选择的保留价显示为蓝色圆点。
政府向两家公司之一分配许可证。公司 $i$ 的私人价值 $\theta_i \in \{L, H\} = \{10, 50\}$,各以等概率出现。
将许可证分配给报告更高价值的公司;平局时分配给公司1。获胜者支付30。
检验高价值公司($\theta = 50$)的IC:
如实报告更优。IC对类型 $H$ 成立。
检验低价值公司($\theta = 10$)的IC:
如实报告更优。IC对类型 $L$ 成立。该机制是激励相容的。
两个竞标者的价值独立地从 $U[0, 100]$ 中抽取。
第二价格拍卖:期望收入 = $E[\text{2nd highest value}] = 100/3 \approx 33.33$。
第一价格拍卖:2个竞标者的最优出价:$b(\theta) = \theta/2$。期望收入 = $E[\max(b_1, b_2)] = E[\max(\theta_1/2, \theta_2/2)] = E[\max(\theta_1, \theta_2)]/2 = (200/3)/2 = 100/3 \approx 33.33$。
两种形式都产生 \\$100/3\$ 的期望收入,验证了收入等价。第一价格拍卖产生较低的收入波动(每个获胜者恰好支付其价值的一半),而第二价格拍卖的波动较高(支付取决于第二高价值,可能变化很大)。
卖方想要夸大其成本(以获取更高价格)。买方想要低报其价值(以少付款)。激励相容要求向双方留下"信息租金"。这些租金成本高昂,在预算平衡下,没有足够的剩余来支付双方的租金并确保所有有效交易发生。
私人信息下的现实谈判总是涉及某些低效率:工资谈判、二手车购买、并购交易。发布价格、声誉系统和标准化合同等制度缓解了这一问题,但无法完全消除。
某些物品不能通过价格分配:我们不会(或不该)出售学校入学名额、器官移植或住院医师职位。匹配市场使用算法替代。
这说明了什么: Watch the deferred-acceptance algorithm run: proposers always walk down their preference lists (each rejection sends them to a less-preferred choice), while responders always trade up (they only ever swap a tentative partner for a better one). Nobody is ever revisited after a rejection, so the process cannot loop forever — it must stop, and it does so quickly (in at most $n^2$ rounds).
为什么这很重要: When it stops, the matching is stable: there is no pair who both prefer each other to their assigned partners, so no one has an incentive to "elope." Stability is exactly what makes a match self-enforcing — it stays put without any prices or payments. That is why the same algorithm runs the medical-residency match, school choice, and kidney exchange: it manufactures a stable outcome in markets where money cannot do the allocating.
In Full Mode, Eq. 12.8 states the termination bound and the stable-matching guarantee.定理(Gale & Shapley, 1962)。该算法在最多 $n^2$ 轮内终止,并产生稳定匹配:没有未匹配的配对双方都偏好对方而非其当前匹配。
延迟接受算法有四个值得注意的性质:
输入学生和学校的偏好列表。算法动画展示每一轮:提议、暂时接受和拒绝。以逗号分隔的名称输入偏好(例如"W,X,Y,Z")。
四名学生(A、B、C、D)和四所学校(W、X、Y、Z)。学生提议。
| 学生 | 偏好 | 学校 | 偏好 |
|---|---|---|---|
| A | W > X > Y > Z | W | B > A > D > C |
| B | X > W > Y > Z | X | A > B > C > D |
| C | W > Y > X > Z | Y | C > D > A > B |
| D | Y > W > X > Z | Z | D > C > B > A |
最终匹配为 A-W、B-X、C-Y、D-Z,这是稳定的:没有配对想要偏离。使用上面的互动工具逐步验证。
分别运行学生提议和学校提议的Gale-Shapley。比较两个稳定匹配。提议方总是获得其最优稳定匹配;回应方获得其最差稳定匹配。
阿尔文·罗斯(2012年诺贝尔奖,与劳埃德·沙普利共享)将此描述为"经济学家即工程师"的方法:运用经济理论不仅解释世界,还设计改善人们生活的现实制度。
市场不是自发产生的自然物体。它们是被设计的制度:决定谁获得什么、以什么价格、通过什么过程的规则、算法和执行机制。设计选择决定了结果。
该市决定拍卖在市中心黄金地段经营柠檬水摊的专营权。三位潜在供应商:玛雅($v_M = 50$/天)、内特($v_N = 35$/天)、奥利维亚($v_O = 20$/天)。价值从 $U[0, 60]$ 中抽取。
第二价格拍卖(维克里):占优策略是如实竞标。玛雅出价50,内特出价35,奥利维亚出价20。玛雅获胜,支付35。
最优拍卖(迈尔森):虚拟价值,其中 $F(\theta) = \theta/60$,$f(\theta) = 1/60$:
$\psi(\theta) = \theta - (60 - \theta) = 2\theta - 60$
保留价:$\psi(\theta) = 0 \implies \theta = 30$。
玛雅的虚拟价值:\\$1(50) - 60 = 40\$。内特的:\\$10\$。奥利维亚的:\$-20\$(被最优拍卖排除)。
在保留价为30的第二价格拍卖中:玛雅获胜,支付 $\max(35, 30) = 35$。
Roth的"经济学家即工程师"。阿尔文·罗斯(2012年诺贝尔奖)将机制设计从纯理论转化为重新设计真实市场的实用学科。他的工作表明,市场是被设计的制度,而非自然现象。
全国住院医师匹配项目(NRMP):Roth诊断了原始住院医师匹配失败的原因(不稳定性、策略操纵),并使用延迟接受算法重新设计。新系统每年匹配约40,000名住院医师。
肾脏交换:Roth、Sönmez和Ünver设计了交换协议,允许不兼容的供体-患者配对通过移植链交换供体,挽救了数千人的生命。这是纯粹的市场设计:在没有价格的情况下创建一个本不存在的市场。
择校:Roth及其同事用策略防护系统替代了波士顿可操纵的学校分配机制。在旧系统下,如实报告偏好的家长会受到惩罚;在新系统下,诚实总是最优的。
频谱拍卖:Milgrom和Wilson(2020年诺贝尔奖)为FCC设计了组合拍卖,在有效分配频谱许可证的同时筹集了数十亿美元。2017年的激励拍卖单独筹集了\\$198亿。
共同线索:经济理论提供蓝图,但实施需要理解具体的制度背景,即纯理论所抽象掉的那些"细节"。
See mechanism design positioned in the wider genealogy of economic ideas — and the lineage from von Neumann's game theory to the design of real markets — in the intellectual-genealogy graph (History of Economic Thought timeline).
The intellectual lineage behind this apparatus — Hurwicz's incentive-compatibility program, Maskin and Myerson on implementation and optimal auctions, Roth on matching, Milgrom and Wilson on auction design (the 2007 and 2020 Nobel Prizes) — is the subject of the History of Economic Thought, Ch. 11 (Information economics and the game-theory revolution) (chapter forthcoming). This chapter teaches the modern apparatus; that chapter tells where it came from.
Hurwicz framed mechanism design as a response to a problem the Austrians posed first: how can decentralized agents, each holding private information, be induced to act on knowledge no central planner possesses? For that older debate — Hayek's "knowledge problem" and the idea that competition is a discovery process rather than a designable end-state — see the Austrian tradition (History of Economic Thought, Ch. 6).
| 标签 | 方程 | 描述 |
|---|---|---|
| 式 12.1 | $U_i(\theta_i, \theta_i) \geq U_i(\hat{\theta}_i, \theta_i)$ for all $\hat{\theta}_i, \theta_{-i}$ | DSIC |
| 式 12.2 | $E[U_i(\theta_i, \theta_i)] \geq E[U_i(\hat{\theta}_i, \theta_i)]$ | BIC |
| 式 12.3 | $t_i = \sum_{j \neq i} v_j(a^*(\theta_{-i})) - \sum_{j \neq i} v_j(a^*(\theta))$ | VCG支付 |
| 式 12.4 | $\psi(\theta) = \theta - (1-F(\theta))/f(\theta)$ | 迈尔森虚拟价值 |
重要文献:Myerson (1981); Vickrey (1961); Clarke (1971); Groves (1973); Gale & Shapley (1962); Roth (2002); Milgrom (2004)。
第五部分即将到来:研究生宏观。模型变得严肃,政策辩论也是如此。