邓小铁教授在首届中国数字经济发展和治理学术年会上的主旨演讲:数字经济的算法均衡挑战
2月18日,2023年春季首届中国数字经济发展和治理学术年会在清华大学顺利举办。会议由清华大学经济管理学院、公共管理学院和计算社会科学与国家治理实验室承办。北京大学前沿计算研究中心讲席教授、北京大学人工智能研究院多智能体中心主任、CCF计算经济学专业组主任邓小铁教授在大会发表题为《数字经济的算法均衡挑战》的主旨演讲。本文根据邓小铁教授现场发言内容整理。

邓小铁教授作主旨演讲
计算和经济两个领域非常相似,它们都是人类创造的产物。两个学科都有各自独特的美妙之处。当我们从计算角度思考经济学问题时,时常会发现在经济学中早就有相关研究,这让我们对经济学家的崇拜与敬仰之心油然而生。我非常尊重这个领域的老师们,此次与大家对话我感到非常荣幸。数字经济的兴起建立在计算机技术和网络通信的基础上,使计算与经济学之间的关系更加紧密。在数字经济中,计算与经济的完美结合得到了充分的展示,数字技术和计算方法被广泛应用于经济活动的各个领域。例如,互联网平台的兴起推动了电子商务的蓬勃发展,人工智能和大数据技术的应用也使得经济决策和预测更加准确和有效。在这个数字经济的计算环境中,荷普·西蒙的理论中有限理性和计算理性的理论得到了更加广泛的应用。计算机科学家和经济学家通过共同的研究,不断深化对计算和经济学之间关系的理解和认识,为荷普·西蒙的理论提供了更多的实践机会,同时也为这些理论的实际应用提供了更加广阔的空间和平台。
1、经济均衡的计算方法论
自从亚当·斯密【YS】在《国富论》中提出“看不见的手”引导定价的概念以来,这一理论已经经历了瓦尔拉斯(Léon Walras)等经济学家的进一步演化和发展,最终演变为引导市场走向价格不动点的均衡状态,至今仍然是现代经济学的基石。瓦尔拉斯构建了一种基于均衡价格和供需关系的一般均衡模型。他把经济体系看作是一种复杂的交换网络,研究价格如何影响市场供求关系和导致均衡价格和数量。他认为市场达到均衡状态时,价格和数量会自发地调整到一个让供需达到平衡的状态。这种理论为经济学提供了均衡分析和预测的基础,在现代宏观经济学和一般均衡理论中具有重要地位。波兰经济学家奥斯卡·R·兰格(Oskar R. Lange)对市场社会主义的研究【OL】,是从经济体制设计出发。他将自由市场竞争的优点与社会主义的优点相结合,来消除贫困和提供公共产品。兰格市场社会主义经济使用中央计划的体系来制定价格和分配资源,但是这种体系可以通过引入市场机制来提高效率,根据供需调整价格实现经济效率最大化。这一观点对苏联经济理论和政策产生了重要影响,也在经济学家之间引起了广泛的争论和讨论。对他的模拟市场社会主义的可行性和可取性仍存在许多分歧。
其中奥地利学派的代表人物弗里德里希·哈耶克(Friedrich Hayek)认为信息经济学中的计算难题和经济分散知识(信息广泛分布在个人、企业和组织之间)使得资源的高效配置无法实现。芝加哥学派代表人物米尔顿·弗里德曼(Milton Friedman)认为缺乏市场机制的计划经济会导致资源的浪费和失衡。公共选择学派的代表人物詹姆斯·麦基(James M. Buchanan)认为计划经济会导致政治和经济的权力过于集中,从而损害个人自由和创新。俄罗斯经济学家格里戈里·古斯托夫·耶夫谢耶夫(Grigory Yavlinsky)认为兰格的计划机构无法应对不断变化的经济环境,从而导致经济的低效和不稳定。
针对众多批评意见,兰格特别认为市场经济的定价系统可以通过高速计算机的参与实现,这样计划经济市场能够达到与自由市场经济相当的经济效率。这样,政府可以使用中央计划的体系来高效地制定价格和分配资源,从而通过高效地模拟市场机制来提高效率,以实现供需均衡价格。这一思路映射到在计算机科学成长起来的算法博弈论(Algorithmic Game Theory)和“经济与计算机科学”(EconCS)领域里。Deng,Papadimitriou 和 Safra基于ICT的复杂性角度率先探讨市场均衡计算求解问题的计算与通讯复杂性理论的严格刻画【DPS】,并将其视为计算经济学的关键挑战。而Kamal Jain进一步强调这一挑战的实践意义:如果高速计算机算不出均衡价格,谁还相信市场能够实现供需均衡?在这一交叉领域,研究者利用计算机科学的工具和方法来解决经济学中的问题,同时也使用经济学的理论和模型来解决计算机科学中的问题。这个领域主要研究的实际问题从在线广告、互联网拍卖、电子商务出发,逐步囊括了各种计算机科学对经济学的影响、经济学对计算机科学的影响等各种问题。
2.数字经济算法的均衡分析
在讲演开始之前,我在报告标题中两组词顺序之间反复犹豫着:用“均衡计算”还是“算法均衡”。改过来实际意义很是不同。纳什【NE】在1950年发表了一篇题为《非合作博弈》的论文提出了后来以其命名的博弈解概念。数字经济学中得到最广泛应用的数学形式就是纳什均衡理论,它可以用来描述市场中多个厂商之间的竞争关系,以及市场价格和数量的决策过程。纳什均衡理论已经成为现代微观经济学的基础之一,并广泛应用于工业组织、国际贸易、金融市场等领域的研究。与纳什均衡理论得到证明几乎是同时发现的是虚拟博弈算法,这是一种简洁的求解方法,旨在寻找纳什均衡。虚拟博弈算法最早由美国数学家布朗于1951年提出,随后被多位学者改进和推广。该算法的思想非常简单,即每个玩家都根据其他玩家的策略历史来假设其他玩家的策略,并根据自己的假设选择最优策略。这个过程被称为“虚假博弈”,因为玩家假设其他玩家是按照某种固定策略来选择行动的,而这个策略实际上并不一定被对手使用。在虚拟博弈中,每个玩家都会根据其他玩家的综合行动历史来做出自己的假设,并根据这些假设选择自己的行动。该算法通过不断迭代,逐渐逼近纳什均衡。尽管虚拟博弈算法已经存在了70年,但仍然存在许多问题,其中最重要的问题是它是否能收敛到均衡。虽然在某些情况下,该算法可以收敛到均衡,但在其他情况下,它可能会陷入震荡或无法收敛的状态。因此,人们一直在研究如何改进该算法,以提高它的性能和收敛速度。在数字经济领域,虚构博弈算法被广泛应用于各种问题的求解,例如电子商务中的竞价广告和动态定价问题,以及互联网金融中的信用评级和风险管理问题等等。由于这些问题通常涉及多个参与者和多个决策变量,因此使用博弈论算法来寻找最优解的效果往往比传统的优化算法更好。然而,这些算法的性能和收敛速度仍然是人们关注的重点。
在2002年至2003年期间,有一个讨论如何平衡带宽共享和设计实现数字资源共享的理想属性的讨论,特别是在数字经济环境下。当时互联网的滥用非常严重,每天都会有大量的电子邮件,但只有其中的一两封是有用的。因此,如何设计一个机制来实现数字资源共享的优良性质就成为了一个重要的问题。BitTorrent算法是一个非常成功的带宽共享设计团队,他们的设计思想是共享资源,即一个节点共享的越多,该节点能下载的资源也越多。该算法利用了系统所有的带宽,使得用户可以轻松地在网上收听音乐。该算法的特点是使用比例响应协议,保持公平性,并追求让每个节点最大化其所能接收到的共享资源量。该算法收敛到的均衡解可以用Arrow-Debreu模型来解释。此外,该系统还具有有效的市场均衡、共享机制的诚实性以及抵御巫术攻击的强大韧性等特征【CDLY】。
3.图灵之手:2NASH=PPAD
从亚当·斯密的《国富论》中,我们开始看到了所谓看不见的手在定价这一领域的作用。随着图灵计算之手的诞生,算法设计成为计算角度下探讨均衡的最重要问题之一。在图灵计算之手的范畴内,我们着重讨论计算效率。与此相应,我们在经济学中也面临计算资源的有限理性以及其他各方面的有限理性。
纳什均衡最初是由约翰·纳什在1950年代提出的,被认为是博弈论中的重要成果之一。它已被广泛应用于经济学、政治学、社会学、生物学等多个领域中,可以帮助解决实际问题。纳什均衡的概念为深入理解博弈论和社会交互行为提供了基础。这一概念还清晰地描绘了实现市场均衡的无形之手。计算经济学的理论方法论建立在Christos Papadimitriou于1994年引入的PPAD(有向图中的多项式奇偶性论证)是一个复杂性理论概念,用于描述特定类型计算问题的复杂性。这类问题的特点是有一个存在性定理,其证明依赖于指数多节点的有向环和有向路的图。计算目标是从该有向图中从给定的起始节点到达一个终止节点的简单路径。Chen和Deng[CD] 在2006年证明了2NE(两个玩家的纳什均衡)与PPAD等价。该结论表明,对于两人博弈,计算其纳什均衡是一个PPAD完全问题,这意味着这个问题在计算上是难以处理的。这项成果是算法博弈论中一个重要的突破,解决了该领域中一个长期以来未解决的问题。市场均衡计算也同样属于这一计算问题等价类PPAD。
从此,博弈均衡的计算成为一个非常重要的任务,这是一个计算问题。从计算的角度来看,博弈均衡的计算问题与静态等价,此外,尽管我们在一些特定领域了解概率分布,但后来可能会被推翻。即使在非完美马尔可夫动态情况下,我们也可以使用人工智能的方法来解决缺陷。我们可以通过学习的方式来解决我们对分布的了解和不了解的问题。因此,从荷普·西蒙的框架来看,这个问题在理论上已经得到了解决。当然,我们现在有一个非常紧迫的任务,就是如何将这些理论进展应用到实践中,这个经常被提到的问题,可以在以后进一步讨论。
这个计算问题与荷普·西蒙提出的有限理性理论密切相关。荷普·西蒙既是一位伟大的经济学家,也是一位杰出的计算机学家。当我读他的研究时,有时会开玩笑说他怎么没写多少论文就能同时得到诺贝尔奖和图灵奖呢?后来我才真正理解他的书籍是他最伟大的贡献之一。他完整地阐述了一套理论。在他的理论中,计算和经济的理解非常相似。从今天的眼光来看,这来源于两者都是人类的创造。这两个学科都有其非常优美的地方,PPAD=NE正好将二者的数理结构基础和博弈理性基础通过计算衔接到了一起。
即使在数字经济和数字博弈环境下,纳什均衡也获得广泛应用。特别在电子商务平台的价格竞争中,多个平台之间进行竞争时,如何设计定价机制与分配方案以吸引卖家与消费者,在数字货币市场中,如何帮助投资者找到最优的投资策略,获取最大的收益。都带来了新的计算挑战。包括互联网广告市场、网络拍卖、数字产品开发和投资组合等方面。在这些领域,参与者需要做出各自的策略,以获得最大的收益或效益。实现个体和整体利益的最大化。Wikipedia 列出的PPAD问题包括许多关键问题;包括了 Sperner's lemma, Brouwer fixed-point theorem, Kakutani fixed-point theorem, Nash equilibrium, Core of Balanced Games, Fisher market equilibria, Arrow-Debreu equilibria, Approximate Competitive Equilibrium from Equal Incomes以及 Finding clearing payments in financial networks
4.马尔可夫完美博弈均衡计算
马尔可夫完美博弈的均衡计算是数字经济中一个重要的问题,它可以帮助我们更好地理解复杂博弈情况下的参与者行为,并制定相应的策略。虽然计算复杂度可能很高,但使用适当的数值方法可以获得准确的解决方案。在数字经济中,马尔可夫博弈有许多应用。例如,它可以用于分析政府和企业之间的博弈,研究垄断市场中的竞争问题,模拟货币政策的效果,分析多个国家之间的贸易关系等。此外,马尔可夫博弈还可以用于分析比特币的自私挖矿和洞察性挖矿问题等区块链经济实践中的问题。
马尔可夫完美博弈的均衡计算是一个非常重要的问题,因为它可以用于分析数字经济中的复杂博弈情况。虽然在静态情况下,纳什均衡可以用于分析博弈的结果,但在动态环境中,马尔可夫博弈提供了更好的分析工具。在马尔可夫完美博弈中,每个参与者的行为是由随机的概率分布决定的。因此,在每个状态下,每个参与者都有一个最优策略,可以最大化其期望收益。这个最优策略被称为马尔可夫完美均衡。然而,计算马尔可夫完美均衡又一个复杂的问题,通常需要使用数值方法进行求解。在实践中,这可能会面临计算复杂度的挑战。
我们现在已知马尔可夫完美博弈的均衡计算相关的概念,它是一种计算上的等价类。PPAD类问题的一个重要性质是,它们可以被规约为计算上的不动点问题,这可以帮助我们更好地理解它们的复杂度。
4.1. 马尔可夫博弈计算
MARL(Multi-Agent Reinforcement Learning,多智能体强化学习)是一种解决多个决策制定者协同决策问题的强化学习方法。在许多实际应用中,涉及到多个决策制定者的问题往往具有动态环境和复杂交互,传统的单智能体强化学习方法难以解决。通过使用多个智能体进行协同决策,MARL可以提高整个系统的效率和性能,同时也可以促进智能体之间的合作和竞争,从而激发不同智能体之间的学习和进化。这种学习和进化方式可以帮助我们更好地理解智能体之间的相互作用和合作方式,并为解决更加复杂的问题提供新的思路和方法。、
Stochastic game(随机博弈)是博弈论的一个分支,用于描述多个决策制定者之间的交互。最初是由 Shapley【Sh】在1953年提出的,用于解决分配问题。之后,Stochastic game 的研究得到了广泛的关注和发展,被应用于控制论、经济学、计算机科学等领域。特别是在控制论领域,Stochastic game 成为描述动态资源分配和自适应控制问题的重要工具。近年来,随着强化学习(reinforcement learning)和深度学习(deep learning)等技术的发展,Stochastic game 又重新得到了关注。这些技术使得解决复杂的随机博弈问题变得更加可行,同时也为解决实际应用问题提供了新的思路和方法。总的来说, 发展历史可以追溯到上世纪50年代的Stochastic game在不同领域的应用和发展是一个不断演化的过程,迄今仍然具有重要的意义。
Stochastic game(随机博弈)和多智能体强化学习(Multi-Agent Reinforcement Learning,MARL)有着密切的关系。在 MARL 中,多个智能体通过交互来学习最优策略,而这个交互本质上就是一个 Stochastic game。在一个 MARL 问题中,每个智能体都需要考虑其他智能体的行动和环境的随机性,以制定最优策略。这些智能体相互作用,形成了一个多智能体系统,类似于 Stochastic game 中的多个玩家。因此,MARL 可以被看作是在 Stochastic game 环境下的智能体学习问题。Stochastic game 提供了 MARL 中智能体之间交互的理论基础和数学模型。通过 Stochastic game 的理论,我们可以描述多个智能体在交互中的行为,分析其收益和最优策略,并为实际问题提供有效的求解方法。因此,Stochastic game 是理解和解决 MARL 问题的基础,也为 MARL 在实际应用中的成功提供了理论支持。随着技术的不断进步和实际应用问题的不断涌现,Stochastic game 和 MARL 的研究和应用仍然具有广阔的发展前景。
马尔可夫完美均衡(MPE)是多智能体博弈中的均衡概念,要求每个智能体选择最优策略,以最大化其长期收益,考虑其他智能体当前的策略。与纳什均衡不同,MPE要求智能体考虑环境的动态演变,并基于环境状态和其他智能体的行为做出决策。在MPE中,智能体的策略是一组条件策略,其中每个策略定义了智能体在环境处于某种状态时应采取的动作。MPE的概念最初由Eric Maskin和Jean Tirole在1988年发表的一篇论文中提出,主要用于研究动态博弈。在多智能体强化学习中,MPE通常用作目标均衡,以指导多智能体系统的训练和策略优化。多智能体系统在许多现实世界的应用中非常普遍,例如机器人技术、金融和运输。多智能体博弈理论提供了一个框架,用于研究多个自主智能体在这些复杂系统中的相互作用和决策过程。在随机博弈中,智能体必须在不确定的环境中做出决策,因此它们的最优策略可能会因为系统的随机性而改变。在这些情况下,行为策略是一种有用的工具,可以提高智能体的性能和适应性。
与PPAD相关的概念,如纳什均衡,在多智能体强化学习中也扮演着重要角色。纳什均衡是指在多个智能体的策略下,没有一个智能体可以单方面改变其策略以提高其收益的情况。在多智能体强化学习中,寻找纳什均衡是一个关键问题。它的存在和稳定性决定了智能体之间交互所达到的最终状态。因此,PPAD的概念在多智能体强化学习中扮演着重要角色,帮助我们理解和描述智能体之间交互的复杂性,并为解决实际问题提供理论支持。
行为策略通常被表示为每个智能体在每个状态下的行动概率分布。这些策略使智能体能够应对环境的随机性和不确定性,并提供比确定性策略更加灵活的决策方法。在随机博弈中,行为策略通常与马尔可夫完美均衡(MPE)一起使用,它是多智能体系统的均衡概念,确保每个智能体在考虑其他智能体的行动后都在玩其最优策略。MPE是随机博弈中的关键概念,它要求智能体在每个状态下选择其最优策略,同时考虑其他智能体的行为。然而,计算MPE可能具有计算成本很高的问题,因为通常涉及动态规划和博弈树搜索算法。为了解决这个挑战,研究人员正在探索更有效的方法来计算MPE,这将使其适用于更大规模的多智能体系统。除了MPE外,还有各种解决随机博弈的算法,例如基于马尔可夫决策过程(MDP)的算法,许多多智能体强化学习算法已经被开发来解决多智能体决策制定的挑战。通过将行为策略与MPE结合使用,多智能体系统可以实现稳定的均衡状态,并且智能体可以适应环境的不确定性,从而提高其整体性能。我们最近的工作将这两者联系起来MPE=PPAD 【DL+】。从而把无穷阶段的问题简化到单阶段情形。
4.2. 马尔可夫博弈的应用
除了前文提到的应用马尔可夫博弈的例子,比如物种生存与繁衍的问题,我们还可以将其用于分析数字经济模型中的问题。在数字经济模型中,算法动力学分析可以和随机算法以及马尔可夫动态博弈精美地衔接在一起。这里的动力学均衡计算问题将决定一个算法经济体系的生死存亡挑战。近期出现了一个例子表明在数字经济中,均衡的缺失会发生难以预料的混乱。去年5月份,密码货币世界发生了一次巨大的事件:一个规模最大的算法稳定币的整个经济系统崩溃。以1:1绑定USD的稳定币UST采纳了加密货币LUNA来稳定这个比值。由于算法的均衡外部性分析不正确,导致LUNA作为曾市值前10的加密货币,几近归零的狂跌,引发大盘暴跌。这样的经济系统是由算法设计的,其中涉及的交易是由算法完成的。通过“智能合约”,试图达到系统智能体的认知一致性来保障系统的安全运行。这一个经济系统的崩溃,体现出数字经济系统设计中,经济学安全至关重要。
在这种多方计算的模型下,个体需要对事实达成共识,设计者要求采纳多数共识。主要任务是决定哪些交易记录在历史中。算法的基本原则是随机选择,根据算力和比例计算出一个数字,抽到该数字表示你被选中进行账务记录的权利。完成账务记录的人需要有激励,以确保他们做正确的事情。在这里,采用了许多方法。其中一个基本的实现目标是劳动价值论,即谁干活最多谁的账本权力越大。通常每当有人挖出一个新的区块,就会公布出来,获得奖励。竞争重新开始。如果有两个人同时挖出来,就会使用投票机制。这是一个随机的设计。但如果两个人被选中的权利相等,就需要根据他们的协议,采用多数票决的方案来决定哪个账本被记录下来。然而,在2013年和2014年出现了一种名为“自私挖矿”的新攻击。自私挖矿是指隐瞒新挖出的区块不向整个网络公开的行为。在通常情况下,验证其正确性需要验证整个区块链的历史记录。每当有人挖出一个新的区块,就会公布出来,竞争重新开始。如果两个人同时挖掘一个区块,将使用投票机制来决定将哪个区块添加到区块链中。从长远来看,这种攻击有什么好处呢?如果你已经发现了下一步的起点,而其他人仍在原始链上挖掘,那么你将获得优势。你可以等到其他人快要挖出来时,再公布你的信息,使得他们之前的工作全部被浪费,而你则获得了优势。即使你只是少数人,你也可以平均获得超过50%的收益。
这个问题可以被建模为一个马尔科夫奖励过程的框架,其中隐藏块的数量作为状态变量。下一步的主要任务是进行经济研究。自私挖矿已经成为了一个博弈理论攻击,这引发了一个问题:从经济学角度来看,这种攻击是否可以解决?这种攻击不是密码学安全问题,而是经济学安全问题。在矿池方法中,最终生态系统博弈能够达到什么样的平衡?这是一个非常直接的计算问题,也可以视为马尔科夫博弈的分析问题。这个缺陷引起了许多认真的研究,但没有一个能够与自私挖矿的数学贡献相媲美。在我们的认知思路中,存在一个策略性的方案,即放置一个卧底在自私挖矿的矿池中来获取自私矿池的信息。这种方案是可行的,因为比特币的设计自认为是公平、合理、开放谁都可以参加。通过观察其他矿池的挖掘进度,远见挖矿可以做出战略反应。我们这一研究采纳认知动力学这一重要的设计框架,通过对诚实矿工、自私矿工和远见矿工的认知分层,每个层次的参与者知道下一层的行为,但不知道上一层的认知,这对博弈论提供了一个新的解释。具体实现不再详细讨论。
通过这个设计,远见矿工可以在人数更少的情况下获得第一,因为他们的目标是一致的。最终得出的结论是:自私挖矿的问题可以在经济学角度上得到完整的解决方案。在这个设计中,重要的一点是,认知只需要到达这一层,而在博弈论中,认知层次必须无限递归才能形成共同知识,很多经济学定理都是基于这个共同知识而设计证明的。在数字经济这一个具体的例子,数字金融的模型通过新的解概念取得非常成功的结论。因此,在这种情况下,我们得出的结论是:只要矿池算力比例不超过1/3,每个人都采用诚实策略就是纳什均衡。因此,我们提供了比特币矿池攻击博弈动力学的一个完整解答【ZL+】。
5.结语
数字经济的出现为经济学理论带来了新的思路和方向,博弈论的理论和应用是其中之一。Markov均衡、多智能体博弈和PPAD=NE都是数字经济和博弈论之间的联系和影响。
在数字经济中,许多系统和过程可以被建模为马尔可夫决策过程,参与者面临一个概率过程,最大化其长期收益,同时考虑其他参与者的策略和长期收益。多智能体博弈理论则提供了一个框架,用于研究参与者之间的交互和决策,其中每个参与者都采取最佳策略,考虑其他参与者的策略。在数字经济中,卖家和买家可以使用策略来获得最大的利益。
然而,数字经济中的许多决策和交互是非常复杂和具有挑战性的。在计算复杂性类中,PPAD涉及计算纳什均衡的问题,而NE表示纳什均衡的概念。数字经济中许多系统都可以被建模为游戏,其中参与者可以采取不同的行动,这些行动会影响其他参与者的收益。然而,PPAD=NE意味着计算纳什均衡的问题是非常困难的,甚至可能是不可解决的。
总之,数字经济和博弈论之间的联系和影响是深远的。在数字经济时代,深入了解和掌握这些理论和应用,可以为企业和个人带来更好的决策和更高的效益。
Reference
【CD】 Xi Chen, Xiaotie Deng:
Settling the Complexity of Two-Player Nash Equilibrium. FOCS 2006: 261-272
【CB】Cohen, Bram (October 2002). "BitTorrent Protocol 1.0". BitTorrent.org. 8 February 2014.
【CDLY】Yukun Cheng, Xiaotie Deng, Yuhao Li, Xiang Yan:
Tight Incentive Analysis on Sybil Attacks to Market Equilibrium of Resource Exchange over General Networks. EC 2022: 792-793
【DL+】Xiaotie Deng, Ningyuan Li, David Mguni, Jun Wang, Yaodong Yang。On the complexity of computing Markov perfect equilibrium in general-sum stochastic games。National Science Review, Volume 10, Issue 1, January 2023, nwac256, https://doi.org/10.1093/nsr/nwac256
【CP】 Papadimitriou, C. H. (1994). On the complexity of the parity argument and other inefficient proofs of existence. Journal of Computer and System Sciences, 48(3), 498-532.
【DPS】Xiaotie Deng, Christos H. Papadimitriou, Shmuel Safra:
On the complexity of price equilibria. J. Comput. Syst. Sci. 67(2): 311-324 (2003)
【OL】奥斯卡·兰格《社会主义经济理论》(1936~1937)
【NE】 Nash, John (1950) "Equilibrium points in n-person games" Proceedings of the National Academy of Sciences 36(1):48-49.
【Sh】Shapley, L. S. (1953). "Stochastic games". PNAS. 39 (10): 1095–1100.
【YS】亚当·斯密,国民财富的性质和原因的研究。1776年
【ZL+】 Mengqian Zhang, Yuhao Li, Jichen Li, Chaozhe Kong, Xiaotie Deng:
Insightful Mining Equilibria. WINE 2022: 21-37