综述实验经济学的新发展田野实验 - 经济学原理

TUhjnbcbe - 2021/1/13 6:52:00

实验室实验对于现实世界的疏离，使得其实验结果在外部有效性方面备受质疑。兼具实证性和现实性的田野实验正是在这种背景下开始成为实验室实验的有效补充并随之兴起。近年来一些出色的田野实验实例研究的陆续出现便使得田野实验逐渐兴起并成为另一重要的实证研究方法。

中国经济学教育科研网今日推送的内容摘自浙江大学罗俊博士《实验经济学的新发展——田野实验》一文，介绍了经济学田野实验的研究历程和分类，并对于研究亲社会行为的田野实验的实例进行了详尽综述，文章最后还对中国情境下田野实验的开展给出了评述。以期为国内经济学界更好地认识田野实验研究，在中国情境下利用田野实验研究方法开展面向真实世界的经济学研究提供思路。

文/罗俊

从实验室到真实世界

作为一门传统的社会科学，经济学一直被认为是一门“非实验”的“经验性”学科，而远不是逻辑实证意义上的科学（艾克纳，，第10页），其研究方法也多为演绎推理。但伴随着经济学家对于模型检验的深入以及对于研究的可控制性和重复性等科学化的要求，经济学实验这一可追溯到年伯努利的“圣彼得堡悖论”实验的研究方法应声而起，在经历了长时间的寂寥后，于20世纪中叶前后才逐渐兴起，并在进入21世纪后走向繁盛，现已成为一个重要的经济学研究领域和经济学研究的一个重要的数据来源。

而需要注意的是，经济学家为了追求实验的可控制性和重复性，而往往将经济学实验限制在实验室中进行，这一类经济学实验因而也被称为实验室实验（LaboratoryExperiments）。而实验室实验的特点在于通过构造一个可操作的实验室内的微观经济环境，以控制其他必要的变量，从而实现对有关变量的定量测度。具体来说，实验室实验可以允许实验者在实验室内通过控制其他条件不变的情况下，改变价格信息、预算约束、信息结构或被试的行动集合来衡量这些因素对于人们行为的影响。当然这也就一定程度上克服了一般的计量分析中不能很好测度变量之间因果关系的问题。

但是，由于实验室实验获得数据的过程多在实验室中进行，缺乏丰富的社会情境（SocialContext）作为背景，因而其结果不能简单地外推至真实世界（Real-World）。实验室实验的这一特征也被实验经济学家称为以外部有效性（ExternalValidity）为代价的最大化内部有效性（InternalValidity）（List，）。实验室实验的外部有效性的欠缺一直以来就为人所诟病。以研究人的社会偏好（SocialPreference）的经济学实验为例，实验中人们的行为除了受到物质激励的影响外，还非常容易受到其他多种因素的影响，而这些因素在实验室和真实世界中又往往不尽相同，这些因素至少包括以下五个方面：（1）道德伦理和社会规范的约束；（2）被试行为被其他人审视的性质和程度（TheNatureandExtentofScrutiny）；（3）实施决策时嵌入的情境；（4）样本选择的代表性问题；（5）博弈的初始禀赋（TheStakesofGame）（LevittandList，）。

田野实验的研究历程、分类

上述关于影响实验室外部有效性的诸因素分析，便使得实验经济学家对于实验室实验结果外推至真实世界产生了一定的疑问，并开始共同推动起经济学另一实验领域方向的发展——田野实验（FieldExperiments）。

在对田野实验展开讨论之前，我们有必要弄清楚田野实验的正式定义，以更好地把握田野实验的特点。维基百科（Wikipedia，TheFreeEncyclopedia）给田野实验下的定义为：运用科学的实验方法去检查真实世界（或者按照一些经济学家的说法是，自然发生的环境（NaturallyOccurringEnvironments））而不是在实验室里发生的扰动。田野实验也如实验室实验一般，随机招募被试人群（或其它样本单位）进入控制组和其它任务组，并进一步比较这些组别的实验结果。

由此可见，田野实验与实验室实验相比，突出的特点便是其更贴近真实世界，正如Carpenter，Harrison，andList（）发出的感慨：“实验经济学家不再保守，他们开始在实地（Field）招募被试而不是实验室；他们开始用实际物品而不是诱导价值（InducedValuation）；他们开始在实验说明中设定真实的情境而不是抽象的术语。”而我们在上文曾经提到过实验室实验缺乏外部有效性，但却通常更易控制变量。那么，这是不是意味着更贴近真实世界的田野实验就会自然降低内部有效性，不能更好地控制变量呢？结论显然不是如此简单。以Harrion（）的说法，为了得到有用的信息，“控制”在各种实验中都是需要的。实验的有效性依赖于理论框架，并进而从实验中观察到的行为来推出结论。而在一些实验室实验、田野实验和自然实验中，控制本身也许也会引起一些效应以致推出错误的结论；此外，实验者容易忽视被试对于实验控制的可能的反应；还有一些情况下，控制本身也许会使实验者失去从数据中得出合理推断的判断能力。但是要注意的是，这些所谓的“控制”本身可能产生的问题都不是实验室实验或者田野实验、自然实验所特有的。HarrisonandList（）就列举了很多例子，以说明控制本身可能产生的诸多问题在各类实验中都是共同存在的。

以上所论述问题的意义在于告诉我们，并不是说田野实验更贴近现实世界，有着更好的外部有效性，那么相对于实验室实验，我们就可以在开展田野实验时降低对内部有效性方面的要求（Harrion，）。田野实验在外部有效性上的优势，以及对于内部有效性上的不放松，使得田野实验在实验室和自然产生的数据之间架起了一座桥梁，它意味着控制与现实主义的结合，实现了单独在实验室和不受控制的数据中都不能完成的任务（List，b）。

下面我们便简单介绍下经济学的田野实验从萌芽到发展再到兴起的研究历程。田野实验研究的第一个时期——萌芽期，这个时期的田野实验很少被认为是经济学田野实验类型中的一部分。因为，这个时期的田野实验没有一项的研究对象是人类被试，并且很少发表在经济学期刊上。但是Fisher和Neyman运用实验方法解决农业生产领域的工作确实为以后的实验设计和样本设计方面的研究提供了基本的思路。其中，Fisher在实验设计中引入了随机性的概念并且强调了实验的三要素：复制、阻滞（blocking）和随机性是实验分析的基础（Street，），而Neyman则意识到重复随机抽样的作用，并认为概率推断的必要条件是随机性。所以，把Fisher（，，，）和Neyman（，）在20世纪20年代和30年代的研究工作作为经济学田野实验的萌芽至少存在以下两方面的合理性：首先，这些实验研究帮助回答了重要的经济学问题，即关于农业生产率的问题（即便从“田野”的字面意义上来讲，关于农业生产率的实验也应该属于田野实验）。其次，这些研究被认为是第一次将随机性这一实验方法的关键要素概念化（LevittandList，）。

田野实验研究的第二个时期——发展期，这一时期是处于20世纪后半叶，彼时*府机构开展了一系列的大规模社会实验。在欧洲，早期的社会实验包括20世纪60年代末，英国电价的设计；在美国，社会实验能够追溯到MIT经济学的博士生HeatherRoss在布鲁金斯学会（BrookingsInstitution）的工作，第一批这样的实验开始于20世纪60年代末期，*府机构试图通过在*策上面的故意调整来评估目标项目。如此的大规模社会实验项目包括用工计划、电价设计、住房补助（HausmanandWise，）。早期的这一批社会实验主要聚焦在测试新的目标项目上，而80年代早期的大部分社会实验则集中考察了各类改革，即测度现有项目上新增的改变。这些实验对于当时*策的确定有着重要的影响，比如它们对于年家庭支持法案的贡献，并由此修正了救助无自理能力儿童（AFDC）这一计划（ManskiandGarfinkel,）。这也导致了当时关于观察的数据和实验的数据之间如何权衡取舍的争论（LevittandList，）。

田野实验研究的第三个时期正是田野实验在过去十年的兴起。在这些最近的田野实验中，就如第二期的社会实验一般（但不是像第一代农业研究的社会实验），都是通过随机招募被试来展开实验的，但与社会实验不同的是，这些田野实验都尽可能在自然发生的环境中随机招募普通的人群，以期使得作为研究对象的被试都没有意识到自己成为了实验的一部分。因此，这样的田野实验相比于社会实验，总是需要在一些好的机会下、更小的规模中得到开展。此外，这一时期的田野实验也总是比社会实验（其理论目标更多的是对于*策制定者而言）有更大的理论目标；这些田野实验这许多情况下是被设计去测试经济理论的，包括收集构建理论的有效信息、组织数据以测度理论假设下的关键参数。这样，田野实验便能帮助我们提供比实验室实验或自然发生的数据更有效的关于人们行为原理的推断。所以，一个成功开展田野实验的实验经济学家并不只是简单地完成数据收集工作，而是需要一个系统性的能力：从每天的自然环境中辨认出隐藏的实验机会的能力；很好地理解实验设计的能力、掌握经济理论知识、能够与涉及实验的群体、个人很好地沟通、交流（LevittandList，）。

田野实验在近十年的兴起，也使得田野实验的研究在不同的情境下呈现出不同的特征。HarrisonandList()便根据实验中的六个情境因素将田野实验划分为不同的类型。这六个情境因素分别为：

（1）被试集合的性质；

（2）被试代入实验任务的信息的性质；

（3）实验中交易物品的性质；

（4）实验任务或交易规则的的性质；

（5）激励报酬的性质；

（6）实验环境的性质。

那么，通过对这些情境因素性质不同程度的组合，便可对于田野实验的类别进行一个区分，我们知道，任何对于田野实验的划分都要冒着这一划分可能会遗漏其他重要的田野实验的风险。但此刻通过较宽泛的定义试着去区分，我们在浩繁的田野实验的实例中看到的那些诸多关键的不同点（主要通过以上列举的六个情境因素），还是有一定意义的。常规的实验室实验(ConventionalLabExperiment)是指招募大学生作为标准的被试集合，以及设定一些抽象的背景框架和一系列的实验规则（主要通过实验说明体现）的实验；人为的田野实验除了是招募非标准（大学生）的被试以外，其他均与常规的实验室实验类似。有背景的田野实验(FramedFieldExperiment)除了在交易物品、实验任务或被试能够代入实验的信息集方面有一个现实的情境以外，其他均与人造的田野实验类似。自然的田野实验(NaturalFieldExperiment)中被试所承担的实验任务是在一个自然发生的环境中展开，并且被试并不知道自己已是实验的一部分，其他均与有背景的田野实验一致。以下我们便根据这一田野实验的大致划分，分别对于经济学田野实验的研究实例进行综述。

田野实验的实例

从上文对于田野实验的研究历程的介绍中，我们已得知经济学的田野实验从近十年以来才逐渐走向成熟和兴起，而在我们可以找到的文献中，我们粗略地将田野实验的研究实例分为以下几个领域：人的社会偏好的研究、发展经济学、*策与制度方面、个体行为决策、产业组织与市场。考虑到篇幅限制以及为保证综述内容的质量，我们将集中对近十年研究人的亲社会行为的经济学田野实验按类型进行以下综述。

（一）人为的田野实验

根据上文的定义，人为的田野实验的突出特征在于其被试的使用不再局限于标准的大学生群体。典型地如SutterandKocher（）对于不同年龄段群体信任度和可信度的测度。实验者招募了6个不同年龄组别的总共名被试参与了信任博弈实验。这6个不同年龄组别分别是：（1）八岁的二年级小学生；（2）12岁的六年级小学生；（3）16岁的中学生；（4）平均年龄22岁，标准差为2.8的大学生；（5）平均年龄32岁，标准差为6.3的工人；（6）平均年龄68岁，标准差为8.6的退休人群。信任博弈在相同年龄组别的人群中进行，结果发现，从儿童时期到青少年时期人们对于他人的信任度几乎呈线性增长，而进入成年阶段后，其信任度在不同年龄组别却没有显著的不同。此外，人们的可信度则存在于所有年龄组别中，并随着年龄的增长而显著增加。在实验的数据处理方面，如果实验仅在成年人群中开展，则可以方便地得到年龄、性别、收入、教育等社会人口统计变量对于信任的影响，但由于实验是比较不同年龄组别的未成年人和成年人在信任度上的差别，所以收入这一变量很难在实验中作为控制变量③。由此，研究者没有将收入纳入到控制变量中④，而是尝试将信任博弈的初始禀赋作为控制变量来代替收入，并进一步证实了被给年龄组别人群的信任度和可信度均不会随着初始禀赋的变化而有显著的不同。

比较未成年人和成年人亲社会行为的不同表现的实验还有Sutter（）在儿童、少年、大学生中开展的最后通牒博弈实验。实验中验证并测度了随着年龄的改变，博弈的分配结果和分配动机（Intentions）是否和怎样影响着人的行为决策。实验设计了四个不同的迷你最后通牒博弈⑤，提议者可供选择的分配方案有两个，要么选择（8，2）（前一数字为自己所得，后一数字为对方所得）的缺省分配方案，要么在（2，8）、（5，5）、（8，2）和（10，0）这四个分配中选择一个备选分配方案，而如果响应者对于上述不同备选方案下的同一个缺省分配方案（8，2）的拒绝率的大小顺序依次是：（5，5）、（2，8）、（8，2）和（10，0）时，就代表了基于动机的互惠偏好确实影响了人们的行为决策。因为，（5，5）为备选方案下（8，2）的拒绝率，大于（2，8）为备选方案下（8，2）的拒绝率正是说明了人们对于不公平行为的一种回应。实验结果表明分配结果和分配意图均影响着儿童、少年、大学生三个群体的行为决策。但儿童和少年更多地注意到的是分配结果的公平，而大学生则更注重分配动机的公平，即随着年龄的增长，动机公平的重要性更多地会被人们所意识到①。相类似的实验还有HarbaughandKrause（）对于6-12岁儿童的利他行为和合作行为的研究。年龄与性别同属于被试的个体属性，除了以上讨论的年龄因素对于人们亲社会偏好的影响外，Andersenetal.（）还研究了性别的效应，即分别在父系社会下和母系社会下，女性在公共物品博弈中的表现与男性在公共物品博弈中的表现有何不同。

除了以上将研究的重点放在被试年龄和性别等个体属性上的田野实验以外，还有的实验