这个问题是因为我们经常从数据分析的角度思考问题,而不是从经济学的角度。计量经济学是研究、理解和解释人类经济行为以及行为如何相互影响的工具。所以首先考虑的不是你应该选择什么样的模型,而是你想回答什么样的经济问题。
一旦问题确定了,比如我想知道助学贷款是否会让贫困生更容易大学毕业。这就是一个经济学问题,因为背后的经济学原理可能会导致相反的结论:
要回答这样的问题,很难直接从理论上找出非黑即白的结论,所以需要实证研究来告诉我们现实生活中发生的故事是什么样的。
问题一旦确定,下一个问题就是数据。你有什么样的数据来回答这个问题?显然,如果你想知道助学贷款与大学毕业率的关系,你应该有大学生收到的助学贷款金额、是否大学毕业等数据。
有了数据,接下来的问题是如何识别x对y的因果关系。如果数据完美,可以像自然科学实验一样控制所有的影响y的变量,那么自然很容易找出x对y的因果关系。但是现实生活中哪里有这么好的事情,比如你只看助学贷款金额和毕业率的关系,很可能会得到负相关,但这不一定意味着助学金越高毕业的可能性越小,而是因为有我们看不到的同时影响x和y的因素(z)。比如,助学金很有可能通常是给家境较差的学生(z),而由于先天资源分配不均,这些学生所分配到的教育资源一直比那些家庭条件优越的学生少,这就使得这些学生很难毕业。如果省略了这样的变量,当然就无法从数据中直接识别出我们想要的关系。
计量经济学中关于因果识别的大多数讨论都是在ceterisparibus进行的(其他条件保持不变)。如何保证其他条件不变,对于社会科学和人文数据来说,其实是一个很大的挑战和课题。什么时候用匹配,什么时候用倾向评分,什么时候用DID,什么时候用工具变量,本质上是因为我们的数据面临着各种各样的选择问题。比如倾向评分的主要作用是,当我们可以控制所有影响选择的变量,但这些变量的维度很大时,我们采用倾向评分法。匹配法主要是解决当x和y之间的关系难以用线性模型表达时,我们会考虑的问题。工具变量是我们不能完美控制所有影响y又和x相关因素时使用的方法,但我们有一个很好的“漏斗”(工具变量),可以让我们过滤杂质。DID的意思是我们知道每个观测值中可能存在一些不可见因素在影响着x和y,但是我们没有一个好的工具变量来过滤。恰好在这样的数据中,我们可以看到数据沿着时间轴的变化,所以我们把时间轴看作是一个天然的“漏斗”,用来过滤原始数据中包含的杂质。
至于异方差,是另一个维度,主要解决了看不见的因素无关,估计过于乐观的问题。比如我们想知道教育对股票投资的回报率。但样本中有不同性格的人,性格本身可能对学历没有直接影响。但是有的人比较保守,所以收益率不会波动很大,有的人比较激进,所以投资收益率可能波动很大。如果不考虑这两类人隐含的股票投资收益率的“无形”波动,我们可能会对模型的估计结果得出过于乐观的结论(“过窄的置信区间”)。
综上所述,一切从问题开始,顺序应该是问题—大于数据—大于识别方法(计量手段)。脱离问题和数据直接考虑方法是危险和武断的。
服务咨询
经济数据下载,限时免费
知网通道查重,元/次
论文人工降重,元/千字
更多辅导服务,可咨询联系人
苏老师
#小站智囊#/双一流名校硕导/博导#近期资讯#
#高校通知#更多最新通知、在线讲座、学术答疑欢迎