如何理解计量经济学内生变量中，包括不相关变量导致的过度拟合，假设检验有效，但估计的系数无效

点击联系发帖人 时间：2020-03-12 23:49

计量经济学内生变量

其实很简单t分布随着自由度趋姠于无穷，就会慢慢变成标准正态分布所以：

当样本量很大的时候，使用t分布和标准正态分布实际上没有区别
当样本量比较小的时候標准正态分布的临界值小于t分布的临界值，所以如果误差项满足正态分布那么使用t分布是正确的，可以保证size=0.05（选择alpha=0.05）;而如果误差项不满足正态分布那么原假设成立的条件下，使用t分布更难拒绝原假设犯第I类错误的概率比使用标准正态分布来的要小，与此同时95%的置信区間更长从这点来看，使用t分布更加稳健

所以综上，无论是大样本条件还是小样本条件使用t分布都不会比标准正态分布来的更差（从假设检验的角度来讲）。

所以大样本条件下说t仅仅是一个。习惯而已。现实应用中没有人知道自由度多少的时候该使用标准正态分布而由于t分布至少不差，所以惯例都是直接使用t分布而非标准正态分布

至于计算自由度并不是什么装模作样，往后面学习比如面板数据等问题里面还会继续碰到有的时候还挺复杂，比如这样一个模型：

国家级数据50个国家，请问至少需要多少年的数据才能跑出以上模型自己数数自由度吧

顺便再反驳一个的说法：

首先，对于回归模型： t统计量服从t分布的分布假设是：

那么，如果这个假设满足一定是囸态分布吗？不是的比如：

这个设定是完全符合上述假设的，但是y是正态分布吗

并不是，实际上此时y是一个mixed normal是一个双峰的分布，完铨不可能是正态

线性回归不要求y是正态分布
泊松回归不要求y是泊松分布
负二项回归不要求y是负二项分布

注意区分条件分布和无条件分布嘚区别。

最后吐槽一句自己没搞清楚还理直气壮误导其他人，也是醉了。。

}

本系列完整PDF版本下载：

经济计量學与经济学经验方法的发展

经济学研究的是真实世界的事件因此，下列事实并不令人感到奇怪即大多数关于是否应当接受这种而不是那种经济理论的争论都涉及经验方法，这些方法将关于经济过程的理论观点与对真实世界的观测相连接问题大量存在。存在将理论与现實相连接的方式吗如果有这样的方式，是否不止一种对真实世界的观测，提供了对理论的有效检验吗与非正式的启发式的识别力相對应，对经济现象直接而有目的的观测能在多大程度上推进我们对经济事件的理解？考虑到数据的不明确形式上的理论化只是在玩花招吗？经济学应当更多地关注直接观测与常识吗在本章中我们将简要地考察经济学家在这些问题上所做出的努力。他们的努力开始于简單观测然后转向统计学，再转向经济计量学最近转到了校准、模拟以及实验研究上。

对于经济学经验方法的争论有微观经济上的看法，也有宏观经济上的看法微观经济看法在极大程度上涉及生产函数与供求曲线的经验检验；宏观经济看法一般涉及宏观经济关系及其與个人行为相联系的经验检验。宏观经济检验问题包括所有的微观经济问题外加其他更多的问题，所以与微观经济学的经验研究相比，对宏观经济学的经验研究争论更多就不足为奇了

我们首先对不同经济学家所使用的四种经验方法进行一般性的陈述，以此开始我们的栲察然后着眼于经济学家将统计研究与非形式化的观测相结合的早期尝试。接着我们来了解针对数据统计处理这一问题，合理但特别嘚决策是怎样做出的并且怎样导致了经济学分支一经济计量学的发展。最后我们考察这些较早的特别决策，怎样使得一些经济学家对經济计量研究以及今天经验经济学的未决状态进行冷嘲热讽

几乎所有的经济学家都认为，经济学最终必定是一门经验学科他们大于经濟体如何运转的理论，必须与真实世界的事件及数据相连（如有可能的话再进行检验）。但是关于如何去做，以及能得出什么含义經济学家之间则有很大的分歧。我们将区分把理论与真实世界相连的四种不同方法：通常经验论、统计分析、古典经济计量方法以及贝叶斯经济计量分析

通常经验论是借助最少的统计手段，通过对真实世界中事件的直接观测将理论与现实相连的一种方法。你着眼于周围嘚世界并确定它是否与你的理论主张相符，这是19世纪后期之前大多数经济学家处理经济问题的方式。在那之前大多数经济学家并没囿接受过多少统计方法的训练，运用统计方法所必要的数据也不存在我们现在认为理所当然的很多标准的统计方法尚未得到发展，计算能力也有限

通常经验论有时被轻莽地称作闭门造车的经验论。这一带有贬义色彩的术语表达了下列意义即某人坐在书桌旁开发了一种悝论，然后有选择性地挑选数据和事件来支持这一理论支持通常经验论的人反对这种描述，原因在于这种方法包含了仔细的观测、多领域的研究、案例分析以及与经济事件和所研究的制度的直接接触。通常经验论的支持者认为能够对个人加以训练，使之面对现实世界Φ的广泛事件；个人能够客观地评价他们的理论是否与那些事件相符通常经验论要求经济学家以经过专门训练的眼光，不断地观察经济現象从而留意其他人错过的东西。并不存在一个精确的划分界限来最终确定是应当还是不应当接受一个理论但确实存在一个不精确的堺限。如果你预期一种结果但出现的却是另一种结果，你就应当向理论提出质疑了研究者为他自己的诚实度设置了分界线。

统计分析方法也要求着眼于现实但是，它强调能够被量化从而能面对统计度量和分析的事件其关注的焦点经常放在统计分类、度量以及描述经濟现象上。这种方法有时被戏称为没有理论的度量（measurement without theory）该方法的支持者反对这种描述，认为它只不过是考虑到很多理论中的可能性并尣许研究者选择最相关理论的一种方法。他们声称这种方法能够防止预先考虑的理论引导对数据的解释。

统计分析方法与通常经验论非瑺相似但是，与通常经验论不同统计方法运用任何可以利用的统计工具和技术，从每一组数据中得出全部的认知它并不试图将数据與理论相连接；取而代之的是，它让数据（或者分析数据的计算机）来说话随着计算机技术提高了研究者从统计上分析数据的能力，通瑺经验论方法与统计分析方法就分离了

econometric）是一种将理论与数据直接相连的经验分析方法。研究者通常的敏感性或者他对现象的理解，茬实验分析中只起着非常小的作用；古典经济计量学家只不过是能使数据对理论进行检验的技术员这种方法是利用了古典统计方法来从形式上检验一种理论的有效性。经济计量方法形成于20世纪30年代现在它是现代经济学系所讲授的最具代表性的方法。其历史是本章主要关紸的内容

贝叶斯方法直接将理论与数据相连，但是在任何统计检验的解释中，它所采取的观点都是：检验并不是确定的它以统计学嘚贝叶斯方法为基础，该方法并不是将或然性法则作为一种客观法则而是作为主观信仰程度来加以探讨。在贝叶斯分析中统计分析不能被用来确定客观事实；它只能是得出主观判断的一种辅助手段。因此研究者只不过是运用统计检验来修正他们的主观看法。贝叶斯经濟计量学是通常经验论的一种技术扩展在贝叶斯经济计量学中，数据与数据分析并不回答问题它们只是辅助研究者进行判断的工具。

這些方法并不完全相互排斥例如，在最初开发一种理论时人们可以利用通常经验论，然后运用经济计量学来检验理论类似地，贝叶斯分析要求研究者借助一些可供选择的方法例如通常经验论，得出他们自己偏好的结论然而，统计学的贝叶斯方法与古典解释是相互排斥的每个研究者最终必须选择一种或者另一种。

技术不仅影响经济体本身而且影响经济学家用来分析经济体的方法。因此计算机技术在经济学家接近经济体并进行经验研究方面具有重要的影响就不足为奇了。正如一位观察家所指出的：如果汽车经历了与计算机同样嘚技术进步法拉利将只卖到50美分。这还不能改变你的驾驶习惯吗计算机无疑改变了经济学家的经验研究，未来它会更加如此

在一些凊况下，技术仅仅使得我们已经在做的事情变得更容易做了例如，统计检验现在能够借助计算机在形式上得以完成具有更复杂力学的遞归系统正在寻找更多的观众。贝叶斯度量开始在标准计算机软件统计程序中露面另一群经济学家正在运用一种向量自动回归（VAR）万法。他们只是照看着计算机以期找到独立于任何理论的数据模式。

另一组变化比演进更加革命最近，一群实验经济学家一直在更多地关紸代理人建模这些都是模拟，其中不同种类代理人的地方化的个人最大化目标被具体化和模型化。但是结果被加以模拟以确定继续存在的策略，而不是通过演绎来确定在这些模拟中，允许个人逐步确立制度并进行联合并提供了一个与真实世界现象更加接近的相似粅。

我们了解到的另一种变化是发展与利用一种称作宏观经济模型校准的方法模型不再进行经验检验；取而代之的是，它们被加以校准来看经验证据是否与模型预测的结果相符。在校准中除简单的动态时间序列平均数之外，也强调简单的一般均衡模型的作用其参数昰通过内省确定的。作为经验研究的一个主要目标统计上的“适合”明确地被否定。就校准所准确表明的内容而言存在着争论，但是如果一个模型不能被校准，它就不应该被保留

最后一个变化是经验研究的“自然实验”方法的发展。这种方法利用来自直觉的经济理論而不是结构模型，并且运用自然实验作为数据点

数理经济学、统计学以及经济计量学

在我们考察经济计量学的发展之前先人简要地栲虑一下数理经济学、统计学以及经济计量学之间的区别是值得的。它们经常被集合在一起虽然不应当这样。

economics）这一术语仅指将数学方法用于阐述假设它是用来形成假设并阐明其含义的形式化且抽象的分析。统计学（statistics）这一术语指用数字表示的观测资料的集合统计分析指的是运用得自概率论的统计检验，来获得对那些用数字表示的观测资料的见解经济计量学（econometrics）结合了数理经济学与统计分析，前者鼡来阐述假设后者用来在形式上检验假设。这种结合并不是对称的；人们不用从事经济计量学就能从事数理经济学但是，不首先从事數理经济学就不能从事经济计量学。只有数理经济学才能给予人们一种足以明确地在形式上被检验的理论。

我们能够看到数理经济学與统计学在历史上的分离19世纪后期，最强烈反对经济思想数学阐述的经济学家是德国历史学派以及美国制度学派的先驱者。这群人中包括数据收集和统计分析的一些积极倡导者——他们认为在对真实世界的某种现象进行有意义的理论概括之前，必须了解这种现象表明叻什么另外，那一时期很多正规的理论家对于运用统计分析犹移不决例如，马歇尔与埃奇沃斯都对运用统计度量需求曲线的能力犹疑鈈决他们认为，用来解析性地导出曲线的其他条件保持不变的假设使得曲线难以量化。埃奇沃斯在帕尔格雷夫经济学大辞典（1910年版〉Φ论述需求曲线时写道：“杰文斯运用统计学构建需求曲线的希望是否能够实现可能令人怀疑。”

经济学家希望从数理经济学中获得的是假设检验的精确性，这种精确性使得减少检验的含糊性成为可能例如，他们希望不依赖于常识以及对需求曲线向下倾斜的通常启发式的理解就能够在经验上证明需求曲线向下倾斜。在对经济理论进行数学阐述之前经济学家运用文字来陈述经济理论和假设，一般通過与现有情况或者历史事件相比来进行一般性假设的检验但是，在两种情形下统计学的运用都是最小限度的。这种本质上是诱导式的方法并没有使得假设以一种为正规的经济学家所认同的方式被加以检验。

20世纪60年代与70年代形式上的统计检验以及对经济计量方法的了囷解都有了巨大进展。计算机技术的进步使得进行极为复杂的经验研究成为可能较早要花几天时间完成的统计检验，现在可能只需要几秒钟在那一时期，对经济计量学的期望很高一些人认为，经济计量学将使经济学成为一门科学其中，所有的理论都能被加以检验茬此期间，逻辑实证主义与波普尔证伪主义是占统治地位的方法人们认为，过去的错误——以一种导致理论无法检验的方式来阐述理论——能够被加以避免时至今日，最初的这些愿望大多数尚未得到实现

为需求关系增加经验基础的早期尝试是格利高里·金（Gregory King，1648–1712）的研究他重申了查尔斯·戴维南特（Charles Davenant，1656–1714）的一些研究戴维南特在《论如何使一个民族在贸易平衡中成为获利者的可能方法》中，描述叻价格与数量之间大致的相反关系在书中，他提出了下列法则我们认为，歉收可能会以下列比例提而谷物的价格：

所以当谷物价格仩升到通常价格的三倍时，可以假定歉收了通常产量的1/3以上；如果歉收了通常产量的5/10或者说一半价格将上升为通常价格的近五倍。

可检驗与不可检验的理论：马尔萨斯的人口理论马尔萨斯对人口理论的陈述是不可检验理论的一个很好例证在其《人口原理》第一版中，马爾萨斯提出了下列假设即长期中人口趋于以比食物供给更快的速度增加。这一假设极有可能在统计上被予以反驳

然而，在其《人口原悝》第二版以及后来的版本中马尔萨斯又说，人口主题不能在经验上进行检验；他补充了一种无法度量的人口控制即“道德控制的增長”，指的是婚姻的推迟以及婚前性行为的节制当把道德控制作为对出生率的控制增加到理论中时，观测到的人口增加可能与上升的、丅降的以及不变的人均收入相结合并且仍然符合理论。因此马尔萨斯人口理论的这一版本，变得无法进行经验检验

新古典经济学与經验分析

经验研究的早期尝试是例外而不是惯例。17世纪后期大多数古典经济学家采取通常经验论方法。他们就经济体如何运转的规律进荇假设并用实例来支持这些规律。因为不存在公认的对一种理论的检验所以，有关什么理论是正确的争论就一直进行着

19世纪后期，隨着新古典经济学的开始这种方法出现了问题。正如我们在第三部分看到的那样新古典理论变得比较形式化，存在着关于经济学成为┅门精密科学的论述这意味着经济学家经验研究的方法形式化，讨论得最多的是自身正在经历一场革命的统计分析方法

新古典经济学镓采用很多不同的统计分析方法。例如威廉·斯坦利·杰文斯把统计学看做是将经济学变成一门拥有精密法则的精密科学的方法。另外萊昂·瓦尔拉斯则很少从事经验研究；他不断地发展其与经验检验可能性无关的理论。阿尔弗雷德·马歇尔相信经验研究，但并不进行形式仩的统计分析他把直接观测与通常经验论看做是收集经验信息的最有效方式。

19世纪末期20世纪初期统计方法与概率理论的重大研究，使嘚它们被运用到经济学中将形式化的统计方法运用于经济学的最早提倡者之一是亨利·L·穆尔（Henry L. Moore，1869–1958）20世纪初期，穆尔最先使用了很哆统计方法这些方法后来都成了标准。穆尔应用了弗朗西斯·高尔顿盟士、卡尔·皮尔森以及其他人的统计研究这些统计学家证明，有鈳能在一个可控制的环境中运用复相关与相依表，根据统计数据在形式上确定推论。这项研究给称穆尔留下了深刻印象他断定有可能将这些统计方法应用于经济理论的检验中。

不像杰文斯那样仅仅“目测”同一坐标方格中的两张图表穆尔在形式上比较了两个系列的數据，并发展了统计学使之能够为他提供有关这两组数据之间关系的信息。然而重要的是要注意到他这样做，是对皮尔森研究的勇敢突破后者仅仅分析在其他实物影响能够被加以控制的环境中所进行的研究。穆尔没有这种奢求因为在经济学中受控制的实验通常是不鈳行的；因此他假定在受控制的实验中使用的统计方法，在不受控制的环境中也有效

他特别有兴趣进行检验的理论是约翰·贝茨·克拉克的工资的边际生产力理论，该理论预言个人将被支付其边际产品。为了达到检验上目的穆尔研究了工资与边际生产力、个人能力、罢工鉯及行业集中之间的关系。克拉克的理论意味着：（1）与低能力的个人相比具有较高能力的个人将被支付更多工资；（2）能力相当的个囚在垄断性行业和竞争性行业工作时，在垄断性行业工作的人将被支付更多工资；（3）与非集中性行业相比集中性行业为了较高工资而進行的罢工更有可能获得成功。

穆尔发现了能力与工资之间的关系但是，他的分析中也存在着重大问题在其检验中，穆尔并没有非常嚴格地详细说明他的理论结构例如，在某个检验中他运用平均产品而不是边际产品进行检验，结果并没有检验实际工资而是检验了貨币工资。穆尔也发现了罢工与行业集中之间的关系但是，这种关系只基于有限的数据

穆尔的统计研究也是有问题的，原因在于他鈈仅对简单地从科学上检验克拉克的理论感兴趣，对与政策相关的问题也有着浓厚的兴趣他希望利用他的统计分析来反对要求更多收入岼等的社会主义政策建议。有“私心”并不一定使理论或经验研究的结果无效但是，人们确实质疑含糊不清的结果是否将被合理地加以闡释发觉一个理论家或经济计量学家的动机，并不是对一种假设或理论有效性的检验研究有时发生在受到资助的智囊团中，这些智囊團反映了特定的意识形态只要研究结果成了能被所有人检验的公共财产，那么重大的偏差就有可能被指出来。

穆尔的早期研究使他被確立为将统计方法与经济学相结合的领导者他后来的贡献——一个是对需求曲线的经验度量，另一个是对经济周期的度量——也都很重偠：前者奠定了现代微观经济计量学的基础后者构成了现代宏观经济计量学的基础。

穆尔的需求曲线与确定问题

穆尔最为著名的研究也許是他对农产品和生铁需求曲线的估计对其贡献进行仔细分析是有正当理由的，原因是它指出了经验估计中的很多问题这些问题在后來的争论中起到一定的作用。

考虑一下从经验上度量一条需求曲线的困难市场观测值是交易发生时价格与数量的结合。如果市场处于均衡状态观测到的价格与数量就是既在供给曲线上也在需求曲线上的点；如果市场不处于均衡状态，观测到的价格与数量可能在供给曲线仩也可能在需求曲线上，或者两条曲线上都没有研究者怎么知道是哪种情形？如果研究者能够进行可控制的实验并保持所有其他条件不变，就像在下列方程中一样：

方程中除了价格与数量之外，其他任何条件都保持不变然后，人们就能度量价格与数量之间的实际關系但是，在做不到这一点的地方（借助经济统计学无法做到的地方）研究者不知何故一定要将观测到的价格与数量的数据和理论相連。这里就展现出了经济计量问题的核心：将从不可控制的实验中观测到的数据与理论相连

在他对农业市场的分析中，穆尔乐于接受下列假设即市场趋向于均衡，所以观测到的价格与数量能被假定为是均衡价格与数量即 Pe和 Qe它们是既在供给曲线上又在需求曲线上的点。茬中能够看到这一假设它使我们假定，观测到的点是诸如(Pe,?Qe)而不是 (P1,?Q1)的点在点 (P1,?Q1)上，市场处于向均衡调整过程中的非均衡

穆尔也乐於假设，对于农业商品来说供给外生地由夏季降雨量来决定，所以不受当前收获时期价格的影响。他进一步含蓄地假设过去的事件對于供给和需求没有影响，并且变化着的预期对实际数据的确定不起作用。这些假设改变了模型的图形由呈现出来。因为供给量被假萣为外生决定所以，所估计的点(P1,?Q1)和(P2,?Q2)一定是需求曲线上的点

为了完成其分析，穆尔将数据表示为围绕某一趋势的百分比变化并按照百分比的变化得出需求关系。他提出了一条线性方程的需求曲线和一条三次方程的需求曲线线性需求曲线具有一般形式：P?=?a???bQ，式中 P为价格a是需求曲线的价格截距，b是需求曲线的斜率Q为数量。负号的 b系数表明向下倾斜的需求曲线穆尔运用下列系数，估计了兩种不同的曲线：

注意到在两种情形中需求曲线都具有理论所预言的负号（它是向下倾斜的），并且具有相当高的可决系数

穆尔所估計的需求曲线并没有立刻给他带来赞誉；很多人不明白他的成就，确实明白的一些人（例如埃奇沃斯）断言考虑到基础理论的复杂性，經验需求分析显得过于简单埃奇沃斯主张，构成结论基础的未经检验的假设非常多拘泥于形式并没有什么好处。这些批评尽管是实质性的且仍然在不同程度上被视同反对经济计量研究，但是这些批评不应当被看成是贬低穆尔的贡献他是从统计上度量需求曲线的最早嘚经济学家之一，虽然像南希·伍维克指出的那样，尚不清楚穆尔是否打算估计一条传统需求曲线。

对穆尔农业需求曲线估计的淡漠认同与对其生铁需求估计的淡漠接受相比，前者相当于一种积极的恭维穆尔声称，生铁的需求曲线斜率为正数所以，当价格上升时需求量也上升。他提出了下列需求方程：

穆尔声称发现了一条正斜率的需求曲线从而直接反对微观经济理论，这引起了强烈的批评性回应

考虑到穆尔作为一位经济理论家所具有的复杂头脑，伍维克指出穆尔的正斜率需求曲线并不是错误造成的结果，也不是未能理解确定問题（为了估计另一条曲线需要保持供给或需求不变）的结果。根据伍维克的观点它代表了解决数据局限性的一种尝试，并允许这些局限引导其分析而不是让理论分析引导其经验研究。这一观点得到了下列事实的支持即在穆尔的著作中，他很清楚其需求曲线并不是根据马歇尔的理论得出的一条典型的需求曲线而是一条与经验规律有关的动态需求曲线，涉及很多交互式变化

很多相互影响能够使穆爾的动态需求曲线符合静态需求理论。例如当生铁价格上升时，总收入与经济活动有可能增加这就与需求的增加相连。因为不可能外苼地说明生铁的供给（估计静态需求曲线时这是必要的），所以穆尔认为他的动态需求曲线抓住了经验规律，从而在对经济体进行预測时是一种有用的工具

穆尔认为，尽管不能外生地说明供给但人们可以估计一条曲线，它包含了对可度量的供给相关变动的正常反应这些正常反应包括以一种前后一贯的方式使静态需求曲线变动；并使得被度量的且包含相互依赖关系的动态需求曲线向上倾斜。如果后來的这些相互依赖关系是正确的那么，无论何时我们看到主要行业产品供给外生地增加我们都将会预期到这些行业的产品价格上升，洏不是下降这就是穆尔的结论。穆尔认为基本上不需要将这一动态需求曲线与基础性的静态理论相连，原因在于这样做只是一种训練，并不能令人信服他写道：

根据统计方法即其他条件保持不变的方法，解释现象时所遵循的适当过程是：在理论上依次调查每种要素對价格的影响假定其他条件保持不变，然后最终进行综合！但是如果发生每种要素与价格的联系，那么其他条件保持不变的假设，僦涉及大量的且至少是有问题的假设当人们谈到多种影响的最终综合时，难道不会完全使自己迷失在含蓄假设的路途中吗我们不采用這种令人困惑的方法，而是遵循着相反的过程完全具体地着手处理价格与供给关系的问题。
统计相关性理论的富有成效与上述方法的總无成果，形成了强烈对比两种方法在处理多重影响问题上遵循着相反的过程。例如考虑一下天气对农作物的影响问题。在假定方式丅假定其他未被列举的天气因素保持不变，试图解决关于降雨量对农作物的影响问题这是怎样一种毫无价值的思考？有关温度影响的問题也能保持其他条件不变吗？最后一种综合怎么能由多种个别影响组成呢？多重相关性的统计方法则没有带来这种无益的问题它矗接质询农作物与降雨量之间的关系是什么，不用保持其他条件不变其他事物根据它们的自然状况而变化，

穆尔研究中的合理因素涉及經济计量学中一些尚未解决的相关问题它们提供了关于制度主义学派经验方法的观点，即数据应当引导理论分析而不是理论引导经验研究。经济学专业越来越意识到静态分析的局限性并开始将这种分析与经验观测相结合，近来为穆尔研究所做的辩解就是在这样一种氛圍中进行的在穆尔所处的时代或20世纪中期这种辩解并没有出现。穆尔受到了来自两个方面的抨击——那些反对形式化的理论与经验研究嘚人这些人认为他的统计方法太复杂，以及那些赞同形式化的理论与经验研究的人这些人认为穆尔未能将足够的注意力放在理论上。

盡管在专业中留下了不可磨灭的痕迹但穆尔忍受着对其向上倾斜需求曲线的奚落，并最终放弃了经济计量研究这使得他的学生来完成經验革命。在他的学生中最著名的是享利·舒尔茨（Henry Schultz，1893一1938）他的《需求与供给的统计法则》（1928）和《需求理论及计算》（1938）在现代微觀经济计量学的发展中发挥了重要作用。

亨利·舒尔茨与自变量和因变量

亨利·舒尔茨的贡献是从他对关税的分析中派生出来的，对关税的分析要求估计一条需求曲线。当试图估计需求曲线时舒尔茨获得了一个引人注意的发现：正如穆尔所进行的研究那样，通过价格对数量進行回归而不是数量对价格进行回归，人们能够得到完全不同的弹性在论述这些问题时，舒尔茨认为如果对于哪种变量是所要回归嘚正确变量（哪种是自变量，哪种是因变量）人们有一种居先的观点，那么这一观点将决定选择的正确性。然而如果人们并没有一種居先的观点，就没有办法在两者之间选择舒尔茨认为，在这种情况下选择能够较好地符合由皮尔森卡方测验所确定的回归是最好的。

舒尔茨的见解是重要的；它意味着不能独立于理论来考察统计度量你所看到的，部分地取决于你所相信的这一见解促成了当前经济計量学要求研究者仔细区分自变量与因变量的习惯。

当然说到统计度量的变化与理论有关，并不是说度量完全取决于理论它不表明理論是决定性的；理论只是提供了一种人们能够从统计学中得出的有限解释。

微观经济学的经验研究比较困难但是，在宏观经济学中它更加困难原因在于万事万物都倾向于相互关联。最早的贡献之一是威廉·斯坦利·杰文斯做出的。

威廉·斯坦利·杰文斯是数理方法与效用理论的先驱者之一他因这些研究而获得了高度的称赞。尽管杰文斯现在最为人所知的是他对新古典理论的微观经济贡献然而，他在度量宏观经济关系方面的经验尝试在经济计量学史中最为著名。他的研究是早期形式化宏观经济经验研究的尝试之一虽然他在微观经济學中的研究得到了赞誉，然而他关于经济周期的宏观经济统计研究并没有得到经济学界的充分认同。事实上他经常受到奚落。

杰文斯對挖掘导致价格波动的贸易或经济周期原因感兴趣因为循环行为看上去并不与个人效用最大化行为相关，所以他认为自然界中一定存茬某种原因——一些引起波动的自然现象。初步的研究使他认为经济活动波动的原因很有可能是与天气有关的某种东西。他把注意力集Φ在太阳黑子（太阳活动的周期性波动）上将其视为可能的原因。

杰文斯的具体假设是太阳黑子循环以 11.1年为一个周期而发生，这些循環导致了天气的循环从而导致经济周期。为了验证他的理论杰文斯着眼于13世纪和14世纪以来可供使用的有关收成波动的农业数据。其后他试图将这些收成波动与19世纪对太阳黑子活动的估计，即11.1年一个周期的估计相连他假设日斑循环的长度不变，通过在代表 11年的一个网格上展示数据并目测数据，对两者进行比较他注意到了一种相对来说较好的“适合”，循环看上去匹配然后，他考察19世纪期间商业信用的周期并发现平均周期是 10.8年。他断定经济周期的可能原因是太阳黑子。

杰文斯的日斑理论没有被19世纪的经济学家所采纳大多数囚认为它相当怪异。它之所以值得提及主要是因为它是运用统计学来形成并检验一种宏观经济理论的尝试，并因此为杰文斯确立了经济計量方法先驱者的地位

穆尔对宏观经济计量学的贡献

商业循环是一种持久的经济现象，因而穆尔对估计农作物需求所做的贡献，因其宏观经济贡献而得到加强这就不足为奇了。在宏观经济计量学中穆尔的主要贡献是，既提供了商业循环理论也试图从统计上上度量咜。在分析商业循环时穆尔的动态需求曲线获得了更多的正当理由。尽管存在一种静态需求理论然而，并不存在类似的商业循环理论穆尔认为，演绎的和其他条件保持不变的推论对于解释这种波动是没有帮助的。

像杰文斯一样穆尔选择天气的循环作为经济波动的外生原因。他将这一观点与他向上倾斜的生铁需求曲线相结合作为对于商业循环的解释。他的五个论点如下所示：

（1）下雨增多且农作粅产量增加；（2）贸易差额上升；（3）生产者产品的需求、价格以及数量上升；（4）就业增加因此农作物的需求增加；（5）物价上升。

當雨量减少时过程相反。穆尔运用统计分析来支持这一主张

穆尔的原创分析受到了菲利普·赖特的批评，后者在1915年的一篇文章中将雨量的度量调整为与生长有关的雨量，而不是全年的总雨量赖特的研究显示，统计关系中断了赖特的观点有力地动摇了穆尔的统计分析，这促使穆尔将其覆盖面扩展到更多的国家在其扩展分析中，穆尔发现持续存在着一个八年周期1923年，他创作了关于这一主题的第二蔀更加精细的著作其中，他将天气设置为诸多经济和社会原因之一

理论的扩展使之将多重原因包含进来，这使理论获得了合意的支持但是他对天气周期的深入分析，强调金星在八年间隔中位于地球与太阳之间这导致他的理论被冠以“商业循环的金星理论”的称号。穆尔研究商业循环的特定方法没有被其他人所继续，但是他为后来的经济计量研究提供了一定的基础，并且为制度经济学家的分析奠萣了基础

韦斯利·克莱尔·米切尔：非正统经验论者

早期制度主义者之一韦斯利·克莱尔·米切尔在宏观经济学的经验研究问题上，与正统新古典经济学家有重大不同。穆尔的研究提供了一种有益的焦点，我们能够从中考察米切尔的经验研究方法这种方法在20世纪上半叶得箌发展，并且是全国经济研究局（NBER）最初采用的方法穆尔比较形式化的统计方法存在着问题，这是米切尔的方法获得偏爱的原因之一

米切尔关于理论与实际分析之间适当关系的观点，在他关于经济周期的早期研究中就表达出来了：

致力于了解当今经济活动周期性盛衰特征的人会发现对于经济周期的众多解释既是启发性的，也是令人困惑的所有的解释都似是而非，但是哪一种是有效的？没有任何一種解释必定排斥所有其他解释但是，哪一种是最重要的每种解释都可以说明某种现象；任何一种解释都能说明所有的现象吗？这些相互竞争的解释能够以某种方式结合起来，产生一种一致的且完全充分的理论吗
通过证明理论并批评理论这种逻辑过程来得到这些问题嘚答案，似乎仅存渺茫的希望因为无论这些理论可能拥有怎样的独创性与一致性优点，如果它们未就经济周期现象提出敏锐的见解它們就都只有微小的价值。正是通过研究它们声称要加以解释的事实来使理论得到检验
但是，如果我们开始通过收集证据依次检验每种悝论来确认或者否认它，就会扰乱研究视角问题的要点不在于任何经济学家观点的有效性，而在于对事实的清楚理解对繁荣、危机以忣萧条现象的观察、分析、系统化是首要的任务。如果我们直接着手于这一任务与我们考察理论现象这一迂回方式相比，会有更好的贡獻
直接着手于事实的这一计划，决不排除对其他人所得出结论的自由利用相反，他们的结论表明应当寻找某些事实应当进行某些分析，应当尝试某些安排的确，如果我们不从各个方面寻求帮助整个研究将是粗糙和肤浅的。但是我们希望的是将一种新的考察变成倳实。

米切尔的方法注重实效；它并不把对理论进行实际检验这一重要作用看做是一种有用背景而是把理论看做是解释经验观察的一种囿用背景。与这一观点相符米切尔并不将经济学看做是一门科学，而是看做有助于政策形成的一门艺术最终，对于米切尔来说并不存在能在一个优雅的模型中被详细说明的不变理论；经济体过于复杂并且正在经历不断的结构变化。考虑到这种复杂的变化创造一般理論就是在敷衍塞责；唯一可接受的理论是所传授的常识，只有通过将常识与统计分析有机地综合才能理解经济体。

尽管就形式上的科学性而言数据并不适合于检验理论，然而它们适合检验有关周期行为的不同假设。在后来的《测算经济周期》（Measuring Business Cycles伯恩斯与米切尔，1946）Φ米切尔检验了熊彼特关于不同周期之间关系的假设，并否定了这种关系他也检验了他自己的假设，即周期性行为中存在一种长期的卋俗变化他和合作者也否定了这一假设。他们确实发现了变化但是，这些变化是不规则和任意的因此，通过将形式上的统计检验——例如相关性检验与显著性的检验——与基于制度知识与数据知识的判断相结合它们能够非形式化地“检验”假设。尽管在科学方法中形式化的检验决定了一种理论的有效性或虚假性，但对于米切尔来说这样的检验仅仅是对常识与主观判断的一种辅助。20世纪30年代期间米切尔的数据与经济经验分析方法，为美国的主流实观经济学家所运用

一些数据例如煤炭价格，能被简单地加以收集和运用适合理論结构的数据通常必须被加以构建。必须确定可以计量的概念然后收集数据。这项工作通常是困难且苟求的我们来看一些例子。

经济學家运用价格总水平的概念但是经济体中并不存在对所有价格的度量。20世纪40年代以来价格总水平的提高（通货膨胀）获得了大量关注。在通货膨胀能被度量之前关于价格总水平度量的构建已经进行了相当多的研究。在《指数的编制》（The Making of Index Numbers1922）中，欧文·费雪考察了打算用来度量价格与经济活动的指数在构建过程中遇到的一些问题寄希望于通过取消中间产品，并适当地赋权重于最终产品人们就能构建一種度量价格总水平变化的指数。借助于这种度量有可能为通货膨胀概念增加更多的准确性，并检验有关货币供给变化与价格变化之间关系的假设应当注意到，货币供给并不是作为简单的数据存在并被加以收集和分析的必须构建对货币供给的度量。很多经济学家将其生命中的大部分时间花在度量与数据收集领域的研究上

一些经济学家在国民收入核算领域做出了重要贡献。凯恩斯理论迫切需要对国民收叺、消费、支出、储蓄以及投资支出进行度量在进行数据收集的量化研究之前，这些宏观理论上的概念要求解决极其困难的概念性问题理查德·斯通爵士（Sir Richard Stone，1913–1991）与詹姆士·米德（James Meade1907–1995）都是诺贝尔经济学奖获得者，他们为英国发展了适合凯恩斯理论模式的国民收入核算体系

在美国，国民收入核算的研究者是诺贝尔奖得主西蒙·库兹涅次，他在米切尔的指导下创作了博士论文，并继续在米切尔的指导下在全国经济研究局进行研究。库兹涅茨的主要贡献是为美国构建了国民收入度量，并且运用统计学来度量和比较不同国家的增长模式。庫兹涅芯帮助创立的国民收入核算是后凯恩斯宏观经济计量模型的一个重要组成部分。

华西里·列昂惕夫也是诺贝尔经济学奖获得者怹在组织数据收集过程中发挥了作用；他设计了投入产出分析，这是一种用来处理经济体相互关系的实用计划工具列昂惕夫强烈地不满於毫无经验内容的现代主流经济模型构建。他提倡关注经济学的实际应用运用数据进行研究而不是构建复杂的数学模型。他的论文《理論假设与不可测的现实》（Theoretical

另外两位对数据收集做出贡献的经济学家是艾布拉姆·伯格森（Abram Bergson1914–）与亚历山大·格申克龙（Alexander Gerschenkron，1904–1978）伯格森是一位有才能的理论家，他在24岁还是一位研究生时便创作了一篇福利经济学方面的经典论文。他成为美国苏联问题方面的主要专家僦前苏联经济活动的度量进行了开创性的研究。在苏联解体之前人们经常听说苏联的计划者采用产生于美国的对苏联经济活动的度量，原因在于这些度量比他们自己的统计更可靠。在将哈佛大学俄罗斯中心建成研究苏联社会的重要研究中心的过程中伯格森起了主要作鼡。

像库兹涅茨一样格申克龙出生在俄国，但20世纪20年代期间他在维也纳接受经济训练他是库兹涅艾与伯格森在哈佛的同事。尽管他的書面作品数量不多但是，他是教授中的教授他掌握多种语言，针对帕斯捷尔纳克（Pasternak）以及纳巴科夫（Nabokov）对普希金（Pushkin）《尤金·奥涅金》（Eugene Onegin）的翻译，发表了批评性文章格申克龙对增长的度量，尤其是对苏联增长的度量进行了重要的研究并且表明了工业生产指数中所使用的基年的选择是如何影响指数所表示的增长率的。他的研究揭示出苏联的增长并不像苏联计划者所显示的那样快，原因是他们的喥量有偏差

20世纪60年代，米切尔的宏观经济经验分析方法成为一种少数人使用的方法受到微观经济学与宏观经济学中的经济计量方法的排挤。很多理由解释了为什么主流不再依赖米切尔的方法而是转向经济计量学：（1）统计方法与经济计量方法的进一步发展使它们避免叻穆尔研究中的一些问题；（2）经济学专业和整个社会在完成并检验理论过程中，对准确性有强烈要求；（3）数理经济学迅速发展（4）經济计量学使经济学变成一门精密科学有了希望；（5）有才气且意志坚强的经济计量方法倡导者对这种方法进行着宣传。

E. J·沃克因与确定问题

在微观经济学中推进经济计量方法的一项发展是E. J·沃克因（E. J. Working1900–1968）的确定问题方法。价格与数量之间的简单相关性即使提供了数据嘚“良好适合”也几乎没有什么意义，原因在于经济理论规定价格与数量是由供给与需求的相互作用所决定的。人们见到过供给曲线与需求曲线的存在吗

沃克因表示，如果人们能够独立地说明供给从而准确地了解供给关系以及它将如何变动，那么所得到的点将估计絀一条需求曲线。也可以说如果人们独立地说明和需求关系，就能估计出一条供给曲线如果人们不能独立地说明任何一方，那么没囿额外的信息，就不能估计出供给曲线或者需求曲线

确定问题的“解决”至少大体上使得从经验上说明静态关系成为可能，即使其他条件保持不变的条件不成立人们相信，随着计算技术的改进（通过计算机来实现）将会出现静态理论与经验理论和经验度量之间的更好關系。

凯恩斯理论与宏观经济计量学

20世纪30年代并不是微观经济学的发展从根本上向前推进了经济计量学；而是宏观经济学的发展起了推動作用，因为这一时期是宏观经济计量学的发展时期大萧条将经济学家的思想转向宏观经济学。到了20世纪30年代后期凯恩斯理论席卷经濟学领域，人们都在奋力为大萧条提供令人满意的解释政策也致力于解决大萧条问题。因此20世纪30年代直至60年代，经济计量学的历史集Φ于宏观经济计量学

20世纪30年代，对宏观经济模型化的关注是符合逻辑的这一时期，宏观经济学极大地受到凯恩斯宏观经济学的影响囚们尝试着寻找凯恩斯理论经验上的对应物，得出了很多对乘数的估计科林·克拉克（Colin Clark）估计乘数介于1.5到2.1之间；米哈尔·卡莱斯基（Michal Kalecki）估计乘数约为2.25。

当然只有当凯恩斯理论有意义时，乘数才有意义所以，存在一种强烈的推动力以从经验上确定凯恩斯的理论是否正確。因此出现了很多度量消费与收入之间的关系，即凯恩斯所谓的“消费函数”的尝试这一时期也出现了下列信念的缺失，即经济力量具有推动经济体朝向充分就业的自动倾向与此相应，对中央计划的关注也增强了这种中央计划要求对经济体的关系做出估计。因此重要的研究发生在像荷兰中央计划局这一类的学会中，就不足为奇了

拉格纳·弗里希·简·丁伯根以及大型宏观经济计量模型的发展

挪威经济学家拉格纳·弗里希（Ragnar Frisch，1895–1973）是20世纪20年代末期和30年代早期最有影响力的经济计量学家之一弗里希是受过高度训练的数学家，他既對宏观经济计量学也对微观经济计量学做出了贡献并且在使实验经济学改变方向、远离制度方法、朝向经济计量方法方面发挥了重要的莋用。实际上正是他创造了经济计量学（econometrics）这一术语。尽管弗里希在微观经济计量学中取得了一些重大发现（他完成了一项具有决定性嘚对沃克因确定问题的数学处理并且表明普通最小二乘估计是有偏差的），然而正是他对宏观经济计量学的贡献才表明了他的重要性。他与简·丁伯根一道，在通过发展经济体的一种宏观经济计量模型来创建宏观经济计量学中扮演了重要的角色在弗里希的著作《运用完铨回归系统的统计合流分析》（Statistical Confluence Analysis by Means of Commplete Regression Systems，1934）中能够看到他的主要研究他在书中主张，大多数的经济变量同时在“汇合的系统”中相互连接在該系统中，没有任何一个变量能够单独变化；他设计出了多种方法来处理这些问题

简·丁伯根是弗里希的朋友，1936年受国际联盟招募，承擔对商业周期理论的统计检验工作1939年他的报告《商业循环理论的统计检验》（Statistical Testing of Business Cycle Theories）得以出版。这一著作集中于根据数据发展动态宏观经济悝论并对它们进行检验。丁伯根发展了一种展示周期性趋势的商业循环理论或宏观经济模型

诸如弗里希与丁伯根一类的经济计量学家認识到，宏观经济学中的经济计量研究与微观经济学中的经济计量研究相比，在概念上要难得多在微观经济学中，人们困扰于供给方程与需求方程这两个单独的结构方程的确定问题；在宏观经济学中理论表明存在一个大的相关方程体系，该体系构成了宏观经济力量的基础不知什么缘故，研究者几乎无限地扩展对大量方程的微观经济分析详细地说明结构方程体系，并检验那些方程

弗里希与丁伯根囸是将他们的分析转向这一任务，两人因他们的贡献而获得了诺贝尔经济学奖像穆尔一样，他们的目的不仅仅是简单地检验一种理论的囿效性：他们对政策感兴趣他们认为，如果他们能够说明对经济体进行描述的结构性方程组那么就能确定一系列的政策来改变那些方程的结构，并通过那些政策实现经济体合意的目标

丁伯根的研究引起了严肃的批评，批评来自约翰·梅纳德·凯恩斯与米尔顿·弗里德曼两人都反对研究的整个过程以及从研究中得出的含义。他们认为丁伯根的估计程序是，运用相同的数据得出用来检验可能相互冲突的悝论的模型这使得统计显著性的正常检验不相关。他们的观点代表了经济计量学不能代替所传授的常识这一坚定看法即使在其最初阶段，宏观经济计量学也受到了重大质疑

特里夫·哈维默与经济计量学中的或然说革命

特里夫·哈维默（Trygve Haavelmo，1911–）是一位挪威经济学家他與拉格纳·弗里希一同从事研究，他因为将概率方法引入经济计量学与经济理论中而获得赞誉。在引入概率方法之前经济学家假定他们囸在试图度量的基础经济理论是精确的。如果人们能够在事实上保持其他任何事物不变那么，就能获得一种精确的关系哈维默反对这┅假设，他主张应当将经济理论视为概率理论不是描述精确的关系，而是描述概率关系

在哈维默的论文《经济计量学概率方法》（1944）發表之前（但该论文1941年之前就以手稿的形式广为传播），经济计量学家已经使用统计方法但或含蓄或明确地认为，概率理论基本上没有提供什么东西他们正在试图探寻的基础性法则是精确的法则。哈维默认为因为概率理论是统计方法背后的理论实体，所以如果不承認人们正在寻求或然性法则，却运用统计方法这是不合适的。对经济法则或然性特征的接受使得很多统计方法与检验被正式加以利用，在此之前这些方法与检验在被使用时并没有正式基础，这也使得它处于经济计量学现代方法的中心哈维默于1989年获得诺贝尔经济学奖。

考利斯委员会与考利斯委员会方法

哈维默的概率方法得到了考利斯经济学人研究委员会研究者的认同该委员会由阿尔弗雷德·考利斯三世于1932年组建，他是一位富有的投资顾问考利斯集合了一群非常有智慧的经济学家，包括欧文·费雪、哈罗德·霍特林（1895–1973）以及拉格纳·弗里希，并要求他们研究如何将数学和统计方法应用于经济问题研究。考利斯委员会最初位于美国科罗拉多州的斯普林斯；1937年迁到芝加哥並一直在那里直到20世纪50年代搬到现在的地点耶鲁大学。

大多数现在被视为标准经济计量研究的东西都是由考利斯委员会从事的。这一研究包括评估普通最小二乘估计是否向下偏倚（它被发现向下偏倚百分之二十五）；在小数据组中发展蒙特卡洛方法研究渐近收敛和评估者的无偏移问题。

我们应当还记得这一时期计算上的难度是极大的，因为我们今天所了解的计算机并不存在人们不能简单地向计算機输入“得出OLS估计”或者“得出最大似然估计”命令来获得结果。人们手工从事研究考利斯委员会遵循哈维默的思想，假设最好的经济計量学方法是概率方法在这一方法中，结构方程有一个假定的误差项分布这种概率方法以考利斯委员会方法而变得为人所知。来自于栲利斯委员会的最著名的经济计量模型之一是克莱因–哥德伯格宏观经济计量模型它是宽泛的凯恩斯体系最早的经验研究代表，和包括63個变量其中很多是内生的，有43个是前定变量在这43个前定变量中，19个是外生的24个是滞后的。

计量历史学与罗伯特·W·福格尔

2定量方法發展中一个引人注意且有所争议的分支是将经济计量学应用于历史分析这一新的领域被称为新定量历史或者计量历史学（cliometrics，在希腊神话Φclio是历史女神缘斯）最为突出的新历史学家是罗伯特·W·福格尔（Robert W. Fogel，1926–）他在1964年出版了《铁路和美国经济增长计量经济史学文集》。茬这一研究中福格尔结会了新古典经济学与统计推论，并对很多结论产生怀疑这些结论是从事文字创作的历史学家根据他们对铁路与媄国经济增长之间的关系的研究得出的。

一些经济学家开始实践计量历史学并产生了大量文献。同时也有大量关于新方法正确性的论述A. H·康拉德（A. H. Conrad）与J. R.梅耶（J. R. Meyer）1958年发表了一篇引起争议的文章—— “南北战争前的南方奴隶制经济学”，在文章中他们否定了如隶制不是一種有利可图的制度的结论。福格尔与S. L·恩格曼出版了《十字架上的岁月；美国黑人奴妹制经济学》，他们在文中运用大量数据和研究，接受并扩展了康拉德-迈耶的论题。新古典经济学与经济计量学在历史中的这一新应用在历史学领域内部产生了相当多的争议，这是经济学侵蝕其他学科的又一个例子

宏观经济计量学科学优雅性的衰落

20世纪60年代期间，很多凯恩斯式的宏观经济计量模型得到发展全都呈现出某種科学面目，这其中包括数据研究学会（DRI）模型、沃顿模型以及各种联邦储备模型作为经济体的预言者，这些宏观模型一直流行至20世纪70姩代早期但是，到了70年代中期这项研究失去了支持在罗伊·爱泼斯坦（Roy Espstein）对这些模型的论述中，他写道：

进入20世纪70年代实用经济计量学家的自信并没有持续很久。十年的经济震荡开始使得根据大量结构性宏观模型做出的预测无效这促使研究者对其体系进行不断的重噺说明和重新估计。伴随这项工作的是日益增多的研究这些研究将大模型的预测质量与新一代单变量时间序列简单模型进行比较。这些仳较也经常表明结构模型做出的预测并不比简单模型好，弗里德曼1949年做出的预测是一个明显的证实

对宏观经济计量模型的批评，其原洇与经济学家反对早期研究的原因类似第一，古典统计检验的有效性取决于独立发展的数据理论然而在现实中，大多数以经验为根据嘚经济研究者“采集数据”寻找“最佳的适合”——实现了最佳 r2、t 以及 F 统计量（度量理论正确性的统计量）的理论阐述。数据采集侵蚀叻统计检验的有效性第二，即使适当地实行了统计检验数据的有限可得性也使得指派代理人成为必然，这种指派可能合适也可能不合適因此，检验的有效性取决于代理人的适当性但是，并不存在对代理人适当性的统计度量第三，几乎所有的经济理论都包括一些不鈳度量的变量这些变量能够被指望着，而且经常被指望着解释不符合理论的统计结果第四，经济计量检验的复制通常是不可行的原洇是经济学家很少〈（即使曾经）能够进行可控制的字验。这使得任何结果的可靠性都是未知的它依赖于主观判断。

罗伯特·索洛是一位宏观经济学家获得过诺贝尔经济学奖，他捕捉到了经济学专业对形式上的宏观经济计量模型的大量关注他写道：

我认为，不可能通過经济计量来解决这些争议我认为，经济计量学并不是一种相当有力和有用的宏观经济时间序列工具因此，人们被迫就经济休的结构莋出判断虽然你总是能够提供模型，运用经济计量来支持你的观点但是，对于双方来说这太容易了人们从来没有能力找到共同的经驗依据。

对经济计量检验的冷嘲热讽使得很多研究者对其统计研究采取了一种随便的态度。结果是很多研究不能被重复极少的研究能被加以复制，在已发表的经验研究文章中出现错误是平常事爱德华·里莫（Edward Leamer）是加州大学洛杉矶分校的一位经济计量学家，他总结了这┅现象他写道：

经济计量建模是在建筑物的地下室完成的，而经济计量理论课程则是在顶楼（第三层）讲授的我为同一种语言在两个哋方使用这一事实所困惑。更加令人惊异的是个别人的变形他们在地下室中恣意地犯错，随着他们上到第三层就变成了最高主教。

他指出摆脱进退两难局面的一种方式是运用贝叶斯经济计量学，基中研究者的信仰程度被考虑进统计检验中；但是，这样做过程太复杂所以大多数研究者只是不断地在做他们常做的事情。正是经验检验的这一难点使得我们在第1章附录中描述的修辞方法和社会科学方法夶量出现。

对宏观经济计量模型的现代批评

一项获得大量支持的对宏观经济计量模型的批评被称作卢卡斯批评，因为它是由罗伯特·卢卡斯提出的，卢卡斯是一位宏观经济学家，他是新兴古典宏观经济革命的领导者。卢卡斯认为，个人的行为取决于预期的政策；因此随著一项政策变得过时，模型的结构将发生变化但是，如果模型的基本结构发生改变那么，适当的政策也将改变模型也就不再合适了。所以运用经济计量模型来预测未来政策的效应是不合适的。

其他现代宏观经济计量模型的现代批评家包括大卫·亨德里（Daivd Hendry）他认为，宏观经济计量学家应当运用最新的方法和大量的检验来使数据适合；也就是说所揭示的统计关系应当优先于理论。第三位批评家是克裏斯多佛·西门斯（Christopher Sims）他的观点与亨德里的观点略微相似。他声称当今的方法施加给数据过多的理论结构，不施加结构会更好应当茬本质上将所有的变量都视为内生的，并运用统计方法来揭示关系他赞成运用向量自回归，或者自回归移动和平均模型一类的方法这些方法简单地采用人们提交的所有数字，没有结构如果时间结构关系持续，再找到这些数字在未来的最佳估计只有计算机了解这一基夲结构。

向量自回归方法是米切尔方法的现代化身它用最少的理论关注于数据。传统的宏观经济计量学家指出这些新方法没有运用任哬对经济体的理论见解。和较早的经济计量理论批评家一样向量自回归提倡者回应说，传统的宏观经济计量模型与结构模型是以非常囿限的理论为基础的，以至于没有理论会更好些

卢卡斯之前的经济学家拥有很多见识，他们清楚这些问题20世纪40年代后期，考利斯委员會也讨论过在雅各布·马尔沙克（Jacob Marschak，1898–1977）、库普曼斯（Koopmans）以及威廉·菲利普斯（Alban William H. Phillips1914–1975）20世纪50年代至60年代的研究中能够找到这一讨论。然洏这一批评的影响来自于卢卡斯的研究。

贝叶斯方法是对统计学含义另一种根本不同的解释与客观解释相对，它提出了一种对统计学嘚主观解释贝叶斯们提出放弃古典解释，从而放弃传统的古典经济计量学不必说，就贝叶斯方法与古典方法而言统计学家们之间存茬着重大争议。要理解围绕经济计量检验的很多混淆理解两种方法之间的差异是关键性的。

为了了解这一差别假定我们希望估计某一參数的值。在古典统计学中人们得到参数的点估计，它满足某些特征例如BLUE标准，其中B为best（最佳），L为linear（线性），U为unbiased（无偏）E为estimator（估计）。此外它必须具有合意的渐进性，使得当可以利用大量数据时估计也会聚合到参数的真值上。古典分析的整个聚焦点在估计量和表明其特征的统计学上

在贝叶斯方法中，对估计量的解释完全不同贝叶斯分析不是产生数据的点估计，而是形成数据的密度函数它被称作后验密度函数。密度函数并不是一种样本分布它只能借助于人们先前所确信的东西加以解释。当就数据的真值进行预言时咜通常是作为研究者给出的几率被予以论述的。它是关于可能性的主观概念而不像在古典方法中那样，是关于可能性的客观概念或频率論者概念

因此在贝叶斯方法中，人们必须说明其初始的信仰程度并运用经验证据作为改变信仰程度的手段。人们既有一种先验密度函數也有一种后验密度函数。在贝叶斯分析中人们只是简单地运用经验数据来修正其先前的信仰，而在古典方法中人们则不断地试图確立模型的真正性质。

经济学家在很大程度上没有使用贝叶斯方法其原因并不在于他们反对主观主义可能性的基本哲学特性；取而代之嘚是很实际的原因：（1）难以将先前的信仰形式化为一种形式上的分布，（2）难以发现后验分布的过程；（3）难以使其他人确信贝叶斯结果的有效性原因是它们明确地受到干扰，或者只能通过个人信仰得到解释尽管存在这些实际问题，很多经济计量学家仍然真诚地热衷於贝叶斯经济计量学

贝叶斯方法没有引人注意地流行开来，但是关于经济计量课程中所讲授的内容如何很少真实地反映了经济计量学镓所做的事情，一直存在着众多的抱怨例如，尹瑞里盖特（Intriligator）、博多金（Bodkin）以及程肖（Hsiao）写道：

现有的大多数经济计量学教科书中至尐80%的材料单纯集中在经济方法上。与之相反应用型的经济计量学家，典型地只花20%其至更少的时间和精力在经济计量方法本身上；剩余的時间和精力花在研究的其他方面尤其是花在相关经济计量模型的构建、估计进行之前适当数据的开发，以及估计进行之后结果的解释上

造成这一差异的原因是，讲授经济计量学的教授通常并不是实际进行经济计量学研究的人正如马格纳斯（Magnus）与摩根（Morgan）在1999年所强调的，应在实干中而非教育中进行实际经济计量研究。这些抱怨是下会导致未来更好的经验研究还有待观察。

最近一群经济学家开始在經济学中采取一种不同的经验研究方法。利用动物或者人担当一种不知名商品的购买者和销售者在了解基本的供给与需求条件的前提下，来确定理论是否正确地预测了实验中出现的结果这些实验经济学家宣称，通过他们的实验已经证明了不同的经济命题。

我们来考察怹们运用一种称作“双重口头拍卖市场”的程序所进行的检验其中，购买者与销售者公开宣布竞价并出价弗农·史密斯是这一研究的领导者和发展者，他于1956年进行了实验室实验来检验双重口头拍卖市场是否能够实现均衡。学生们承担了供给者与需求者的角色并喊出他們的价格。各方都有由十四个学生组成的市场在十五分钟内价格非常接近于均衡价格；一旦价格到达均衡价格位置时就倾向于停留在那裏。当需求变动（给学生几张纸告诉他们不同的需求条件）时，价格相对迅速地调整到新的均衡价格上这一实验被很多其他经济学家所复制。

这种方法具有多种可能的用处通过运用实验方法，经济学家就能了解市场是如何在不同的制度条件下发挥作用的在最近的一佽实验中，研究者检验了有牌价市场并将它与双重口头拍卖市场进行比较。在牌价市场中厂商与购买者在一定时期内展示价格并坚持這一价格。研究者发现与双重口头拍卖市场相比，在牌价市场上价格倾向于较高这一发现使得美国交通部向实验经济学家寻求帮助，鉯解决涉及铁路与驳船定价的问题铁路方面要求交通部将私人磋商的运费率转变为公开展示的费率，认为公开展示将保护它们以及小驳船所有者免受大驳船所有者未公开的削价侵害然而，当实验者模拟这两种类型的市场时他们发现情况恰好相反：价格展示比私人磋商哽倾向于产生较高的价格，并伤害小驳船经营者铁路因此放弃了它们的要求。

实验经济学家所进行的另一项检验是有关科斯定理的科斯定理表明能够相互损害但又进行谈判的各方将进行讨价还价，从而得到一个有效率的结果无论哪一方有造成损害的法律权利。实验的結果证明了这一预言然而实验发现，当通过掷硬币赋予个人法律上的权利时他们几乎都不可避免地未获得博弈论所预测的议价剩余中铨部的个人合理份额。取而代之的是讨价还价者们几乎不可避免地平等地分享了剩余。这表明支配分配的是一种公平的道德规范而不昰纯理性的个人最大化。实验进而表明如果任意赋予不对称的财产权，那么个人并不认为它们是合法的。然而实验者注意到，当财產权被赋予给实验前在技能游戏中获胜的个人时三分之二拥有财产权的个人获得了大部分的共同剩余，而在任意分配的情况下没有人獲得。

考虑到经验检验理论中存在的问题这一研究获得重视并不令人感到奇怪。它的专业认同具有宽泛的含义不仅要求经济学家的训練发生重大的变化，而且要求他们在社会中的作用以及他们处理经济问题的整个方法发生重大的变化。

一项相关的发展是通过模拟进行汾析的在这项研究中，模型被设计为具有多个代理人他们遵循着简单的地方化规则，然后进行模拟并确定哪些规则能够存在，哪些鈈能这使得建模者借助假设的继续存在来选择假设，而不是借助内省

很难评价经济计量学最近的发展。它的历史是末实现的希望和预期的历史这些无法实现的希望和预期，在宏观经济计量学中比在微观经济计量学中要多得多然而，应当提醒读者我们对于宏观经济計量模型构建现代历史的看法，可能过于悲观构建了这些模型的人认为已经取得了进步，例如劳伦斯·克莱因及其同事断定：

我们发现在半个多世纪的宏观经济建模过程中，很多引人注意的教训已经被吸取当然，这并不意味着宏观经济建模的进步是直线的或者其至昰单调的或连续的。出现了一些人退步如果有后见之明，很多事情本可以按照不同的方式去做但是，已经取得了进步并且我们认为，我们对现实世界宏观经济的了解与半个世纪前相比要多得多。

也这一观点有可能是主流观点但不是我们的观点。它也不是传统宏观經济计量学批评家们的观点他们认为：（1）主流的结构模型并没有弄清楚正在估计和正在检验的是什么；（2）与合理的数量相比，模型提倡者所要求的数量过多了批评家们所质疑的并不是经验研究；而是经验研究的适当种类。抨击来自于两个方面制度主义者希望将更哆的注意力放在定性数据上。一些人希望通过计算机来研究未受到理论阻碍的数据还有一些人希望看到比当前所使用的检验还要复杂的檢验。

因为微观经济计量学集中于局部均衡问题所以，它所呈现的是不太严重的方法问题不过，它也存在问题也有批评者。具体来說批评者指责说，即使是微观经济计量学也需要经济学中难以获得的信息，并且没有可控制的实验，古典统计检验就不能表明它们洎认为已表明的东西至于宏观经济计量学，批评者采取两种完全不同的主张制度主义者声称经济学家应当更多地关注被传授的通常经驗论，它较好地结合了制度知识与历史知识贝叶斯的批评者则认为，我们需要更多的技术上的检验它们抓住了统计的主观特性。

爱泼斯坦在他对经济计量学史的研究中掌握了很多批评者对经济计量学近来发展的看法，我们用他的这段话来作为本章的结束语

在没有可控制的实验或者得自于统一而稳定的人口大样本的帮助下，立志于更大的定量准确性就这一点而言，经济计量学在所有学科中可能是独┅无二的迄今为止经验表明，即使是最大的模型也具有精确而单纯的结构这些结构所代表的实际现象的有效性非常之低。美国制度主義者的研究项目…… 与之相反的是在定量上不精确但强调经济结构的一种复杂的、分解的、历史的方法。当所要处理的问题相当特殊时他们的政策最为成功，并且允许以“从实践中学习”的形式进行实验例如，失业保险计划的设计劳动仲裁委员会的实行，或者配给項目的管理一个更加关键的因素，是对受到这些措施影响的不同经济群体的不同情况与动机的详细了解与之相反，温宁（Vining1949）的观测具有一定的合理性，即经济计量学家似乎完全关注于“整个文明的病理学”这一研究表明，很多经济计量模型的不精确是对经济现象極为单纯化解释不可避免的结果。经济计量分析在一种制度约束与个人行为能够更加清楚地加以辨别的新的层面上进行可能是最富有成效的。

经济波动由太阳黑子引起的思想具有某种幽默光环较早由穆勒提出的另外一种解释与“商业情绪”的改变有关，记住这一点很重偠为什么情绪会改变，或者为什么这种改变似乎存在某种规律关于这些，并没有任何解释考虑到这一点，对内生周期感兴趣的经济學家就自然地转向诸如太阳黑子一类的自然现象。关于杰文斯太阳黑子研究的一篇优秀论文参见桑德拉·J·皮尔特的《太阳黑子与预期》：威廉·斯坦利·杰文斯的经济波动理论”一文，该文载于《经济思想史杂志》1991年秋第2期第24–265页

}

§2.4 分位数回归估计Quantile Regression,QR 一、分位数回歸的提出二、分位数回归及其估计三、分位数回归的假设检验四、实例一、分位数回归的提出分位数回归由Koenker Roger和Bassett Gilbert Jr于1978年提出利用解释变量和被解释变量的条件分位数进行建模试图揭示解释变量对被解释本来分布的位置、刻度和形状的影响。经典回归模型称为均值回归建立了被解释变量的条件均值与解释变量之间的关系。实例1 Koenker和Machado(1999)分析了1965～1975以及1975～1985两段时间内世界主要国家的经济增长情况模型选取了13个影响经济增长的解释变量。通过分位数回归得出结论：对于初始单位资本产出这一解释变量它的全部回归分位系数基本保持不变，这就意味着对於经济发展迅速与缓慢的国家而言初始单位资本产出对于经济增长的影响基本相同；教育支出占GDP的比重以及公共消费占GDP的比重这两个解釋变量对于经济发展缓慢的国家影响更加强烈。实例2 Chen(2004)使用分位数回归方法研究了美国8250名男性的BMI（身体质量指数一种广泛用于测量偏胖还昰偏瘦的指标）情况，并得出结论：在2~20岁这一快速成长期中BMI迅速增加；在中年期间BMI值保持比较稳定； 60岁以后，BMI的值开始减少分位数回歸估计与经典模型的最小二乘估计相比较，有许多优点当数据出现尖峰或厚尾的分布、存在显著的异方差等情况，最小二乘法估计将不洅具有优良性质且稳健性非常差。分位数回归系数估计比OLS估计更稳健最小二乘估计假定解释变量只能影响被解释变量的条件分布的均徝位置，不能影响其分布的刻度或形状的任何其他方面而分位数回归估计能精确地描述解释变量对于被解释变量的变化范围以及条件分咘形状的影响。二、分位数回归及其估计 1、分位数回归原理分位数回归是对如上简单形式的扩展如果Y的条件分位数由k个解释变量X线性组匼表示，即Y的θ条件分位数被定义为： 2、分位数回归估计方法参数估计方法有两类：一类是直接优化方法例如单纯形法、内点法等；一類是参数化方法，例如结合MCMC（Markov Chain Monte Carlo）的贝叶斯估计方法常用的计量经济和统计软件都可以实现对分位数回归模型的估计和假设检验，如stata、sas、r、eviews等 3、分位数回归的扩展如果被解释变量的条件密度非同质，可以采用加权的方法提高分位数回归估计的效率权重与某概率水平下的局部样本密度成比例。加权分位数回归估计为：将分位数回归应用Panel Data构造Panel Data分位数回归模型。对于固定效应变截距Panel Data模型：将分位数回归应用於归并数据（Censoring Data）构造归并数据分位数回归模型：凡是连续随机变量作为被解释变量的计量经济学内生变量模型，都可以进行分位数回归估计三、分位数回归的假设检验分位数回归估计的检验包括两部分：一是与均值回归类似的检验，例如拟合优度检验、约束回归检验等；一是分位数回归估计特殊要求的检验例如斜率相等检验和斜率对称性检验等。 1、拟合优度检验分位数回归估计拟合优度检验统计量（Machado擬合优度）为： 2、约束回归检验分位数回归约束回归检验似然比统计量采用无约束和有约束情况下最小化θ分位数回归的目标函数值构造。 3、斜率相等检验斜率相等检验，即检验对于不同的分位点估计得到的结构参数（在线性模型中即为斜率）是否相等。原假设被设定為：如果接受该假设说明每个斜率对于不同分位点具有不变性，此时应该采用普通最小二乘估计；如果拒绝该假设，说明模型应该采鼡分位数回归估计以反映每个斜率在不同分位点的不同值。斜率相等检验可以通过约束回归检验实现原假设相当于对分位数回归估计施加了个约束（斜率中不包括常数项）。应用软件中给出了一些相应的检验统计量例如，EVIEWS6.0中的Wald统计量可以实现该约束检验例：软件EVIEWS6.0使鼡手册中实例的斜率相等性检验结果，其中Y为家庭食物消费支出X为家庭收入。 4、斜率对称性检验斜率对称性检验即检验对于给定的X，Y嘚分布是否是对称的原假设被设定为：例：软件EVIEWS6.0使用手册中实例的斜率对称性检验结果，其中Y为家庭食物消费支出X为家庭收入。四、實例 * 假定随机变量y的概率分布函数定义y的θ分位数给定y的n个观测值相对应的分位数等价地转化为求一个最优化问题分位数回归参数估计量为对应的Panel Data分位数回归参数估计为：对应的“归并”

}

奇偶密码网