成都南城都汇中学:研一论文,尘埃落定,附经验贴

来源:百度文库 编辑:偶看新闻 时间:2024/05/04 07:38:01

本帖最后由 天下为菊 于 2011-11-16 19:45 编辑


因为答应过很多人,说自己研一所写的论文如果全部录用以后,将写一篇总结帖,在初冬的今天,我思前想后,还是写该贴吧!望大家用一颗宽容的心去对待,如果由于该贴而使得一部分人不满,我再次先赔礼了!
纵观自己研一阶段,应该要分两个阶段,第一阶段是上学期,那时候不知道什么是计量,但是由于我从读研的第一天起,就想读博,所以刚开始研究生生活,就开始了论文写作,上学期写的论文后来发表在以下杂志(排名不分先后)上:
《安徽行政学院学报》、《河北工程大学学报》、《安徽广播电视大学学报》、《湖南工业职业技术学院学报》、《武汉船舶职业技术学院学报》
在寒假的时候,我开始了自己的计量学习,从这时开始,也开始在论文中引入计量了,这一年从一月到八月所写的文章录用及发表在以下杂志(排名不分先后)上:
《南开经济研究》、《世界经济研究》、《科学学研究》、《国际贸易问题》、《科学学与科学技术管理》、《改革》、《财贸研究》、《国际经贸探索》、《世界经济与政治论坛》、《现代财经》、《企业管理》、《西部论坛》、《湖南人文科技学院学报》(历史学)、《晋城职业技术学院学报》(社会学)
这些文章中,计量没有追求任何技术性,只是根据需要做了多元回归,所以在此可以看出计量不单纯靠的技术,思想性应该还是占有一定的地位的,特别是如果自己没有完全了解所使用的技术,那么将会对解释带来极大的困难,甚至会因此造成论文的硬伤而导致论文被搁浅!
现在研二开始快三个月了,我也找到了适合自己的目标,那就是用极大的时间研究计量,现实证明得计量者的天下,未来也会依然证明计量技术的发展是论文的主流。尽管很多人反对甚至诋毁纯粹的计量论文,但是不能不承认计量的确能够解决很多理论推理无法解决而又潜在的问题!
现在有了一个很明确的目标,自己也充满了奋斗的动力,这个目标就是大家可能知道的南开读博,明天我就要实现第一次南开之行,尽管这次仅仅是一个过客,但祝愿自己在2013年能够成为南开的一员!
所以给各位坛友一句忠告:打下基础吧,基础打好了,将使得自己站在一个评判别人论文的高度上!以下是自己的计量学习心得!
心得一:计量的整体分析框架(横截面or面板)

计量中,最为关键也是最为常见的是MLR,而要能够进行一个合理的MLR,必须存在一些假定(CLM):
(a)线性于参数;
(b)存在一个来自于总体的随机抽样;
(c)解释变量存在样本变异,并且一个解释变量不能被其它变量线性表出;
(d)零条件均值;
(e)随机干扰项是同方差的;
(f)随机干扰项是服从正态分布的。
只有在六个条件同时得到满足时,MLR得出的参数估计值才是无偏的,并且可以根据所报告的标准误进行t以及F推断。(a)-(d)保证估计的参数是无偏的,(e)只是简化参数估计值的方差计算公式,这样为stata、eviews等程序估计的标准误提供了统一的公式,(f)是为了进行假设检验时,能够进行t和F统计推断。
一个MLR估计结果,究竟能否值得我们相信,主要看这些假定能否满足,计量的发展也就体现在对这些假定是否成立的检验以及所采取的措施。以上假定不满足会分别产生如下问题:
(1)函数形式误设问题;
(2)样本选择问题;
(3)多重共线性问题;
(4)内生性问题;
(5)异方差问题;
(6)统计推断问题。
对于这些问题的解决,构成了计量先进技术的主流。对于问题(6),大样本一般可以保证随机干扰项服从近似正态性,从而样本容量的增加可以解决问题(6);对于问题(3),是其中最容易引起混乱的问题,很多人对于多重共线性给予了太多的关注,其实只要核心解释变量与其它控制变量的相关性不严重时,这样的问题就不成问题;对于异方差问题,运用WLS可以解决,不过,更为简便的是报告稳健标准误,从而问题(5)也很容易解决。真正的技术性就体现在(1)、(2)与(4)问题中,解决函数形式的误设问题,极其复杂而又很难操作,所以一般的经验研究中都刻意回避这个问题,所以只剩下样本选择问题和内生性问题,“南开帮”(呵呵)目前的高水平计量论文中,就是对这两个问题进行一些让人较为接受的解决方法!
所以,要想做一篇值得推敲的计量论文,对于这些MLR所存在的问题进行说明与解释,必然会令读者耳目一新!这也是横截面数据or面板数据做MLR分析时的整体计量框架,不能不给予重视!
心得二:计量的整体分析框架(时间序列)

时间序列数据就是指一个样本的相关一系列变量在同一时间维度下的抽样,根据得到的变量在时间序列内的实现就可以检验相关的经济理论。时间序列由于其抽样的特殊性而与横截面存在较大差异,尽管时间序列的分析相对复杂,但是其技术性远远不及横截面数据,所以时间序列相对较为简单,分析的过程也较为单一。
得到一个时间序列的实现,检验其背后的经济理论,无疑仍然需要运用MLR做回归检验,但是一个可信的结果需要以下CLM假定:
(a)线性于参数;
(b)无完全共线性;
(c)严格外生性;
(d)同方差;
(e)无序列相关;
(f)误差服从正态分布。
如果以上六项假定满足,那么时间序列直接运用OLS估计MLR得出的结果一定是无偏的,并且可以根据t和F进行相应的统计显著性推断(无论样本的时期数是多少,但至少要超过待估参数的个数)。可惜,由于时间序列的特殊性,以上六条中一些假定很难满足,一些情况下是确定不满足的,比如包含因变量的滞后项时,严格外生性一定不满足。所以要想得到时间序列数据的参数无偏估计量在很多情况下是不现实的,所以需要估计一致估计量。一致估计量需要大样本带来的渐进确定性,对于假定(f),大样本可以直接给予解决,故此假定(f)在大样本下可以直接忽略。
为了放松其它5条假定而得到大样本下的一致估计量,由于时间序列的特殊性,需要包含其他一些假定,最终仍然是以下5条假定就可以得到大样本容量下的一致估计量:
(a‘)线性于参数,并且样本实现的每一个变量是平稳及弱相关的;
(b')无完全共线性;
(c‘)同期外生性;
(d’)同期同方差;
(e‘)无序列相关。
由此可以看出,最大的变化在于第三条,即由严格外生性假定大大弱化到同期外生性,但是包含了变量序列是平稳且弱相关的不同条件。以上五条如果满足,就可以运用OLS在大样本下直接估计MLR而得到一致估计量,所以需要对于这5条进行检验是时间序列中必须包含的部分。
对于变量平稳性检验,其实很难实现,一般只能够通过变量在时t中是否是同分布来检验不平稳(包含趋势以及季节性的变量一定不平稳),但是一般对于平稳性不给予过多的重视,只有在明显不平稳时才进行相关的处理,如除趋势以及除季节性;对于变量序列的弱相关检验,其实就是检验单位根过程,通过差分等变换就可以解决这方面;
完全共线性依然不成问题;
同期外生性大大弱化了严格外生性,如果连同期外生性都不满足的话,就是常说的内生性问题,这样的问题解决办法一直以来没有通法;
异方差问题解决依然同横截面,可以运用WLS或者直接用OLS估计并报告异方差-稳健标准误(但要在无序列相关时对于异方差的解决才有效);
时间序列中,序列相关问题要比异方差问题更加重要,对于序列相关的检验,DW可以进行相应的检验,尽管存在一些问题。对于序列相关的修正,FLGS在严格外生性假定下是一种好办法,可以如前介绍,严格外生性是一种极其强的假定而一般很难满足,所以FGLS得出的估计结果可能极具误导性。方便的做法是直接使用OLS估计并报告序列相关-稳健标准误(在报告了序列相关-稳健保准误后,对于各种形式的异方差也会保持稳健)。
所以,时间序列的研究中,以上问题的分析与表述是计量的整体框架!
心得三:计量内生性问题
作一篇计量论文,有两件事情是必须考虑的,其一是估计结果尽可能具有一致性,其二是估计结果可以根据t和F来进行统计推断。影响第二个问题的因素有异方差和序列相关,虽然WLS可以解决,但是在用OLS估计时报告稳健标准误就可以进行推断,所以这个问题很好解决;导致估计结果不是一致的原因就是内生性,亦即解释变量与无法观测的其它因素相关导致估计结果存在偏误,理论上用IV或者2LSL可以解决这个问题,但是这需要寻找一个合理的工具变量,不过很多时候工具变量的寻找并不比解决内生性问题要容易。很多人会说运用面板数据就可以解决内生性问题,其实这种说法是不全面的,面板数据做固定效应分析时,可以解决解释变量与不随时间而变化的无法观测因素的相关性,而不能解决解释变量与随时间而变化的无法观测因素的相关性,亦即只能部分地解决内生性问题。
那么关于内生性问题,究竟能否完全解决呢?其实,很多时候这个问题并不是很必要,因为我们只是估计解释变量对因变量的大致偏误方向,而无需准确预计偏误大小,即使费尽周折进行内生性分析后,得出了一个仅数据大小不同,可正负号一致的结果,而且对内生性所做的努力也未必一定得到认可,故可以放弃对内生性问题的考虑!特别是检验因果关系时,很多时间如果考虑内生性问题,将使得估计结果失去意义,比如检验香烟消费税对香烟需求的影响,税通过影响香烟价格而影响需求的,如果为了避免内生性,在计量方程中包括价格的话,那么香烟税的系数就代表在香烟价格保持不变的情况下,香烟税对香烟需求的影响,很显然这样的估计结果是毫无意义的!
我们主要是关注核心解释变量对因变量的影响作用的方向,即是否是正向影响或者负向影响的时候,对于内生性问题可无需花费过多尽力;当检验核心解释变量对因变量的相关性时,在能够找到比较令人信服的工具变量下,可以考虑解决内生性问题!
当然,如果存在面板数据的时候,用固定效应做计量检验时,当然能够很容易地部分解决内生性问题,注意,仅仅是部分解决!
心得四:DID
用一个例子解释DID再好不过了!对于研究谈恋爱是否会影响学习成绩的问题。不能直接用恋爱虚拟变量作为解释变量与学习成绩回归,如果这样系数为正的话,那么将认为谈恋爱会促进学习成绩,其实可能正是那些学习成绩好的人更受欢迎,所以才谈恋爱的;反之如果系数为负数,那么将认为谈恋爱阻碍学习,但是可能正是那些社交很广的人才谈恋爱的,而这些人原本学习成绩可能就不是很好
所以估计的系数无论是多少都不能得出让人满意的结论
这样可以找到刚入学时全部单身的一组人,然后看这些人在该期是否谈恋爱了,如果谈恋爱了,就为处理组,没有谈就为对照组,用本期的处理组的学习成绩的均值减去对照组的均值得出了本期的差异,但是要减去原本已经存在于两组间的差异
所以就是两次差分在差分  英文是difference in differences
简称DID
以上四条就是我目前所了解的计量,其中一些通过论坛已经发过了,希望有错误之处,大家一起心平气和的讨论!
再次在向一些坛友道歉,很多人给我发信息,我没有回复,可能我耍大牌了,我现在感受到这样做太有失礼貌了,以后给我发信息的人,我会尽量回复,因为我感受到南开的牛人都很平易近人,哈哈,我也要成为南开一员,所以要向她们学习!
祝愿每一个坛友都能实现梦想!