|
最近看到论坛里很多人预测分数线的时候,都提到报名人数增加这个因素。我是考经济类的,就想到用历史数据做一个实证分析,看看人数对分数线的影响到底有多大。 本文不考虑历年试题的难度变化,也不考虑历年考生的能力变化,以及二战、三战考生占报名人数的比例变化。因此,以下分析的基本假设是上述三个变量保持不变,做出这种假设的原因一是为了简化分析,二是我拿不到这些数据。 我收集了2001至2011年的报名人数(来自研招网)和A区经管类国家线(来自新浪网教育频道,其中2001和2002两年为应届生线)。做出了四组时间序列,分别为:报名人数增量、报名人数增长率、分数线增量、分数线增长率。 首先计算相关系数,得到报名人数增量与分数线增量之间的相关系数为0.24,报名人数增长率与分数线增长率之间的相关系数为-0.15,报名人数增量与分数线增长率之间的相关系数为0.08,报名人数增长率与分数线增量之间的相关系数为0(均保留两位小数)。可以看出,报名人数与分数线之间的线性关系是弱的(绝对值小于0.5),后两个相关系数接近于0,几乎没有线性关系。 下面我们做两个双变量线性回归模型,利用最小二乘法,模型A以报名人数增量为解释变量,分数线增量为被解释变量,得出的β为0.5276,调整的拟合优度为-0.0588,P-value为0.4995;模型B以报名人数增长率为解释变量,分数线增长率为被解释变量,得出的β为-0.0669,调整的拟合优度为-0.0982,P-value为0.6702。可以看出,无论从增量还是从增长率上考察,报名人数变化对分数线变化的解释力都是极差的,回归系数不显著。这里两个半对数模型没有做,因为相关系数近似于0,不值得做。 这样回归的缺陷是误设定,即忽略了许多重要的解释变量,结果是造成最小二乘估计量的偏倚。但即使是在这样的情况下,我们仍然可以根据以上数据,得出报名人数变化对分数线变化影响很小的结论。 面对这样的结论,我的解释是:每年考研的分数近似于正态分布(这种假设之所以合理,是因为大多数考试,包括期末考试,都要求成绩服从正态分布,一些严格的选拔性考试的成绩分布可能呈现右偏,但不影响以下分析),分数线的作用相当于一个单侧分位点,使得成绩大于这个分位点的人数占总人数的一定比例(比如1/3)。每年的试题难度会影响这个分布的均值,但是方差变动应该不大(否则区分度会出现变化)。但是,只要每年考生能力的分布变化不大,那么不管考生人数增加多少,只要报录比是固定的,分数线的确定都能使得一定比例的人上线,因此考生人数变化对分数线的变化影响很小,可以忽略。这就像把一定浓度的两种相同的溶液混合,浓度不会变化的道理一样。 以上就是我对报考人数和分数线的关系的一点见解。欢迎大家讨论,接受质疑和批评,但是我心理比较脆弱,怕喷,请大家口下留情,谢谢!
|