三 实证方法、指标选择与数据处理
(一)MS—VAR模型
由于时间序列可能存在结构性变化,导致VAR模型参数不随时间变化的假设不再适用,汉密尔顿(Hamilton,1989)提出了“区制转换”概念,将包含某些内生性结构变化的状态变量引入VAR模型,用以捕捉经济系统中的时变状态变化。由于近年来中国煤矿安全规制体制发生了深刻变革,为了将规制系统的结构性变化纳入分析框架,本文采用基于马尔科夫区制转换的向量自回归(MS—VAR)模型刻画规制效果的动态变化,该模型允许回归参数依赖不可观测的区制变量(M为区制个数)而变化,且St遵循一个不可约遍历的一阶马尔科夫随机过程,St=1和St=M分别代表系统处于最低状态和最高状态。
根据Krolzig(1997),滞后p阶的MS—VAR模型如下所示:
其中,扰动项ut是一个白噪声过程,且ut~NID(0,∑(St))。令It-1= (yt-1,…,y1)代表t-1时期可用的信息集,则从区制k到区制j的转换概率为:
其中,,pij≥0,∀i,j∈{1,…,M}。
令代表相关参数矩阵,则条件概率密度函数表达如下:
参数矩阵Θ由极大似然估计法最大化下的对数似然函数得到:
t时期状态的概率计算公式为:
(二)指标选取与数据处理
本文采集了2001年1月至2010年8月间[7]全国矿难起数、死亡人数、伤亡人数[8]、原煤产量和火力发电量等月度数据,共计116个样本点。各指标定义与数据来源说明如下:
1.煤矿安全水平
理论上讲,事故(case)、死亡人数(death)和伤亡人数(casualty)三个指标均可反映煤矿安全生产水平。其中,矿难起数衡量煤矿事故发生频率、死亡人数和伤亡人数衡量煤矿事故严重程度。然而,现实中煤矿事故死亡人数和伤亡人数往往受到地方政府的影响和控制,瞒报、少报现象屡见不鲜;与之相比,矿难起数则很难被人为掩盖,能更准确地反映煤矿安全水平。因此,本文选取矿难起数作为衡量煤矿安全水平的主要指标,将死亡人数和伤亡人数作为备择指标纳入稳健性检验过程。相关数据来自国家安全生产监督管理总局政府网站事故查询系统。
2.规制周期
本文选取全国“两会”(session)、全国党代会(party)和春节(spring)三个维度的指标刻画规制周期,用虚拟变量表示。其中,全国“两会”于每年3月举行,故每年3月设为1,其余月份设为0。在样本考察期内,全国党代会包括中国共产党第十六次全国代表大会,于2002年11月举行;中国共产党第十七次全国代表大会,于2007年10月举行,故2002年11月和2007年10月设为1,其余月份设为0。在样本期间,2001年、2004年、2006年和2009年春节在1月份进行,其余年份春节在2月进行,虚拟变量设置方式同上。
3.煤炭产量
为了检验规制周期内煤矿安全水平的提高是否通过控制煤炭产量间接实现,本文将原煤产量纳入实证模型,其数据来自国研网数据中心。
4.控制变量
本文选取火力发电量作为控制变量,以控制能源生产对煤炭产量所产生的影响,数据来自中国经济与社会发展统计数据库。
本文所用原始数据的统计描述如表1所示。
表1 统计变量的数据描述
资料来源:笔者整理。
在进行实证研究之前,需要对原始数据进行必要的处理。通过观察时间序列图形,发现原煤产量和火力发电量序列均存在较为明显的季节性特征,为了消除季节波动可能造成的影响,本文采取CensusX12季节调整法对上述两时间序列进行季节调整,将季节因素从原序列中剔除。为了平滑数据,分别对事故起数、死亡人数、伤亡人数、原煤产量和火力发电量作取对数处理。