1.【Stata 18新功能】DID:面板数据与重复截面数据
【Stata 18新功能】DID:面板数据与重复截面数据
文章来源:Fernando Rios-Avila:DID: Panel Data & Repeated Crossection Using CSDID and JWDI
一、指标指标事件异质性的源码源码多期DD
在异质性处理效应DID文献之前,用多期、公式多个体数据,指标指标采用DID方法估计处理效应,源码源码都会声明如下回归方程:
其中,公式门票系统源码是指标指标二值型处理变量。一般来说,源码源码的公式所有个体都会当做控制组。
异质性处理效应文献让越来越多人意识到,指标指标上述TWFE方程要在一些严格的源码源码假设之下,才能识别干净的公式ATT:
这些假设几乎不成立。例如,指标指标原始处理可能随着时间推移,源码源码效果越来越弱,公式后处理者可能有后发优势,即比先处理者有更强的效应。这个时候,上述TWFE就可能得不到真实的网络监控软件源码处理效应:
最有趣的结果是,研究者估计得到了与真实处理效应相反的效应估计量,例如,即使所有个体都是正处理效应,但是人们估计出负的处理效应。
近些年,许多文献都指出了这一问题,并提出了相似的解决方案(Goodman-Bacon (), Callaway and Sant’Anna (), Sun and Abraham (), Wooldridge () and Borusyak, Jaravel, and Spiess ()):允许组群和时间异质性,避免使用已处理个体作为控制组。
这篇推文关注于两个估计量Callaway and Sant’Anna () and Wooldridge (),下载图片源码Wooldridge (),对应的stata命令为: csdid( csdid2)和 jwdid。两种方法都建议当一个个体在时点T接受处理(对应的组群G),我们估计的点估计量是。
二、 G×T DID(不是2×2 DID)(一)面板数据
首先,加载数据
数据局中包含县级层面的人口规模(lpop)、就业(lemp),以及县最低工资发生变化的c modbus 串口源码起始年份指标(first_treat)。为了估计异质性处理效应的DID模型,要用csdid或者jwdid:
通常,我们要创建一个虚拟变量(处理个体被处理后):
下面,创建处理类指标gvar:
值得注意的是, stata 的官方命令xthdidregress和hdidregress并不要求这一步,因为它会自动生成cohort变量。下面,我们可以检查一下gvar:
正如预期,我们有个样本,安卓斗牛源码个县,个未处理,个在年处理,个在年处理,个在年处理。这些数字被称为“有效样本数”,因为csdid仅仅只是用这些信息来估计处理效应。换言之,我们应该假设有效样本数为(模型声明和控制变量的个数很有用)。
默认地,jwdid用还未处理的个体作为控制组。因此,为了使得csdid与jwdid的结果可比,jwdid用“从未处理个体”作为控制组。对于csdid,默认用上一期作为基期,从未处理个体作为控制组。为了改变,可以使用long2选项。这些选项会使得结果可比。
(二)重复截面数据
重复截面数据稍微有一些不同。一方面,我们并不能在多个时间观测到同一个体。因此,没有个体固定效应。实践中,研究者总是尝试利用组群固定效应或者处理层面的固定效应。
我们再来看看前面的数据集。为了模拟重复截面数据结构,假设每一轮,数据是从每个地区内随机得到的县,我们并不能识别时间层面的县。用上面的数据集,放弃%的数据,创建一个地区id变量,放弃县的识别码:
下面,来创建gvar,与前面的命令相似,但县识别码换成了地区id。注意,地区id代表的是处理层面,它可以在时间层面识别出来:
检查一下gvar:
这样我们就把个体层面的重复截面数据转换成地区层面的面板数据结构。
这个时候就可以使用csdid和jwdid: