अंतर-अंतर (DiD) की एक अच्छी विशेषता वास्तव में यह है कि आपको इसके लिए पैनल डेटा की आवश्यकता नहीं है। यह देखते हुए कि उपचार किसी प्रकार के एकत्रीकरण के स्तर पर होता है (आपके मामले के शहरों में), आपको केवल उपचार से पहले और बाद में शहरों से यादृच्छिक व्यक्तियों का नमूना लेना होगा। यह आपको अनुमान लगाने के लिए अनुमति देता है
yमैं एस टी= एजी+ बीटी+ βडीs t+ सी एक्समैं एस टी+ ϵमैं एस टी
और उपचार के कारण पूर्व प्रभाव के रूप में उपचार के कारण प्रभाव को नियंत्रित करने के लिए अपेक्षित पूर्व-पूर्व परिणाम अंतर का अनुमान प्राप्त करें।
एक ऐसा मामला है जिसमें लोग उपचार संकेतक के बजाय व्यक्तिगत निश्चित प्रभाव का उपयोग करते हैं और यह तब होता है जब हमारे पास एकत्रीकरण का एक अच्छी तरह से परिभाषित स्तर नहीं होता है जिस पर उपचार होता है। उस मामले में आप यह अनुमान लगा होगा
जहां डी मैं टी व्यक्तियों, जो उपचार प्राप्त करने के लिए बाद के उपचार की अवधि के लिए एक संकेतक (के लिए है उदाहरण, एक नौकरी बाजार कार्यक्रम जो सभी जगह होता है)। इस बारे में अधिक जानकारी के लिए ये लेक्चर नोट्स देखें
yमैं टी= αमैं+ बीटी+ βडीमैं टी+ सी एक्समैं टी+ ϵमैं टी
डीमैं टी स्टीव पिसके द्वारा।
एजी
यहां एक कोड उदाहरण है जो दिखाता है कि यह मामला है। मैं स्टैटा का उपयोग करता हूं लेकिन आप इसे अपनी पसंद के सांख्यिकीय पैकेज में दोहरा सकते हैं। यहां "व्यक्ति" वास्तव में देश हैं, लेकिन वे अभी भी कुछ उपचार संकेतक के अनुसार समूहबद्ध हैं।
* load the data set (requires an internet connection)
use "http://dss.princeton.edu/training/Panel101.dta"
* generate the time and treatment group indicators and their interaction
gen time = (year>=1994) & !missing(year)
gen treated = (country>4) & !missing(country)
gen did = time*treated
* do the standard DiD regression
reg y_bin time treated did
------------------------------------------------------------------------------
y_bin | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
time | .375 .1212795 3.09 0.003 .1328576 .6171424
treated | .4166667 .1434998 2.90 0.005 .13016 .7031734
did | -.4027778 .1852575 -2.17 0.033 -.7726563 -.0328992
_cons | .5 .0939427 5.32 0.000 .3124373 .6875627
------------------------------------------------------------------------------
* now repeat the same regression but also including country fixed effects
areg y_bin did time treated, a(country)
------------------------------------------------------------------------------
y_bin | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
time | .375 .120084 3.12 0.003 .1348773 .6151227
treated | 0 (omitted)
did | -.4027778 .1834313 -2.20 0.032 -.7695713 -.0359843
_cons | .6785714 .070314 9.65 0.000 .53797 .8191729
-------------+----------------------------------------------------------------
तो आप देखते हैं कि जब व्यक्तिगत निश्चित प्रभाव शामिल होते हैं तो DiD गुणांक समान रहता है ( areg
यह Stata में उपलब्ध निश्चित प्रभाव अनुमान आदेशों में से एक है)। मानक त्रुटियां थोड़ी तंग हैं और हमारे मूल उपचार संकेतक को व्यक्तिगत निश्चित प्रभावों द्वारा अवशोषित किया गया था और इसलिए प्रतिगमन में गिरा दिया गया था।
टिप्पणी के जवाब में
मैंने पिस्चके उदाहरण का उल्लेख किया, यह दिखाने के लिए कि लोग उपचार समूह संकेतक के बजाय व्यक्तिगत निश्चित प्रभावों का उपयोग करते हैं। आपकी सेटिंग में एक अच्छी तरह से परिभाषित समूह संरचना है जिससे आपने अपने मॉडल को लिखा है जो पूरी तरह से ठीक है। मानक त्रुटियों को शहर के स्तर पर एकत्र किया जाना चाहिए, अर्थात एकत्रीकरण का स्तर जिस पर उपचार होता है (मैंने यह उदाहरण कोड में नहीं किया है, लेकिन डीडी सेटिंग्स में मानक त्रुटियों को सही करने की आवश्यकता है जैसा कि बर्ट्रेंड एट अल पेपर द्वारा प्रदर्शित किया गया है )।
डीs tरोंटी
सी = [ ई( yमैं एस टी| s=1,t=1)-ई( yमैं एस टी| s=1,t=0)]- [ ई( yमैं एस टी| s=0,t=1)-ई( yमैं एस टी| s=0,t=0)]
इ( yमैं एस टी| s=1,t=1)इ( yमैं एस टी| s=0,t=1)। यह स्पष्ट करने के लिए कि पहचान समय के साथ समूह के अंतर से क्यों होती है और मूवर्स से नहीं आप एक साधारण ग्राफ के साथ यह कल्पना कर सकते हैं। मान लीजिए कि परिणाम में परिवर्तन वास्तव में केवल उपचार के कारण है और इसका एक समकालीन प्रभाव है। यदि हमारे पास एक व्यक्ति है जो उपचार शुरू होने के बाद एक इलाज वाले शहर में रहता है, लेकिन फिर एक नियंत्रण शहर में चला जाता है, तो उनका परिणाम वापस जाना चाहिए कि यह इलाज करने से पहले क्या था। यह नीचे दिए गए शैलीगत ग्राफ़ में दिखाया गया है।
आप अभी भी अन्य कारणों से मूवर्स के बारे में सोचना चाह सकते हैं। उदाहरण के लिए, यदि उपचार पर स्थायी प्रभाव पड़ता है (अर्थात यह अभी भी परिणाम को प्रभावित करता है, भले ही व्यक्ति स्थानांतरित हो गया हो)