अंतर आकलनकर्ता में अंतर क्या है
अंतर में अंतर (DiD) उपचार और नियंत्रण समूह के परिणाम में पूर्व और बाद के उपचार के अंतर की तुलना करने वाले उपचार प्रभावों का अनुमान लगाने का एक उपकरण है। सामान्य तौर पर, हम (जैसे कि मजदूरी, स्वास्थ्य, आदि) के परिणाम पर (जैसे संघ की स्थिति, दवा, आदि) के प्रभाव का आकलन करने में रुचि रखते हैं , जैसा कि
जहाँ व्यक्तिगत निश्चित प्रभाव (समय के साथ परिवर्तित नहीं होने वाले व्यक्तियों की विशेषताएँ), समय प्रभाव है, X_ {यह } व्यक्तियों की उम्र की तरह समय-अलग-अलग सहसंयोजक हैं, औरDiYi
Yit=αi+λt+ρDit+X′itβ+ϵit
αiλtXitϵit एक त्रुटि शब्द है। व्यक्तियों और समय को क्रमशः
i और
t द्वारा अनुक्रमित किया
tजाता है। यदि निश्चित प्रभावों और
D_ {it} के बीच सहसंबंध है,
Ditतो OLS के माध्यम से इस प्रतिगमन का आकलन यह पक्षपाती होगा कि निर्धारित प्रभाव नियंत्रित नहीं हैं। यह विशिष्ट
लोप वैरिएबल पूर्वाग्रह है ।
एक उपचार के प्रभाव को देखने के लिए हम उस व्यक्ति के बीच के अंतर को जानना चाहेंगे जिसमें उसने उपचार प्राप्त किया था और जिसमें वह नहीं था। बेशक, इनमें से केवल एक ही कभी व्यवहार में देखने योग्य है। इसलिए हम परिणाम में समान उपचार के रुझान वाले लोगों की तलाश करते हैं। मान लीजिए कि हमें दो अवधियों है और दो समूहों । फिर, इस धारणा के तहत कि उपचार और नियंत्रण समूहों में रुझान उपचार की अनुपस्थिति में पहले की तरह जारी रहेगा, हम उपचार प्रभाव का अनुमान लगा सकते हैं जैसे कि
t=1,2s=A,B
ρ=(E[Yist|s=A,t=2]−E[Yist|s=A,t=1])−(E[Yist|s=B,t=2]−E[Yist|s=B,t=1])
रेखांकन यह कुछ इस तरह दिखेगा:
आप बस हाथ से इन साधनों की गणना कर सकते हैं, अर्थात दोनों अवधि में समूह परिणाम प्राप्त कर सकते हैं और उनका अंतर ले सकते हैं। फिर दोनों अवधि में समूह का मतलब परिणाम प्राप्त करें और उनका अंतर लें। फिर अंतरों में अंतर लें और यही उपचार प्रभाव है। हालाँकि, रिग्रेशन फ्रेमवर्क में ऐसा करना अधिक सुविधाजनक है क्योंकि यह आपको अनुमति देता हैAB
- कोविराट के लिए नियंत्रित करने के लिए
- उपचार प्रभाव के लिए मानक त्रुटियों को देखने के लिए कि क्या यह महत्वपूर्ण है
ऐसा करने के लिए, आप दो समान रणनीतियों का अनुसरण कर सकते हैं। एक नियंत्रण समूह डमी जो 1 के बराबर है यदि कोई व्यक्ति समूह और 0 में है, तो एक समय डमी उत्पन्न करें जो 1 के बराबर है यदि और 0 अन्यथा, और फिर
treatiAtimett=2
Yit=β1+β2(treati)+β3(timet)+ρ(treati⋅timet)+ϵit
या आप बस एक डमी उत्पन्न करते हैं जो एक के बराबर होती है यदि कोई व्यक्ति उपचार समूह में है और समय अवधि उपचार के बाद की अवधि है और अन्यथा शून्य है। फिर आप
Tit
Yit=β1γs+β2λt+ρTit+ϵit
जहां नियंत्रण समूह के लिए फिर से एक डमी है और समय की डमी हैं। दो प्रतिगमन आपको दो अवधियों और दो समूहों के लिए समान परिणाम देते हैं। दूसरा समीकरण अधिक सामान्य है, क्योंकि यह आसानी से कई समूहों और समय अवधि तक फैला हुआ है। या तो मामले में, यह है कि आप अंतर पैरामीटर में अंतर का इस तरह से अनुमान लगा सकते हैं जैसे कि आप नियंत्रण चर शामिल कर सकते हैं (मैंने ऊपर के समीकरणों से उन लोगों को छोड़ दिया जो उन्हें अव्यवस्थित नहीं करते लेकिन आप बस उन्हें शामिल कर सकते हैं) और मानक त्रुटियां प्राप्त कर सकते हैं अनुमान के लिए।γsλt
मतभेदों के अंतर में अंतर क्यों उपयोगी है?
जैसा कि पहले कहा गया था, DiD गैर-प्रयोगात्मक डेटा के साथ उपचार के प्रभावों का अनुमान लगाने की एक विधि है। यह सबसे उपयोगी विशेषता है। DiD भी निश्चित प्रभाव आकलन का एक संस्करण है। जबकि निर्धारित प्रभाव मॉडल मान लेता है कि , एक समान धारणा बनाता है, लेकिन समूह स्तर पर, । तो यहां परिणाम का अपेक्षित मूल्य एक समूह और एक समय प्रभाव का योग है। तो क्या अंतर है? के लिए आप आवश्यक रूप से लंबे समय तक अपने दोहराया पार वर्गों के रूप में के रूप में पैनल डेटा की जरूरत नहीं है था कि एक ही कुल इकाई से लिए गए हैं । यह डीडी को मानक निश्चित प्रभाव वाले मॉडल की तुलना में डेटा की एक व्यापक सरणी पर लागू करता है, जिसमें पैनल डेटा की आवश्यकता होती है।E(Y0it|i,t)=αi+λtE(Y0it|s,t)=γs+λts
क्या हम मतभेदों में अंतर पर भरोसा कर सकते हैं?
डीडी में सबसे महत्वपूर्ण धारणा समानांतर रुझान धारणा है (ऊपर आंकड़ा देखें)। कभी भी एक अध्ययन पर भरोसा मत करो जो इन प्रवृत्तियों को रेखांकन नहीं दिखाता है! 1990 के दशक में पेपर्स भले ही इससे दूर हो गए हों, लेकिन आजकल डीडी के बारे में हमारी समझ काफी बेहतर है। यदि उपचार और नियंत्रण समूहों के लिए पूर्व-उपचार परिणामों में समानांतर रुझान दिखाने वाला कोई ठोस ग्राफ नहीं है, तो सतर्क रहें। यदि समानांतर प्रवृत्तियाँ धारण करती हैं और हम विश्वसनीय रूप से किसी अन्य समय-परिवर्तन को नियंत्रित कर सकते हैं जो उपचार को भ्रमित कर सकता है, तो DiD एक भरोसेमंद तरीका है।
मानक त्रुटियों के इलाज के लिए सावधानी का एक और शब्द लागू किया जाना चाहिए। कई वर्षों के डेटा के साथ आपको ऑटोक्रेलेशन के लिए मानक त्रुटियों को समायोजित करने की आवश्यकता होती है। अतीत में, यह उपेक्षित रहा है लेकिन बर्ट्रेंड एट अल के बाद से । (2004) "हमें अंतरों पर कितना अंतर करना चाहिए?" हम जानते हैं कि यह एक मुद्दा है। कागज में वे ऑटोकैरेलेशन से निपटने के लिए कई उपचार प्रदान करते हैं। सबसे आसान व्यक्तिगत पैनल पहचानकर्ता पर क्लस्टर करना है जो व्यक्तिगत समय श्रृंखला के बीच अवशिष्टों के मनमाने ढंग से सहसंबंध के लिए अनुमति देता है। यह ऑटोकैरेलेशन और हेटेरोसेडेसिटी दोनों के लिए सही है।
आगे के संदर्भों के लिए इन लेक्चर नोट्स को वाल्डिंगर और पिसके द्वारा देखें ।