अंतर-में-अंतर (डीआईडी) की एक प्रमुख धारणा यह है कि दोनों समूहों में उपचार से पहले परिणाम चर में एक सामान्य प्रवृत्ति है। यह तर्क देने के लिए महत्वपूर्ण है कि उपचारित समूह के लिए परिवर्तन उपचार के कारण होता है और इसलिए नहीं कि दोनों समूह पहले से ही एक दूसरे से अलग थे।
यदि आप उपचार से पहले और बाद में अलग-अलग लोगों का नमूना लेते हैं तो यह तर्क को कमजोर करेगा जब तक कि उपचार और नियंत्रण समूहों से आपके नमूने वास्तव में यादृच्छिक और बड़े न हों। तो यह अच्छी तरह से हो सकता है कि कोई आपसे पूछने जा रहा है: "आप यह कैसे सुनिश्चित कर सकते हैं कि प्रभाव उपचार के कारण है और न केवल इसलिए कि आपने विभिन्न लोगों का नमूना लिया है?" - और इसका जवाब देना मुश्किल होगा। यह प्रश्न आप पैनल डेटा का उपयोग करके बच सकते हैं क्योंकि आप समय के साथ समान सांख्यिकीय इकाइयों को ट्रैक करते हैं और आमतौर पर यह अधिक ठोस दृष्टिकोण है।
अपने अंतिम प्रश्न का उत्तर देने के लिए: हाँ डेटा मायने रखता है लेकिन आप उपरोक्त समीकरण का अनुमान लगाने के लिए निश्चित रूप से OLS का उपयोग कर सकते हैं। एक महत्वपूर्ण बात जो अतीत में अक्सर अनदेखी की गई थी वह मानक त्रुटियों का सही अनुमान है। यदि आप उन्हें ठीक नहीं करते हैं, तो सीरियल सहसंबंध उन्हें एक अच्छी राशि से कम आंका जाएगा और आप महत्वपूर्ण प्रभाव पाएंगे, भले ही आपको शायद नहीं करना चाहिए। इस समस्या से निपटने के लिए एक संदर्भ और सुझाव के रूप में बर्ट्रेंड एट अल देखें। (2004) "हमें अंतरों पर कितना अंतर करना चाहिए?" ।
अंतिम बात के रूप में, यदि आपके पास कुल डेटा है (उदाहरण के लिए राज्य स्तर पर) या यदि आप आसानी से अपना एग्रीगेट कर सकते हैं और यदि आप डीआईडी की तुलना में हाल ही में इकोनोमेट्रिक पद्धति का उपयोग करना चाहते हैं, तो आप एबीडी एट अल पर एक नज़र रखना चाह सकते हैं । (2010) "तुलनात्मक मामले के अध्ययन के लिए सिंथेटिक नियंत्रण के तरीके" । आजकल के शोध में सिंथेटिक नियंत्रण विधि का तेजी से उपयोग किया जा रहा है और आर और स्टाटा के लिए अच्छी तरह से प्रलेखित दिनचर्या मौजूद है। शायद यह आपके लिए भी कुछ दिलचस्प हो।