पैनल डेटा के साथ मैचिंग प्रॉपर्टीज स्कोर


13

मेरे पास व्यक्तियों का एक अनुदैर्ध्य डेटा सेट है और उनमें से कुछ एक उपचार के अधीन थे और अन्य नहीं थे। सभी व्यक्ति जन्म से लेकर 18 वर्ष की आयु तक के नमूने में हैं और इलाज उस सीमा के बीच में कुछ उम्र में होता है। उपचार की उम्र मामलों में भिन्न हो सकती है। प्रिवेंसिटी स्कोर मिलान का उपयोग करते हुए मैं जन्म के वर्ष पर सटीक मिलान के साथ जोड़े में उपचारित और नियंत्रण इकाइयों का मिलान करना चाहता हूं, ताकि मैं 18 वर्ष की आयु तक प्रत्येक जोड़ी को उनके जन्मकाल से ट्रैक कर सकूं। सभी में लगभग 150 उपचारित और 4000 अनुपचारित व्यक्ति हैं। मिलान के बाद विचार उपचार के प्रभाव का अनुमान लगाने के लिए एक अंतर-अंतर रणनीति का उपयोग करना है।

फिलहाल मेरी जो समस्या है, वह है पैनल डेटा के साथ मेल करना। मैं स्टैटा की psmatch2कमांड का उपयोग कर रहा हूं और मैं घर और व्यक्तिगत विशेषताओं पर मिलान करता हूं ताकि प्रॉपर्टीज स्कोर मिलान का उपयोग किया जा सके। सामान्य तौर पर पैनल डेटा के साथ प्रत्येक उम्र में अलग-अलग इष्टतम मैच होंगे। एक उदाहरण के रूप में: यदि A का इलाज किया जाता है, B और C नियंत्रण हैं, और ये सभी 1980 में पैदा हुए थे, तो A और B का मिलान 1980 में 0 वर्ष की आयु में किया जा सकता है जबकि A और C का मिलान 1981 में 1 वर्ष की आयु में किया जाता है। । साथ ही ए को पिछले वर्षों के अपने पूर्व-उपचार मूल्यों के साथ मिलान किया जा सकता है।

इस समस्या को हल करने के लिए, मैंने सभी समय-भिन्न चर का औसत लिया, जैसे कि मिलान उन व्यक्तियों की पहचान कर सकता है जो नमूना की अवधि में सबसे अधिक समान हैं और मैं प्रत्येक आयु वर्ग 0 से 18 के लिए अलग से मिलान करता हूं। दुर्भाग्य से यह अभी भी प्रत्येक इलाज इकाई के प्रति आयु वर्ग के लिए एक अलग नियंत्रण इकाई से मेल खाता है।

अगर कोई मुझे स्टैटा में पैनल डेटा के साथ युग्मक मिलान करने के लिए एक विधि की ओर निर्देशित कर सकता है तो यह बहुत सराहना की जाएगी।

जवाबों:


9

आपको मूल रूप से मिलान प्रक्रिया के लिए प्रासंगिक सभी विशेषताओं के साथ एक विस्तृत प्रारूप डेटासेट बनाना है, इस क्रॉस-अनुभागीय डेटासेट पर मिलान का प्रदर्शन करें, और फिर पैनल डेटासेट में मिलान किए गए जोड़े की पहचान करने के लिए आईडी का उपयोग करें। यहाँ कुछ और विवरण हैं:

  1. reshapeएक विस्तृत प्रारूप डेटासेट बनाने के लिए उपयोग करें । पूर्व-उपचार चर को उस तरीके से प्रारूपित करें जिस तरीके से आप उन्हें मिलान प्रक्रिया में उपयोग करना चाहते हैं। आप अपने चर का औसत निकाल सकते हैं यदि आपके पास एक व्यक्ति के लिए कई अवलोकन हैं लेकिन आप अन्य तरीकों से भी आ सकते हैं (आप एक ही चर के कई अवलोकन भी रख सकते हैं जैसे कि स्वास्थ्य 1, स्वास्थ्य 2 और मिलान में उन सभी का उपयोग करें )। लक्ष्य प्रति व्यक्ति एक अवलोकन के साथ एक डेटासेट है ।

  2. इस डेटासेट का उपयोग करके, मिलान प्रक्रिया को निष्पादित करें psmatch2

  3. मूल डेटासेट के साथ मिलान किए गए मामलों की जानकारी मर्ज करें। ड्रॉप केस जो कि मेल नहीं खाते हैं आदि मैं यहाँ विवरणों के बारे में निश्चित नहीं हूँ क्योंकि मैं वास्तव में स्टैटा को नहीं जानता हूँ और psmatch2मुझे लगता है कि आपको यह विचार मिल गया है।

इन चरणों का उपयोग करके, आप सभी पूर्व-उपचार सूचनाओं के आधार पर मामलों का मिलान कर सकते हैं और आपके पास प्रति उपचार इकाई केवल एक मैच है।


3
मैं वास्तव में नहीं जानता कि इस पोस्ट को वोट क्यों दिया गया क्योंकि यह उत्तर वास्तव में मदद करता है। मैं इसे फिर से वोट करूंगा। धन्यवाद greg!
एंडी

5

ऐसा करने का कोई तरीका नहीं है कि स्टैटा या किसी भी अन्य सॉफ़्टवेयर में जिसके बारे में मुझे जानकारी है।

यदि आप पैनल डेटा तकनीकों के साथ एक पक्षपाती मिलान अनुमानक को पैच करने की कोशिश कर रहे हैं, तो यहां एक दृष्टिकोण काम कर सकता है। यदि आप मान सकते हैं कि मिलान कुछ का ध्यान रखता है, लेकिन सभी चयन पूर्वाग्रह का नहीं, बल्कि यह कि पूर्वाग्रह काफी हद तक समय के साथ स्थिर रहता है, तो आप प्रत्येक अवधि में अलग-अलग मिलान अनुमान लगाकर पूर्वाग्रह के समय-अपरिवर्तित हिस्से को हटा सकते हैं और ले सकते हैं अंतर।

ttY0

E[Y0t|X,D=1]E[Y0t|X,D=0]=E[Y0t|X,D=1]E[Y0t|X,D=0]=Bias,
ΔtM=ΔTT+BiasΔtM=BiasΔtMΔtM=ΔTT

हेकमैन, इचीमुरा, स्मिथ और टॉड 1998 इकोनोमेट्रिक और आयक्लर और लेचनर 2002 श्रम अर्थशास्त्र पत्र इस दृष्टिकोण के उदाहरण हैं। दूसरी ओर, काम करने के लिए इस दृष्टिकोण के लिए 150 उपचारित टिप्पणियां पर्याप्त नहीं हो सकती हैं।


1
पैनल डेटा के लिए जोड़े में व्यक्तियों का मिलान करना संभव होना चाहिए क्योंकि ये दो पेपर (पेपर 1 , पेपर 2 ) इसे भी करते हैं। दुर्भाग्य से लेखक बिल्कुल नहीं बताते कि उन्होंने यह कैसे किया। हेकमैन एट अल (1998) के साथ आप जिस विचार का वर्णन कर रहे हैं, वह जोड़ी के मिलान के बाद डिफ-इन-डिफ का उपयोग करने का सही कारण है।
एंडी

यह मेरे लिए स्पष्ट नहीं है कि वे पैनल मिलान कर रहे हैं, लेकिन आप सही हैं कि प्रक्रियाएँ अस्पष्ट हैं। लेखकों ने pscore लिखा था, जो दूसरों की मदद करने के लिए एक निश्चित इच्छा का संकेत देता है। शायद उनके लिए एक ईमेल चीजों को स्पष्ट करेगा। वे क्या कहते हैं रिपोर्ट करें। यह एक महत्वपूर्ण प्रश्न है।
दिमित्री वी। मास्टरोव

0

कदम:

  1. जैसा कि यह ग्रेग द्वारा विस्तार से उल्लेख किया गया है, आप मेल-जोल उत्पन्न करने के लिए पूर्व-उपचार साधनों पर या एक पूर्व-उपचार अवधि पर क्रॉस-अनुभागीय डेटासेट का उपयोग कर सकते हैं।

  2. पूरे पैनल का उपयोग करके आप एक के लिए संकेतक चर प्रदान
    करते हैं। उपचारभारत
    b। treatPeriod, बाद में शून्य के बराबर होता है जैसे ही उपचार के लिए उपचार होता है।

    उस समय के बाद से जहां treatPeriod 0 से 1 तक बदलता है, व्यक्तियों में भिन्न होता है और अनुपचारित के लिए कभी भी 1 में नहीं बदल जाता है, आपको इलाज के मैच से एक ही शुरुआती बिंदु को अनुपचारित मैच में असाइन करना होगा। यह सहज है, लेकिन मैं फिर भी एक अच्छा संदर्भ देखना चाहूंगा जो इस दृष्टिकोण को सही ठहराता है जो मुझे अब तक नहीं मिला है।

प्रतिगमन सेट-अप होगा:

depvar = treatedIndvidual + treatedPeriod  + treatedIndvidual*treatedPeriod + controls

जहां बातचीत शब्द आपको उपचार प्रभाव देता है।


-2

क्या आपने nnmatch कमांड का उपयोग करने पर विचार किया है ?

मैं इस कमांड का उपयोग करता हूं और यह काफी व्यापक है। यह अलग-अलग मिलान एल्गोरिदम और मामलों को भी ध्यान में रखता है, जिसमें कुछ नियंत्रण समूह के व्यक्तियों के लिए प्रवृत्ति स्कोर समान है। बेशक, इस मामले का उपचार मिलान एल्गोरिथ्म पर निर्भर करता है, अगर आप के-निकटतम-पड़ोसी या कर्नेल या जो भी लेते हैं।


आपके द्वारा संदर्भित लेख में, मुझे पैनल डेटा का कोई उल्लेख नहीं दिख रहा है। क्या आपने पैनल डेटा के लिए इसका उपयोग किया है? यदि हां, तो कृपया विशिष्ट रहें और ओपी के प्रश्न का उत्तर देने के लिए कुछ कोड प्रदान करें।
मेट्रिक्स

सटीक मिलान आसान है, लेकिन कुल मिलाकर nnmatch अधिक जटिल है क्योंकि यह मौजूदा डेटा सेट के अंदर मेल आईडी संग्रहीत नहीं करता है लेकिन एक अलग से है। मैं प्रत्येक आयु वर्ग के लिए एक डेटा सेट के साथ समाप्त हो जाऊंगा जिसे मूल डेटा में विलय करने की आवश्यकता है। इस मामले में विलय काम नहीं करता है क्योंकि मिलान विशेषताओं मूल डेटा में विशिष्ट व्यक्तियों की पहचान नहीं करते हैं। तो दुर्भाग्य से यह एक समाधान प्रदान नहीं करता है।
एंडी
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.