"स्टाटा" या "आर" रिग्रेशन डिसकंटीनिटी डिज़ाइन में ग्राफ़


10

ली और लेमीक्स (पृष्ठ 31, 2009) शोधकर्ता को सुझाव देते हैं कि वे प्रतिगमन को डिजाइन विश्लेषण (आरडीडी) करते हुए रेखांकन प्रस्तुत करें। वे निम्नलिखित प्रक्रिया का सुझाव देते हैं:

"... कुछ बैंडविड्थ , और क्रमशः कटऑफ वैल्यू के बाईं और दाईं ओर और की कुछ संख्या के लिए, विचार लिए bins ( , ] का निर्माण करना है।" + , जहां "कश्मीर 0 कश्मीर 1 कश्मीर कश्मीर + 1 कश्मीर = 1 , , कश्मीर = कश्मीर 0 कश्मीर 1 कश्मीर = - ( कश्मीर 0 - कश्मीर + 1 ) 01+1=1,,=01=सी-(0-+1)

c=cutoff point or threshold value of assignment variable
h=bandwidth or window width.

... फिर कटऑफ पॉइंट के बाईं और दाईं ओर के माध्य परिणामों की तुलना करें ... "

.. सभी मामलों में, हम कटऑफ पॉइंट के प्रत्येक पक्ष पर अलग-अलग अनुमानित एक क्वार्ट्ज रिग्रेशन मॉडल से from टेटेड मान दिखाते हैं ... (एक ही पेपर के पृष्ठ 34)

मेरा प्रश्न यह है कि हम उस प्रक्रिया को कैसे करते हैं Stataया Rकार्य के लिए परिणाम चर के ग्राफ को साजिश रचने के लिए चर के लिए (विश्वास अंतराल के साथ) तेज RDD के लिए .. एक नमूना उदाहरण में यहाँ और यहाँStata उल्लेख किया गया है (rd_obs के साथ rd को बदलें) और एक नमूना उदाहरण में है यहाँ । हालाँकि, मुझे लगता है कि इन दोनों ने चरण 1 को लागू नहीं किया। ध्यान दें, कि दोनों के पास भूखंडों में फिट लाइनों के साथ कच्चा डेटा है।R

आत्मविश्वास चर [ली और लेमीक्स, 2009] के बिना नमूना ग्राफ यहां छवि विवरण दर्ज करें अग्रिम में धन्यवाद।


आपके झंडे के जवाब में, आपके प्रश्न को पुनर्जीवित करने का एक अच्छा तरीका यह है कि आप इसे संपादित करें और एक इनाम प्रदान करें: यह आपके प्रश्न को टक्कर देगा और इसमें रुचि रखने वाले अधिक लोगों को मिलेगा। यदि आपको लगता है कि यह सवाल स्टैक ओवरफ्लो पर बेहतर हो सकता है, तो हमें बताएं और हम इसे आपके लिए माइग्रेट कर सकते हैं।
CHL

मैं चाहूंगा कि इसे स्टैक ओवरफ्लो में स्थानांतरित कर दिया जाए।
मेट्रिक्स

1
दुर्भाग्य से, यह सवाल स्टैक ओवरफ्लो में माइग्रेट होने के लिए बहुत पुराना है। मेरा मानना ​​है कि यह क्रॉस वैलिडेट पर है, लेकिन यदि आप स्टैक ओवरफ्लो पर पूछना चाहते हैं ( प्रोग्रामिंग पहलू पर जोर देना और एक न्यूनतम प्रतिलिपि प्रस्तुत करने योग्य उदाहरण प्रदान करना ), तो मुझे बताएं और मैं इसे यहां बंद कर दूंगा।
CHL

आपको cmogram का उपयोग करना चाहिए । यह आपकी जरूरत का हर काम करता है।
यान सांग

जवाबों:


10

क्या यह डिग्री 2 के दो स्थानीय बहुपदों को करने से अलग है, एक दहलीज के नीचे और एक ऊपर बिंदुओं पर चिकनी के साथ ? यहाँ Stata के साथ एक उदाहरण दिया गया है:मैं

use votex // the election-spending data that comes with rd

tw 
(scatter lne d, mcolor(gs10) msize(tiny)) 
(lpolyci lne d if d<0, bw(0.05) deg(2) n(100) fcolor(none)) 
(lpolyci lne d if d>=0, bw(0.05) deg(2) n(100) fcolor(none)), xline(0)  legend(off)

वैकल्पिक रूप से, आप केवल उपयोग करने के बजाय चर के रूप में lpoly स्मूथ मान और मानक त्रुटियों को बचा सकते हैं twoway। नीचे , बिन है, स्मूथ माध्य है, मानक त्रुटि है, और और स्मूद परिणाम के लिए 95% कॉन्फिडेंस इंटरवल की ऊपरी और निचली सीमाएं हैं।s s e u l l lएक्सरोंरोंयूएलएलएल

lpoly lne d if d<0, bw(0.05) deg(2) n(100) gen(x0 s0) ci se(se0)
lpoly lne d if d>=0, bw(0.05) deg(2) n(100) gen(x1 s1) ci se(se1)

/* Get the 95% CIs */
forvalues v=0/1 {
    gen ul`v' = s`v' + 1.95*se`v' 
    gen ll`v' = s`v' - 1.95*se`v' 
};

tw 
(line ul0 ll0 s0 x0, lcolor(blue blue blue) lpattern(dash dash solid)) 
(line ul1 ll1 s1 x1, lcolor(red red red) lpattern(dash dash solid)), legend(off)  

जैसा कि आप देख सकते हैं, पहले भूखंड में लाइनें दूसरे के समान हैं।


@Dimitry: समाधान के लिए +1। हालांकि, मैं कच्चे मूल्यों को दिखाने वाले बिखराव की जगह प्रत्येक बिन के लिए माध्य मान (कृपया ऊपर दिए गए स्टैटा उदाहरण को चलाना) चाहता हूं। सीआई महान हैं।
मेटिक्स

1
मुझे पूरा यकीन नहीं है कि आपका क्या मतलब है। मैंने यह कहते हुए कोडित किया कि आपको प्रत्येक बिन में चिकने साधन कैसे मिलते हैं। यदि वह नहीं है जो आप ढूंढ रहे हैं, तो कृपया बताएं कि आपके पास और अधिक विस्तार से क्या है। जहाँ तक मैं बता सकता हूँ, ये रेखांकन आमतौर पर कच्चे डेटा और सुचारू साधन दिखाते हैं।
दिमित्री वी। मास्टरोव

ली और लेमीक्स को उद्धृत करने के लिए (पृष्ठ 31, 2009): "डेटा को रेखांकन करने का एक मानक तरीका असाइनमेंट वेरिएबल (d यहाँ) को कई डिब्बे में विभाजित करना है, जिससे यह सुनिश्चित होता है कि कटऑफ़ के प्रत्येक तरफ दो अलग-अलग डिब्बे हैं। बिंदु (एक ही बिन में एक साथ मिश्रित इलाज और अनुपचारित टिप्पणियों से बचने के लिए) फिर, परिणाम चर का औसत मूल्य प्रत्येक बिन के लिए गणना की जा सकती है और डिब्बे के मध्य बिंदुओं के खिलाफ रेखांकन किया जा सकता है ”। इसलिए, यदि 50 डिब्बे हैं, तो हमारे पास बाईं और दाईं ओर केवल 25 डेटा बिंदु होंगे और संदर्भ के सभी कच्चे डेटा (जैसे, ग्राफ 6 (बी): प्रश्न में अद्यतन)
मेट्रिक्स

1
अब यह स्पष्ट है! मैं कर्नेल पर सहमत हूं। लेकिन क्या आप निश्चित हैं कि अब डिग्री 0 नहीं है? कि समान रूप से भारित मतलब चौरसाई के अनुरूप होगा।
दिमित्री वी। मास्टरोव

1
मेरा मानना ​​है कि एक नियमित कर्नेल और एक डिग्री 0 बहुपद के साथ lpoly से मेल खाती है
दिमित्री वी। मास्टरोव

7

यहाँ एक डिब्बाबंद एल्गोरिथ्म है। Calonico, Cattaneo, और Titiunik ने हाल ही में मजबूत बैंडविड्थ चयन के लिए एक प्रक्रिया प्रस्तावित की है। उन्होंने स्टैटा और आर दोनों के लिए अपने सैद्धांतिक काम को लागू किया , और यह एक प्लॉट कमांड के साथ भी आता है। यहाँ R में एक उदाहरण दिया गया है:

# install.packages("rdrobust")
library(rdrobust)
set.seed(26950) # from random.org
x<-runif(1000,-1,1)
y<-5+3*x+2*(x>=0)+rnorm(1000)
rdplot(y,x)

इससे आपको यह ग्राफ मिलेगा: यहां छवि विवरण दर्ज करें


नमस्ते, CI कैसे जोड़ें?
Kranzz
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.