2SLS लेकिन दूसरी अवस्था Probit


15

मैं अवलोकन संबंधी आंकड़ों के साथ कार्य-कारण के अनुमान के लिए वाद्य चर विश्लेषण का उपयोग करने का प्रयास कर रहा हूं।

मैं दो-चरणीय कम से कम वर्गों (2SLS) प्रतिगमन के बारे में आया हूं, जो मेरे शोध में एंडोजेनिटी मुद्दे को संबोधित करने की संभावना है। हालाँकि, मैं ओएलएस के लिए पहला चरण और 2 एसएलएस के भीतर दूसरा चरण होना चाहूंगा। मेरे पढ़ने और खोज के आधार पर, मैंने देखा है कि शोधकर्ता 2SLS या पहले चरण के प्रोबिट और दूसरे चरण के OLS का उपयोग करते हैं, लेकिन दूसरे तरीके के राउंड का नहीं, जिसे मैं प्राप्त करने की कोशिश कर रहा हूं।

मैं वर्तमान में Stata में Stata और ivreg कमांड का उपयोग कर रहा हूं , एक सीधे 2SLS के लिए है।

जवाबों:


12

आपका मामला दूसरे रास्ते के मुकाबले कम समस्याग्रस्त है। उम्मीदों और रैखिक अनुमानों के ऑपरेटर एक रैखिक पहले चरण (जैसे OLS) से गुजरते हैं, लेकिन गैर-रेखीय जैसे प्रोबिट या लॉगिट के माध्यम से नहीं। इसलिए यह एक समस्या है, तो आप पहली बार अपने सतत अंतर्जात चर निकासी नहीं है अपने साधन पर (रों) , और फिर एक PROBIT दूसरे चरण में फिट मूल्यों का उपयोग अनुमान लगाने के लिए जेड एक्स मैं = एक + जेड ' मैं π + η मैं पीआर ( Y मैं = 1 | एक्स मैं ) = पीआर ( β एक्स मैं + ε मैं > 0 )एक्सजेड

एक्समैं=+जेडमैं'π+ηमैं
पीआर(Yमैं=1|एक्स^मैं)=पीआर(βएक्स^मैं+εमैं>0)

मानक त्रुटियां सही नहीं होंगी क्योंकिएक यादृच्छिक चर लेकिन एक अनुमान के अनुसार मात्रा नहीं है। आप पहले और दूसरे चरण दोनों को एक साथ बूटस्ट्रैप करके इसे ठीक कर सकते हैं। स्टाटा में यह कुछ इस तरह होगाएक्स^मैं

// use a toy data set as example
webuse nlswork

// set up the program including 1st and 2nd stage
program my2sls
    reg grade age race tenure
    predict grade_hat, xb

    probit union grade_hat age race
    drop grade_hat
end

// obtain bootstrapped standard errors
bootstrap, reps(100): my2sls

इस उदाहरण में हम एक श्रमिक संघ में होने की संभावना पर शिक्षा के वर्षों के प्रभाव का अनुमान लगाना चाहते हैं। यह देखते हुए कि शिक्षा के वर्षों के अंतर्जात होने की संभावना है, हम इसे पहले चरण में कार्यकाल के वर्षों के साथ लिख रहे हैं। बेशक, यह व्याख्या के बिंदु से कोई मतलब नहीं है लेकिन यह कोड दिखाता है।

बस यह सुनिश्चित करें कि आप पहले और दूसरे चरण में एक ही बहिर्जात नियंत्रण चर का उपयोग करें। उपरोक्त उदाहरण में वे हैं age, raceजबकि (गैर-संवेदी) साधन tenureकेवल पहले चरण में है।


बहुत बहुत धन्यवाद, इसने मेरे सामने आने वाली समस्या को हल कर दिया। एक बार फिर धन्यवाद।
वेरोनिका

1
वास्तव में अनुसंधान का सुझाव है कि एक लॉजिट की तरह नॉनलाइनियर मॉडल के लिए एक नियंत्रण फ़ंक्शन दृष्टिकोण का उपयोग किया जाएगा, जो कि पूर्वानुमानित मूल्यों के बजाय अंतर्जात चर के साथ पहले चरण से अवशिष्टों का उपयोग करना होगा। यद्यपि अक्सर उन्नति प्रतीत होती है, देखें: stat.wharton.upenn.edu/~zijguo/…
robin.datadrivers

1
क्षमा करें, मैंने रैखिक और नॉनलाइन मॉडल के लिए दो दृष्टिकोणों की तुलना करने के लिए एक प्रशस्ति पत्र प्रदान नहीं किया। ncbi.nlm.nih.gov/pmc/articles/PMC2494557
robin.datadrivers

-1 मुझे इस उत्तर को अस्वीकार करना पड़ा, क्योंकि पहले और / या दूसरे चरण में नॉनलिअर मॉडल के लिए 2 एसएलएस अनुमानक के विचार को ले जाना आम तौर पर संभव नहीं लगता है। यह प्रथम चरण एलएस और द्वितीय चरण जांच के मामले के लिए सही हो सकता है (@Andy क्या आपके पास इसका समर्थन करने के लिए एक संदर्भ है?), लेकिन कम से कम एक चेतावनी क्रम में है क्योंकि मैंने कई लोगों को 2 एसएलएस विचार को हर तरह से करते देखा है। पहले और दूसरे चरण में नॉनलाइनर मॉडल के मामले और वह समस्याग्रस्त अभ्यास है।
मोमो
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.