यह अर्थमिति में चयन मॉडल का बदलाव है। केवल चयनित नमूने का उपयोग करने वाले अनुमानों की वैधता इस शर्त पर निर्भर करती है कि
। यहाँ है के रोग की स्थिति।Pr(Yi=1∣Xi,Di=1)=Pr(Yi=1∣Xi,Di=0)Dii
अधिक विवरण देने के लिए, निम्नलिखित सूचनाओं को परिभाषित करें:
और ; उस घटना को संदर्भित करता है जो नमूने में । इसके अलावा, यह मान से स्वतंत्र है सादगी के लिए।π1=Pr(Di=1)π0=Pr(Di=0)Si=1iDiXi
नमूना में
एक इकाई लिए की संभावना है
पुनरावृत्ति के कानून के द्वारा । रोग की स्थिति पर सशर्त मान लीजिए और अन्य covariates , परिणाम
से स्वतंत्र है । नतीजतन,
Yi=1i
Pr(Yi=1∣Xi,Si=1)===E(Yi∣Xi,Si=1)E{E(Yi∣Xi,Di,Si=1)∣Xi,Si=1}Pr(Di=1∣Si=1)Pr(Yi=1∣Xi,Di=1,Si=1)+Pr(Di=0∣Si=1)Pr(Yi=1∣Xi,Di=0,Si=1),
DiXiYiSiPr(Yi=1∣Xi,Si=1)=Pr(Di=1∣Si=1)Pr(Yi=1∣Xi,Di=1)+Pr(Di=0∣Si=1)Pr(Yi=1∣Xi,Di=0).
यह देखना आसान है कि
यहाँ और को आपकी नमूना योजना के रूप में परिभाषित किया गया है। इस प्रकार,
Pr(Di=1∣Si=1)=π1pi1π1pi1+π0pi0 and Pr(Di=0∣Si=1)=π0pi0π1pi1+π0pi0.
pi1pi0Pr(Yi=1∣Xi,Si=1)=π1pi1π1pi1+π0pi0Pr(Yi=1∣Xi,Di=1)+π0pi0π1pi1+π0pi0Pr(Yi=1∣Xi,Di=0).
यदि , हमारे पास
और आप नमूना चयन समस्या को छोड़ सकते हैं। दूसरी ओर, अगर ,
सामान्य रूप से। एक विशेष मामले के रूप में, लॉगिट मॉडल पर विचार करें,
Pr(Yi=1∣Xi,Di=1)=Pr(Yi=1∣Xi,Di=0)Pr(Yi=1∣Xi,Si=1)=Pr(Yi=1∣Xi),
Pr(Yi=1∣Xi,Di=1)≠Pr(Yi=1∣Xi,Di=0)Pr(Yi=1∣Xi,Si=1)≠Pr(Yi=1∣Xi)
Pr(Yi=1∣Xi,Di=1)=eX′iα1+eX′iα and Pr(Yi=1∣Xi,Di=0)=eX′iβ1+eX′iβ.
यहां तक कि जब और भर में लगातार कर रहे हैं , परिणामस्वरूप वितरण logit गठन शामिल नहीं होंगे। इससे भी महत्वपूर्ण बात यह है कि मापदंडों के अंतर्ग्रहण पूरी तरह से अलग होंगे। उम्मीद है, उपरोक्त तर्क आपकी समस्या को थोड़ा स्पष्ट करने में मदद करते हैं।
pi1pi0i
यह एक अतिरिक्त व्याख्यात्मक चर के रूप में को शामिल करने का प्रलोभन देता है , और आधार पर मॉडल का अनुमान लगाता है । का उपयोग करने की वैधता को सही ठहराने के लिए , हमें यह साबित करने की जरूरत है कि , जो कि स्थिति के समतुल्य है। की पर्याप्त संख्या है । आपकी नमूना प्रक्रिया के बारे में अधिक जानकारी के बिना, मुझे यकीन नहीं है कि यह सच है। आइए एक सार संकेतन का उपयोग करें। Observability चर के यादृच्छिक समारोह के रूप में देखी जा सकती है और अन्य यादृच्छिक चर, कहते हैंDiPr(Yi∣Xi,Di)Pr(Yi∣Xi,Di)Pr(Yi∣Xi,Di,Si=1)=Pr(Yi∣Xi,Di)DiSiSiDiZi । निरूपित । यदि
से स्वतंत्र है पर सशर्त और , हम
स्वतंत्रता की परिभाषा से। हालाँकि, अगर और ,
पर कंडीशनिंग के बाद अगर स्वतंत्र नहीं है, तो रूप से कुछ प्रासंगिक जानकारी
, और सामान्य तौर पर यह अपेक्षित नहीं हैSi=S(Di,Zi)ZiYiXiDiPr(Yi∣Xi,Di,S(Di,Zi))=Pr(Yi∣Xi,Di)ZiYiXiDiZiYiPr(Yi∣Xi,Di,S(Di,Zi))=Pr(Yi∣Xi,Di) । इस प्रकार, 'हालांकि' मामले में, नमूना चयन की अज्ञानता अनुमान के लिए भ्रामक हो सकती है। मैं अर्थमिति में नमूना चयन साहित्य से बहुत परिचित नहीं हूं। मैं Microeconometrics: methods and applications' by Cameron
and Trivedi (especially the Roy model in that chapter). Also G. S.
Maddala's classic book
अर्थमिति में सीमित-निर्भर और गुणात्मक चर के अध्याय 16 की सिफारिश करूंगा 'नमूना चयन और असतत परिणामों के बारे में मुद्दों का एक व्यवस्थित उपचार है।