Tobit मॉडल स्पष्टीकरण


13

हमारे दो समूहों में 100 प्रतिभागी हैं, प्रत्येक समूह में । हमने 4 समय बिंदुओं पर बुनियादी कामकाज की क्षमता का आकलन किया। मूल्यांकन में 6 प्रश्न शामिल हैं, जिनमें से प्रत्येक में 0 - 5. हैं। हमारे पास प्रत्येक प्रश्न के लिए अलग-अलग स्कोर नहीं हैं, बस कुल स्कोर जो 0 - 30 से हैं। उच्च स्कोर बेहतर कार्य करने का संकेत देते हैं। समस्या यह है कि मूल्यांकन बहुत बुनियादी है और एक महत्वपूर्ण छत प्रभाव है। परिणाम बहुत नकारात्मक रूप से तिरछे हैं। अधिकांश प्रतिभागियों ने 30 के करीब स्कोर किया, विशेष रूप से 3 अनुवर्ती समय-बिंदुओं पर। यह संभावना है कि ऊपरी सीमा पर स्कोर करने वाले सभी प्रतिभागी वास्तव में क्षमता के बराबर नहीं हैं: कुछ प्रतिभागी सिर्फ 30 स्कोर करने के बारे में थे और अन्य ने 30 आसानी से स्कोर किए और यदि संभव हो तो बहुत अधिक स्कोर करेंगे और इसलिए डेटा हैं ऊपर से सेंसर किया हुआ।n=50

मैं दो समूहों की तुलना और समय के साथ करना चाहता हूं, लेकिन जाहिर है कि परिणामों की प्रकृति को देखते हुए यह बहुत मुश्किल है। किसी भी तरह के बदलाव से कोई फर्क नहीं पड़ता। मुझे सलाह दी गई है कि टोबिट मॉडल इस मूल्यांकन के लिए सबसे अच्छा है और मैं आर में विश्लेषण का संचालन कर सकता हूं एरे हेनिंगेन के पेपर से उदाहरणों का उपयोग करते हुए, सेंसर सेंसर पैकेज का उपयोग करके आर में सेंसर किए गए प्रतिगमन मॉडल का अनुमान लगाता हूं

हालांकि, मेरे पास केवल आंकड़ों का एक बुनियादी ज्ञान है और टोबिट मॉडल पर जानकारी काफी जटिल है। मुझे इस मॉडल की स्पष्ट भाषा में व्याख्या करने में सक्षम होने की आवश्यकता है और मुझे एक सादी भाषा, नट और बोल्ट स्पष्टीकरण नहीं मिल सकता है जैसे कि टोबिट मॉडल वास्तव में क्या और कैसे करता है। क्या कोई टोबिट मॉडल की व्याख्या कर सकता है या मुझे जटिल सांख्यिकीय और गणितीय स्पष्टीकरण के बिना एक पठनीय संदर्भ की दिशा में इंगित कर सकता है?

किसी भी मदद के लिए बहुत आभारी

जवाबों:


8

विकी टोबिट मॉडल का वर्णन इस प्रकार है:

yi={yiifyi>0 0ifyi0

yi=βxi+ui

uiN(0,σ2)

मैं आपके संदर्भ के साथ उपरोक्त मॉडल को अनुकूलित करूंगा और समीकरणों की एक सादी अंग्रेजी व्याख्या प्रस्तुत करूंगा जो सहायक हो सकती है।

yi={ yiifyi3030ifyi>30

yi=βxi+ui

uiN(0,σ2)

समीकरणों के उपरोक्त सेट में, एक विषय की क्षमता का प्रतिनिधित्व करता है। इस प्रकार, समीकरणों का पहला सेट निम्नलिखित बताता है:yi

  1. क्षमता की हमारी माप 30 पर उच्च पक्ष पर कट-ऑफ है (यानी, हम छत के प्रभाव को पकड़ते हैं)। दूसरे शब्दों में, यदि किसी व्यक्ति की क्षमता 30 से अधिक है, तो हमारा माप उपकरण वास्तविक मूल्य को रिकॉर्ड करने में विफल रहता है, बल्कि उस व्यक्ति के लिए 30 रिकॉर्ड करता है। ध्यान दें कि मॉडल में ।yi=30ifyi>30

  2. यदि दूसरी ओर किसी व्यक्ति की क्षमता 30 से कम है तो हमारा माप उपकरण वास्तविक माप को रिकॉर्ड करने में सक्षम है। ध्यान दें कि मॉडल में ।yi=yiifyi30

  3. हम अपने covariates रैखिक कार्य और शोर को पकड़ने के लिए एक संबद्ध त्रुटि शब्द के रूप में , की क्षमता ।yixi

मुझे उम्मीद है कि सहायक है। अगर कुछ पहलू स्पष्ट नहीं है तो टिप्पणी में पूछ सकते हैं।


वार्ती, मैंने आपकी प्रतिक्रिया की बहुत सराहना की। यह बहुत मददगार था, और बहुत जल्दी! मुझे यकीन नहीं है कि मैं इसे अभी तक समझाने में सहज महसूस करूँगा लेकिन मैं पढ़ता रहूँगा। यदि आप टोबिट पर कोई पठनीय पाठ जानते हैं तो कृपया उन्हें अग्रेषित करने के लिए स्वतंत्र महसूस करें। कई बार फिर से धन्यवाद
एडम

4

1983 के अमेरिकन सोशियोलॉजिकल रिव्यू (तीसरे अंक) के संस्करण में बर्क का एक लेख है - यह कि मैंने सेंसरिंग के बारे में कैसे सीखा। स्पष्टीकरण विशेष रूप से चयन पूर्वाग्रह के बारे में है लेकिन आपके मुद्दे के लिए बिल्कुल प्रासंगिक है। बर्क चर्चा के रूप में चयन पूर्वाग्रह सिर्फ नमूना चयन प्रक्रिया के माध्यम से सेंसर कर रहा है, आपके मामले में सेंसर एक असंवेदनशील उपकरण का एक परिणाम है। कुछ अच्छे चार्ट हैं जो आपको ठीक-ठीक दिखाते हैं कि कैसे आप अपने रिग्रेशन लाइन को बायस्ड होने की उम्मीद कर सकते हैं जब वाई को अलग-अलग तरीकों से सेंसर किया जाता है। सामान्य तौर पर लेख गणितीय के बजाय तार्किक और सहज ज्ञान युक्त है (हाँ मैं उन्हें अलग मानता हूं, पूर्व को पसंद करता हूं)। समस्या के एक समाधान के रूप में टोबिट पर चर्चा की जाती है।

अधिक आम तौर पर, ऐसा लगता है कि हाथ में काम करने के लिए टोबीट सही उपकरण है। असल में, जिस तरह से यह काम करता है वह सेंसर किए जाने की संभावना का अनुमान लगाकर और फिर उस समीकरण को शामिल करते हुए स्कोर की भविष्यवाणी करता है। हेक्मैन द्वारा प्रोबिट और व्युत्क्रम मिलों के अनुपात का उपयोग करते हुए एक और दृष्टिकोण प्रस्तावित किया गया है जो मूल रूप से एक ही बात है लेकिन आपको अलग-अलग चर को सेंसर करने की संभावना और परीक्षण पर स्कोर की भविष्यवाणी करने की अनुमति देता है - जाहिर है कि आप उस स्थिति के लिए उपयुक्त नहीं होंगे। की है।

एक अन्य सिफारिश - आप एक पदानुक्रमित टबिट मॉडल पर विचार कर सकते हैं जहां टिप्पणियों को व्यक्तियों के भीतर निहित किया जाता है। यह सही ढंग से व्यक्तियों के भीतर त्रुटियों के लिए प्रवृत्ति के लिए जिम्मेदार होगा। या यदि आप एक पदानुक्रमित मॉडल का उपयोग नहीं करते हैं, तो कम से कम व्यक्तियों के भीतर टिप्पणियों के क्लस्टरिंग के लिए अपनी मानक त्रुटियों को समायोजित करना सुनिश्चित करें। मुझे पता है कि यह सब स्टैटा में किया जा सकता है और मुझे विश्वास है कि आर अपनी सभी बहुमुखी प्रतिभा के साथ भी इसे कर सकता है .. लेकिन एक शौकीन चावला स्टाट उपयोगकर्ता के रूप में मैं आपको आर के बारे में जाने के बारे में कोई मार्गदर्शन नहीं दे सकता।


मुझे लगता है कि यह लेख लेख का पूरा उद्धरण है :ill का उल्लेख है: बर्क, आरए (1983)। समाजशास्त्रीय आंकड़ों में नमूना चयन पूर्वाग्रह का परिचय। अमेरिकन सोशियोलॉजिकल रिव्यू, 48, 386-398। doi: 10.2307 / 2095230 इस पत्र के कई स्वतंत्र रूप से उपलब्ध संस्करण हैं, जो आपको Google विद्वान पर मिलेंगे, उदा।
crsh
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.