मैकफेडन के छद्म-आर 2 व्याख्या


29

मेरे पास एक बाइनरी लॉजिस्टिक रिग्रेशन मॉडल है जिसमें मैकफेडन के छद्म आर-स्क्वायड 0.192 पर निर्भर है, जिसे भुगतान (1 = भुगतान और 0 = भुगतान नहीं) कहा जाता है। इस छद्म आर-वर्ग की व्याख्या क्या है?

क्या यह नेस्टेड मॉडल के लिए एक सापेक्ष तुलना है (उदाहरण के लिए 6 चर मॉडल में मैकफेडन का छद्म आर-वर्ग 0.192 है, जबकि 5 चर मॉडल (उपरोक्त 6 चर मॉडल से एक चर निकालने के बाद), इस 5 चर मॉडल में एक छद्म आर है 0.131 से जीता है। क्या हम उस 6 वे चर को मॉडल में रखना चाहते हैं?) या क्या यह एक पूर्ण मात्रा है (जैसे एक दिया गया मॉडल जिसमें मैकफेडन का छद्म आर-स्क्वेर 0.192 है, किसी भी मौजूदा मॉडल के लिए मैकफैडेन के छद्म के साथ बेहतर है। 0.180 का आर-स्क्वेर्ड (यहां तक ​​कि गैर-नेस्टेड मॉडल के लिए); ये मैकफेडन के छद्म आर-स्क्वेर्ड को देखने के लिए बस संभव तरीके हैं; हालांकि, मुझे लगता है कि ये दो दृष्टिकोण रास्ता बंद कर रहे हैं, इस प्रकार कारण है कि मैं यहां यह सवाल पूछ रहा हूं।

मैंने इस विषय पर काफी शोध किया है, और मुझे अभी तक इसका जवाब नहीं मिल पाया है कि मैं मैकफैडेन के छद्म आर-स्क्वेर 0.192 की व्याख्या करने में सक्षम होने के संदर्भ में खोज रहा हूं। किसी भी अंतर्दृष्टि और / या संदर्भों की बहुत सराहना की जाती है! इस प्रश्न का उत्तर देने से पहले, मुझे पता है कि लॉजिस्टिक रिग्रेशन मॉडल का वर्णन करने के लिए यह सबसे अच्छा उपाय नहीं है, लेकिन मैं इस स्टैटिस्टिक्स की अधिक समझ रखना चाहूंगा!

जवाबों:


34

इसलिए मुझे लगा कि मैंने मैकडैडन के छद्म आर 2 के बारे में जो कुछ सीखा है वह उचित उत्तर के रूप में प्राप्त करूंगा।

मैकफैडेन के छद्म आर 2 के लिए मैं देख सकता हूं कि अर्ध-संदर्भ: मैकफैडेन, डी। (1974) "गुणात्मक पसंद व्यवहार का सशर्त लॉगिट विश्लेषण।" पीपी। पी। ज़ेरेम्बका (एड।), फ्रंटियर्स इन इकोनोमेट्रिक्स में 105-142। अकादमिक प्रेस। http://eml.berkeley.edu/~mcfadden/travel.html चित्र ५.५ ओएलएस से आरओ-स्क्वेर्ड और पारंपरिक आर 2 उपायों के बीच संबंध को दर्शाता है। मेरी व्याख्या है कि rho-squared के बड़े मूल्य (McFadden के छद्म R2) छोटे लोगों की तुलना में बेहतर हैं।

मैकफैडेन के छद्म आर 2 की 0.2-0.4 के बीच की व्याख्या एक पुस्तक अध्याय से आती है जिसमें उन्होंने योगदान दिया था: बाहवीउराल यात्रा मॉडलिंग। डेविड हेन्शर और पीटर स्टॉफ़र द्वारा संपादित। 1979. मैकफैडेन ने Ch का योगदान दिया। 15 "व्यक्तियों पर यात्रा व्यवहार का विश्लेषण करने के लिए मात्रात्मक तरीके: कुछ हालिया विकास"। मॉडल मूल्यांकन की चर्चा (बहुराष्ट्रीय लॉगिट मॉडल के संदर्भ में) पृष्ठ 306 से शुरू होती है जहां वह आरएच-स्क्वेर (मैकफैडेन के छद्म आर 2) का परिचय देता है। मैकफैडेन ने कहा है "जबकि आर 2 इंडेक्स योजनाकार के लिए एक अधिक परिचित अवधारणा है जो ओएलएस में अनुभव किए जाते हैं, यह एमएल अनुमान के लिए आरएच-स्क्वेर्ड माप के रूप में अच्छी तरह से व्यवहार नहीं किया जाता है। आरएच-स्क्वैर्ड से अपरिचित लोगों को यह अनुमान लगाना चाहिए कि इसके मूल्य हैं। R2 इंडेक्स के उन लोगों की तुलना में काफी कम है ... उदाहरण के लिए, rho-squared के लिए 0.2 से 0.4 के मान उत्कृष्ट फिट का प्रतिनिधित्व करते हैं।

तो मूल रूप से, rho-squared की व्याख्या R2 की तरह की जा सकती है, लेकिन इसके बड़े होने की उम्मीद न करें। और 0.2-0.4 से मान इंगित करते हैं (मैकफेडन के शब्दों में) उत्कृष्ट मॉडल फिट।


अच्छा रैप-अप, क्रिस। आपके प्रयासों के लिए धन्यवाद!
मैट रीचेनबाक

: मैं देर से चर्चा करने के लिए आ गया है, लेकिन मैं इस लिंक छोड़ देंगे, जहां वे अन्य समायोजन उपायों की तुलना में आर 2 MacFadden समझाने statisticalhorizons.com/r2logistic
sergiouribe

13

मैकफैडेन के R वर्ग को 1-l_mod / l_null के रूप में परिभाषित किया गया है, जहाँ l_mod फिट मॉडल के लिए लॉग लाइबिलिटी मान है और l_null शून्य मॉडल के लिए लॉग संभावना है, जिसमें केवल एक अवरोधक होता है जिसमें भविष्यवक्ता भी शामिल होता है (ताकि हर व्यक्ति की भविष्यवाणी समान हो। सफलता की')।

लॉजिस्टिक रिग्रेशन मॉडल के लिए लॉग लाइबिलिटी वैल्यू हमेशा नकारात्मक होती है (क्योंकि प्रत्येक अवलोकन से संभावना का योगदान 0 और 1 के बीच की संभावना है)। यदि आपका मॉडल वास्तव में अशक्त मॉडल की तुलना में बेहतर परिणाम की भविष्यवाणी नहीं करता है, तो l_mod l_null की तुलना में बहुत बड़ा नहीं होगा, और इसलिए l_mod / l_null लगभग 1 है, और McFadden का R वर्ग 0 के करीब है (आपके मॉडल का कोई अनुमानित मूल्य नहीं है) ।

इसके विपरीत यदि आपका मॉडल वास्तव में अच्छा था, तो एक सफलता (1) के परिणाम वाले व्यक्तियों में 1 के करीब एक फिट होने की संभावना होगी, और एक विफलता (0) के परिणाम के लिए इसके विपरीत। इस मामले में यदि आप संभावना गणना के माध्यम से जाते हैं, तो आपके मॉडल के लिए प्रत्येक व्यक्ति से संभावना योगदान शून्य के करीब होगा, जैसे कि l_mod शून्य के करीब है, और मैकफैडेन का आर स्क्वेर्ड 1 के करीब है, बहुत अच्छी भविष्यवाणी की क्षमता का संकेत देता है।

जैसा कि एक अच्छा मूल्य माना जा सकता है, मेरा व्यक्तिगत विचार यह है कि आंकड़ों में इसी तरह के प्रश्न (जैसे कि एक बड़े सहसंबंध का गठन क्या है?), यह एक निश्चित उत्तर नहीं हो सकता है। पिछले साल मैंने McFadden के R के बारे में एक ब्लॉग पोस्ट लिखा जो लॉजिस्टिक रिग्रेशन में था, जिसमें कुछ और सिमुलेशन इलस्ट्रेशन हैं।


5

मैंने इस विषय पर कुछ और केंद्रित शोध किया, और मैंने पाया कि मैकफैडेन के छद्म आर-स्क्वेर्ड (इसकी संभावना अनुपात के रूप में भी जाना जाता है) की व्याख्या स्पष्ट नहीं है; हालाँकि, यह 0 से 1 तक हो सकता है, लेकिन इसकी गणना के परिणामस्वरूप कभी भी 1 या 1 से अधिक नहीं पहुंचेगा।

अंगूठे का एक नियम जो मुझे काफी मददगार लगा वह यह है कि मैकफेडन का छद्म आर-वर्ग 0.2 से 0.4 तक का होता है जो बहुत अच्छा मॉडल फिट दर्शाता है। इस तरह, मैकफ़ेडन के छद्म आर-स्क्वाड के साथ ऊपर उल्लिखित मॉडल 0.192 की संभावना है, कम से कम इस मीट्रिक द्वारा एक भयानक मॉडल नहीं है, लेकिन यह विशेष रूप से मजबूत भी नहीं है।

यह भी ध्यान रखना महत्वपूर्ण है कि मैकफैडेन के छद्म आर-वर्ग को एक ही मॉडल (यानी नेस्टेड मॉडल) के विभिन्न विनिर्देशों की तुलना करने के लिए सबसे अच्छा उपयोग किया जाता है। उपर्युक्त उदाहरण के संदर्भ में, 6 चर मॉडल (मैकफैडेन के छद्म आर-स्क्वेर = 0.192) 5 चर मॉडल (मैकफैडेन के छद्म आर-स्क्वेर / 0.131) की तुलना में डेटा को बेहतर तरीके से फिट करता है, जिसे मैंने लॉग-लाइबिलिटी अनुपात परीक्षण का उपयोग करके औपचारिक रूप से परीक्षण किया है। , जो इंगित करता है कि दो मॉडलों के बीच एक महत्वपूर्ण अंतर ( पी <0.001) है, और इस प्रकार दिए गए डेटासेट के लिए 6 चर मॉडल पसंद किया जाता है।


1
जो संदर्भ आपको मिला है, जो मैकफैडेन के आर 2 को 0.2 - 0.4 के बीच दावा करता है, वह "बहुत अच्छा" फिट है?
क्रिस

Btw ... यहाँ मूल मैकफ़ेडन लेख का एक संदर्भ और लिंक है जहाँ वह अपने छद्म आर 2 माप को परिभाषित करता है। मैकफैडेन, डी। (1974) "गुणात्मक पसंद व्यवहार के सशर्त लॉगिट विश्लेषण।" पीपी। पी। ज़ेरेम्बका (एड।), फ्रंटियर्स इन इकोनोमेट्रिक्स में 105-142। अकादमिक प्रेस। elsa.berkeley.edu/reprints/mcfadden/zarembka.pdf
क्रिस

1
संदर्भ के लिए धन्यवाद। ऐसा प्रतीत होता है कि मैकफैडेन का बहुत सारा काम उनकी बर्कले वेबसाइट पर पाया जा सकता है। नीचे पूरी किताब का लिंक दिया गया है जो आप ऊपर बता रहे हैं : elsa.berkeley.edu/users/mcfadden/travel.html सभी अध्याय PDF के रूप में दिखाई देते हैं। Rho- स्क्वायर (मैकफैडेन के छद्म आर 2) का उल्लेख अध्याय 5 में किया गया है। पृष्ठ 122 इसके बाद (समीकरण 5.33 देखें और इसके तुरंत बाद का ग्राफ)। मुझे 0.2-0.4 = "वीजी मॉडल फिट" का कोई उल्लेख नहीं दिखता है। मैं इस "अंगूठे के नियम" के सेमिनल उपस्थिति के लिए खोज करता रहूंगा। आपकी सहायताके लिए धन्यवाद!
क्रिस

1
कोई बात नहीं! मैं आपकी जिज्ञासा और संपूर्णता की सराहना करता हूं। सटीक वाक्यांश lifesciencesite.com/lsj/life1002/… पर पाया जा सकता है , जहां लेखक बताते हैं "मैकडैडेन के छद्म आर-वर्ग (ρ2) का उपयोग करके एक अच्छाई-से-फिट का उपयोग समग्र मॉडल के लिए किया जाता है। मैकफैडेन ने ρ2 का सुझाव दिया। 0.2 और 0.4 के बीच के मूल्यों को मॉडल के बहुत अच्छे फिट का प्रतिनिधित्व करने के लिए लिया जाना चाहिए (लौविएर एट अल।, 2000)। "
मैट रीचेनबैक

4
मेरी संस्था के पास लूविरे एट अल (2000) की एक इलेक्ट्रॉनिक प्रति है। "स्टैटेड चॉइस मेथड्स: एनालिसिस एंड एप्लीकेशन्स"। कैम्ब्रिज यूनिवर्सिटी प्रेस। यह संदर्भ है कि ली (लाइफ साइंस जर्नल) {0.2-0.4} = "वीजी फिट" में आरएच-स्क्वायर के लिए उद्धृत करता है। लौविरे के पृष्ठ 55 पर (समीकरण 3.32 से जुड़े) हम निम्नलिखित उद्धरण देखते हैं: "0.2-0.4 के बीच आरोह-वर्ग के मान को बहुत अच्छे मॉडल के संकेत के रूप में माना जाता है। डोमिनिच और मैकफैडेन (1975) द्वारा सीमाएँ इस श्रेणी के समकक्ष हैं। एक रैखिक फ़ंक्शन के लिए 0.7 से 0.9 "।
क्रिस

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.