एक प्रतिगमन रेखा के साथ आने वाले मूल्यों के प्रतिशत से संबंधित निर्धारण का सहसंबंध या गुणांक क्या है?


12

सहसंबंध, , दो चर के बीच रैखिक संघ का एक उपाय है। निर्धारण का गुणांक, , एक माप है कि एक चर में परिवर्तनशीलता का कितना "दूसरे में भिन्नता" द्वारा समझाया जा सकता है।आर 2rr2

उदाहरण के लिए, यदि दो चर के बीच संबंध है, तो । इसलिए, एक में परिवर्तनशीलता का 64% दूसरे में अंतर से समझाया जा सकता है। सही?आर 2 = 0.64r=0.8r2=0.64

मेरा प्रश्न है, उदाहरण के लिए कहा गया है, निम्नलिखित में से कोई एक कथन सही है?

  1. 64% मूल्य प्रतिगमन रेखा के साथ आते हैं
  2. 80% मूल्य प्रतिगमन रेखा के साथ आते हैं

शब्द "साथ गिरना" अपवित्र है। ऐसा प्रतीत होता है कि कम से कम कुछ उत्तर इसकी व्याख्या करते हैं कि यह "बिल्कुल ठीक है", और वहां उत्तर स्पष्ट रूप से नहीं है (हालांकि यह विचार रैखिक संघ के एक दिलचस्प उपाय को जन्म दे सकता है जो कुछ विशेष स्थितियों में उपयुक्त हो सकता है - जैसे कि वहां समय के जो भी हो, शोर और त्रुटि का एक मिश्रण था, और कुछ त्रुटि कभी-कभी, जैसे कि कुछ दूषित प्रक्रिया के साथ - और फिर आप उस डेटा के अनुपात का आकलन कर रहे हैं जो अनियंत्रित है)। यदि आप का अर्थ "बिल्कुल ठीक रखना" के अलावा है, तो आपको यह निर्दिष्ट करने की आवश्यकता होगी कि इसका अर्थ क्या था।
Glen_b -Reinstate मोनिका

जवाबों:


8

इसका पहला भाग मूल रूप से सही है - लेकिन यह 64% बदलाव मॉडल द्वारा समझाया गया है। एक सरल रैखिक प्रतिगमन में: Y ~ X, यदि है .64 इसका मतलब है कि Y में भिन्नता का 64% Y और X के बीच रैखिक संबंध से निर्धारित होता है। बहुत कम साथ एक मजबूत संबंध होना संभव है , अगर संबंध दृढ़ता से गैर-रैखिक है।R2R2

आपके दो गिने सवालों के बारे में, न तो सही है। वास्तव में, यह संभव है कि कोई भी बिंदु प्रतिगमन रेखा पर बिल्कुल झूठ नहीं बोल सकता है । जो नापा नहीं जा रहा है। बल्कि, यह एक सवाल है कि औसत बिंदु लाइन के कितने करीब है। यदि सभी या लगभग सभी बिंदु करीब हैं (भले ही कोई भी लाइन पर बिल्कुल न हो) तो उच्च होगा। यदि अधिकांश बिंदु रेखा से दूर हैं, तो कम होगा। यदि अधिकांश बिंदु करीब हैं, लेकिन कुछ दूर हैं, तो प्रतिगमन गलत है (आउटलेयर की समस्या)। अन्य चीजें भी गलत हो सकती हैं।R2R2

इसके अलावा, मैंने अस्पष्ट "बल्कि" की धारणा को छोड़ दिया है। यह इस बात पर निर्भर करेगा कि एक्स के फैलाव कैसे होते हैं। इन धारणाओं को सटीक बनाना आप प्रतिगमन पर एक पाठ्यक्रम में जो सीखते हैं उसका हिस्सा है; मैं इसे यहाँ नहीं मिलेगा।


खैर यह मेरे लिए बहुत कुछ साफ कर दिया! धन्यवाद मीमशॉट और पीटर फ्लॉम! आप दोनों का बहुत-बहुत आभार! :)
ब्रैडेक्स

1
+1, अच्छा जवाब, क्या आप "वास्तव में, [ऐसा संभव है कि] कोई भी बात झूठ नहीं हो सकती है" को जोड़ने का मन करेगा। इसके अलावा, यह चर्चा के लायक हो सकता है कि लाइन से बिंदुएं कितनी दूर हैं, इस बात की धारणा भी एक्स के हैं कि कैसे फैली है।
गंग -

15

आप अपने बयान के पहले भाग के साथ सही हैं। निर्धारण के गुणांक की व्याख्या करने का सामान्य तरीका आश्रित चर ( ) की भिन्नता का प्रतिशत है जिसे हम व्याख्यात्मक चर के साथ समझाने में सक्षम हैं। निर्धारण के गुणांक की सटीक व्याख्या और व्युत्पत्ति यहां पाई जा सकती हैR2yVar(y)R2

http://economictheoryblog.com/2014/11/05/the-coefficient-of-determination-latex-r2/

हालांकि, निर्धारण के गुणांक की एक कम ज्ञात व्याख्या है, इसे व्याख्यायित मान और सज्जित मानों के बीच रूप में चुकता पीयरसन सहसंबंध गुणांक के रूप में व्याख्या करना है । यह प्रमाण कि निर्धारण का गुणांक स्क्वेयर्ड पियर्सन सहसंबंध के बराबर है, मनाया मान और सज्जित मानों के बीच गुणांक यहां पाया जा सकता है।R2yiy^iyiy^i

http://economictheoryblog.com/2014/11/05/proof/

मेरे विचार से ये दृढ़ संकल्प के गुणांक की व्याख्या करने के एकमात्र सार्थक तरीके हैं । यह इस प्रकार है कि आपके द्वारा दिए गए दो कथन से प्राप्त नहीं किए जा सकते हैं ।R2R2


2
मैं नहीं कर रहा हूँ यकीन है कि वहाँ व्याख्या करने के लिए केवल दो तरीके हैं ( निश्चित रूप से अधिक व्याख्या करने के लिए दो तरीके से कर रहे हैं ), लेकिन कारण यह इस प्रकार है कि दिए गए दो बयानों से प्राप्त नहीं किया जा सकता यह है कि वे झूठी (कारणों के लिए @PeterFlom बताते हैं) इसके बजाय कोई अन्य व्याख्या संभव नहीं है। लेकिन मुझे लगता है अन्यथा यह एक अच्छा जवाब है। R2rR2
सिल्वरफिश

2
यदि भविष्य में दिए गए लिंक किसी बिंदु पर मृत हो जाते हैं (लिंकरोट एक शाश्वत समस्या है - हम संभव होने पर उत्तर को आत्म-निहित बनाना पसंद करते हैं, लेकिन स्पष्ट रूप से यह प्रश्न पूर्ण प्रमाण के लिए नहीं बुलाता है, इसलिए लिंक समीचीन है), हमारे पास कुछ हैं और , यहाँ , यहाँ , यहाँ और अधिक ज्यामितीय रूप से, के बीच संबंध का कवरेज । Corr(y,y^)R2
सिल्वरफिश

2

नीटर 1 या 2 सही नहीं है।

मान लें कि आप का उपयोग करते हुए मानों के एक सेट से मानों के एक सेट की भविष्यवाणी करने की कोशिश कर रहे हैं । आपका मॉडल हैyyxx

yi=b+mxi+ϵi

जहां कुछ शोर है। अर्थ है कि आपके मॉडल के तहत में परिवर्तनशीलता द्वारा 64% विचरण को समझाया जा सकता है । अवशिष्ट विचरण ( यानी , विचरण अस्पष्टीकृत) 0.36 है। अर्थात्, यदि:ϵiN(0,σ2)R2=.64yx

y^i=b+mxi

फिर

10.64=0.36=var(yyy^y^)var(yy)
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.