क्यों स्क्वेरिंग समझाया विचरण करता है?


13

यह एक मूल प्रश्न हो सकता है, लेकिन मैं सोच रहा था कि एक प्रतिगमन मॉडल में एक मूल्य को केवल स्पष्ट गठबंधन का आंकड़ा देने के लिए क्यों चुकता किया जा सकता है?R

मैं समझता हूं कि गुणांक एक रिश्ते की ताकत दे सकता है, लेकिन मुझे समझ में नहीं आता है कि कैसे इस मूल्य को चुकता करने से समझाया गया विचरण का एक माप दिया जाता है।R

इसका कोई आसान स्पष्टीकरण?

इसके साथ मदद करने के लिए बहुत बहुत धन्यवाद!


क्या आप कुछ सहज या अधिक गणितीय खोज रहे हैं? क्या आपने इस साइट पर और सहसंबंध गुणांक के कुछ अन्य प्रश्नों के माध्यम से देखा है ? R2
कार्डिनल

1
दो संबंधित प्रश्न यहाँ और यहाँ हैं , उदाहरण के लिए। यदि आप वहां के समीकरणों के साथ खेलते हैं, तो आप गणितीय समानता प्राप्त कर सकेंगे। लेकिन, न तो अंतर्ज्ञान दृष्टिकोण से विशेष रूप से सहायक होने की संभावना है।
कार्डिनल

मैं इसे विपरीत तरीके से देखता हूं। यह R वर्ग है जिसे 1-प्रकार के विचरण / कुल विचरण के रूप में परिभाषित किया गया है और फिर R उस के बाद का वर्गमूल है। यह बस तब होता है जब हमारे पास सरल रैखिक प्रतिगमन आर वर्ग सहसंबंध गुणांक के वर्ग को कम कर देता है।
माइकल आर। चेरनिक

@ मिचेल, आपने निस्संदेह सकारात्मक के बजाय उचित रूप से हस्ताक्षरित वर्गमूल कहने का इरादा किया है ।
कार्डिनल

1
@कार्डिनल, मेरी एक ही धारणा है - (या ) नमूना सहसंबंध गुणांक को संदर्भित करता है और एक व्यापक रूप से उपयोग किए जाने वाले संदर्भ को देखकर आश्चर्य होगा जो नमूना सहसंबंध के निरपेक्ष मूल्य को संदर्भित करने के लिए उपयोग करता हैआरRr
मैक्रो

जवाबों:


16

हाथ से लहराते, सहसंबंध को दो वैक्टर, आश्रित वेक्टर Y और स्वतंत्र वेक्टर X के बीच के कोण के माप के रूप में सोचा जा सकता है । वैक्टर बीच का कोण है तो θ , सहसंबंध आर है क्योंकि ( θ )X द्वारा समझाया गया Y का भाग लंबाई का है | | | | क्योंकि ( θ ) और के समानांतर है एक्स (या के प्रक्षेपण Y पर एक्स )। जो हिस्सा नहीं बताया गया है, वह लंबाई का हैRYXθRcos(θ)YX||Y||cos(θ)XYX और के लिए ओर्थोगोनल है एक्स । प्रसरण के संदर्भ में, हमारे पास σ 2 Y = σ 2 वाई क्योंकि 2 ( θ ) + σ 2 वाई पाप 2 ( θ ) जहां सही पर पहले कार्यकाल विचरण और दूसरा अस्पष्टीकृत विचरण समझाया है। समझाया गया अंश इस प्रकार R 2 है , R नहीं।||Y||sin(θ)X

σY2=σY2cos2(θ)+σY2sin2(θ)
R2R

2
(+1) वास्तव में यहाँ बहुत ज्यादा नहीं चल रहा है। ज्यामितीय दृष्टिकोण है मेरे विचार में सबसे सहज,। वहाँ एक उच्च-गुणवत्ता वाला ओपन-सोर्स आंकड़ा होने की संभावना है जो चीजों को इस तरह से सटीक रूप से चित्रित करता है।
कार्डिनल

cor(y,y^)2R2

1
यह प्रश्न का उत्तर नहीं देता है, लेकिन दिखाता है कि आर स्क्वायर का उल्लेख आर के बिना किसी संदर्भ के सहसंबंध गुणांक के वर्ग के रूप में कैसे किया गया है। इसलिए मेरे दावे की पुष्टि या खंडन करने वाले स्रोत खोजने में मुश्किल हो सकते हैं। यह विकिपीडिया में दृढ़ संकल्प के गुणांक पर एक लेख से है:
माइकल आर Chernick

जैसा कि चुकता सहसंबंध गुणांक समान है, एक निरंतर + रैखिक मॉडल (यानी, सरल रैखिक प्रतिगमन) के साथ कम से कम वर्ग प्रतिगमन के बाद, R2 मनाया और मॉडलिंग (अनुमानित) डेटा मूल्यों के बीच सहसंबंध गुणांक के वर्ग के बराबर होता है।
माइकल आर। चेरिक

सामान्य परिस्थितियों में, मूल और मॉडल किए गए डेटा मानों के बीच सहसंबंध गुणांक के वर्ग के रूप में कभी-कभी एक आर 2 मान की गणना की जाती है। इस मामले में, मान सीधे तौर पर माप नहीं है कि मॉडल किए गए मूल्य कितने अच्छे हैं, बल्कि यह मापते हैं कि मॉडल किए गए मूल्यों से कितना अच्छा भविष्यवक्ता बनाया जा सकता है (फॉर्म α + )i के संशोधित भविष्यवक्ता बनाकर)। एवरिट (2002, पी। 78) के अनुसार, यह उपयोग विशेष रूप से "निर्धारण का गुणांक" शब्द की परिभाषा है: दो (सामान्य) चर के बीच सहसंबंध का वर्ग।
माइकल आर। चेरिक
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.