नमूना के सहसंबंध की समानता और सरल रैखिक प्रतिगमन के लिए आर स्टेटिस्टिक


10

यह अक्सर कहा जाता है कि नमूना सहसंबंध का वर्ग सरल रेखीय प्रतिगमन के लिए निर्धारण के गुणांक के बराबर है । मैं स्वयं इसे प्रदर्शित करने में असमर्थ रहा हूं और इस तथ्य के पूर्ण प्रमाण की सराहना करूंगा।r2R2


1
यदि यह एक स्व-अध्ययन प्रश्न है तो कृपया उपयुक्त टैग जोड़ें।
एंडी

यह प्रश्न यह भी पूछता है कि क्यों । R2=r2
सिल्वरफिश

जवाबों:


8

संकेतन में कुछ भिन्नता प्रतीत होती है: एक साधारण रेखीय प्रतिगमन में, मैंने आमतौर पर "नमूना सहसंबंध गुणांक" वाक्यांश को और मानों के बीच सहसंबंध के संदर्भ के रूप में देखा है । यह इस उत्तर के लिए मैंने अपनाई गई धारणा है। मैंने वही वाक्यांश और प्रतीक देखा है जो प्रेक्षित और fitted बीच सहसंबंध का उल्लेख करते हैं ; मेरे जवाब में मैंने इसे "एकाधिक सहसंबंध गुणांक" के रूप में संदर्भित किया है और प्रतीक उपयोग किया है । यह उत्तर बताता है कि निर्धारण का गुणांक का वर्ग और का वर्ग भी हैrxyवाई आर आर आरyy^RrR, इसलिए यह मायने नहीं रखता कि कौन सा उपयोग करना है।

परिणाम बीजगणित की एक पंक्ति में इस प्रकार एक बार सहसंबंध और के अर्थ के बारे में कुछ सरल तथ्यों , स्थापित कर रहे हैं ताकि आप बॉक्स्ड समीकरण के लिए नीचे छोड़ना चाहते हैं कर सकते हैं। मुझे लगता है कि हमें विशेष रूप से सह-अस्तित्व और भिन्नता के बुनियादी गुणों को साबित करने की आवश्यकता नहीं है: आरr2R

Cov(aX+b,Y)=aCov(X,Y)
Var(aX+b)=a2Var(X)

ध्यान दें कि उत्तरार्द्ध पूर्व से प्राप्त किया जा सकता है, एक बार जब हम जानते हैं कि सहसंयोजक सममित है और वह । यहाँ से हम सहसंबंध के बारे में एक और बुनियादी तथ्य प्राप्त करते हैं। के लिए , और इतने लंबे समय के रूप में और गैर शून्य प्रसरण है,एक 0 एक्स वाईVar(X)=Cov(X,X)a0XY

Cor(aX+b,Y)=Cov(aX+b,Y)Var(aX+b)Var(Y)=aa2×Cov(X,Y)Var(X)Var(Y)Cor(aX+b,Y)=sgn(a)Cor(X,Y)

यहाँ है Signum या हस्ताक्षर समारोह : अपने मूल्य है अगर और अगर । यह भी सच है कि यदि , लेकिन वह मामला हमें चिंतित नहीं करता है: एक स्थिर होगा, इसलिए in हर और हम सहसंबंध की गणना नहीं कर सकते। समरूपता के तर्क हमें इस परिणाम को सामान्य बनाते हैं, :sgn ( एक ) = + 1 एक > 0 sgn ( एक ) = - 1 एक < 0 sgn ( एक ) = 0 एक = 0 एक एक्स + वार ( एक एक्स + ) = 0 एक ,sgn(a)sgn(a)=+1a>0sgn(a)=1a<0sgn(a)=0a=0aX+bVar(aX+b)=0a,c0

Cor(aX+b,cY+d)=sgn(a)sgn(c)Cor(X,Y)

वर्तमान प्रश्न का उत्तर देने के लिए हमें इस अधिक सामान्य सूत्र की आवश्यकता नहीं होगी, लेकिन मैं इसे स्थिति की ज्यामिति पर जोर देने के लिए इसमें शामिल करता हूं: यह केवल यह बताता है कि सहसंबंध अपरिवर्तित है जब या तो चर को स्केल किया जाता है या अनुवादित किया जाता है, लेकिन चर होने पर साइन में उलट होता है। प्रतिबिंबित।

हमें एक और तथ्य की आवश्यकता है: एक निरंतर अवधि सहित एक रैखिक मॉडल के लिए, निर्धारण का गुणांक कई सहसंबंध गुणांक का वर्ग है , जो कि देखे गए प्रतिक्रियाओं और मॉडल के फिट किए गए यॉट बीच सहसंबंध है । यह कई और सरल रिग्रेसन दोनों के लिए लागू होता है, लेकिन आइए हम अपना ध्यान सरल लीनियर मॉडल । परिणाम उस अवलोकन से आता है जो कि एक छोटा, संभवतः परिलक्षित होता है, और का अनुवादित संस्करण है : आर वाई वाई वाई = β 0 + β 1 एक्स वाई एक्सR2RYY^Y^=β^0+β^1XY^X

R=Cor(Y^,Y)=Cor(β^0+β^1X,Y)=sgn(β^1)Cor(X,Y)=sgn(β^1)r

इसलिए जहां संकेत अनुमानित ढलान के संकेत से मेल खाता है, जो गारंटी देता है कि नकारात्मक नहीं है। स्पष्ट रूप से ।R R 2 = r 2R=±rRR2=r2

पूर्ववर्ती तर्क को वर्गों के विचार पर विचार न करके सरल बनाया गया था। इसे प्राप्त करने के लिए, मैं बीच संबंधों के विवरण पर छोड़ दिया , जिसे हम आम तौर पर वर्गों के योगों के संदर्भ में सोचते हैं, और , जिसके लिए हम फिट और मनाया प्रतिक्रियाओं के सहसंबंधों के बारे में सोचते हैं। प्रतीकों का संबंध तांत्रिक लगता है लेकिन ऐसा नहीं है, और यदि मॉडल में कोई अवरोधन शब्द नहीं है तो संबंध टूट जाता है! मैं एक का एक संक्षिप्त स्केच दे देंगे के बीच के रिश्ते के बारे में ज्यामितीय तर्क और एक अलग प्रश्न से लिया : चित्र में तैयार की है आयामी विषय अंतरिक्ष आर आर 2 = ( आर ) 2 आर आर 2 n एक्स 1 एनR2RR2=(R)2RR2n, इसलिए प्रत्येक अक्ष (दिखाया नहीं गया) अवलोकन की एक इकाई का प्रतिनिधित्व करता है, और चर वैक्टर के रूप में दिखाए जाते हैं। डिजाइन मैट्रिक्स कॉलम वेक्टर (निरंतर अवधि के लिए) और व्याख्यात्मक चर के अवलोकनों के वेक्टर हैं, इसलिए स्तंभ स्थान एक दो-आयामी फ्लैट है।X1n

कई प्रतिगमन के विषय स्थान में क्षेत्र

फिटेड ऑफ कॉलम ऑफ । इसका मतलब यह है कि अवशेषों का वेक्टर सपाट है, और इसलिए । डॉट उत्पाद । अवशिष्ट के रूप में शून्य और , तो ताकि और अवलोकन प्रतिक्रियाओं का हो माध्य । आरेख, में डैश रेखाएं और वाईएक्स=y - y 1एन0=1n=Σ n मैं = 1मैंYमैं= ^Y^YXe=yy^1n0=1ne=i=1neiΣ n मैं = 1 Yमैं=Σ n मैं = 1 ^ Y मैं ˉ वाई वाई- ˉ Y 1एन वाईYi=Yi^+eii=1nYi=i=1nYi^Y¯YY¯1n θ आरY^Y¯1n , इसलिए मनाया और सज्जित प्रतिक्रियाओं के लिए केन्द्रित वैक्टर हैं, और उनके बीच कोण के कोसाइन उनका सहसंबंध ।θR

त्रिकोण इन वैक्टर बच के वेक्टर के साथ फार्म समकोण के बाद से है फ्लैट में निहित है, लेकिन यह करने के लिए ओर्थोगोनल है। पाइथागोरस को लागू करना:Y^Y¯1ne

YY¯1n2=YY^2+Y^Y¯1n2

यह वर्गों के योगों का सिर्फ अपघटन है, । निर्धारण के गुणांक के लिए पारंपरिक सूत्र जो इस त्रिभुज में तो वास्तव में का वर्ग है । आप सूत्र से अधिक परिचित हो सकते हैं , जो तुरंत , लेकिन ध्यान दें कि अधिक सामान्य है, और (जैसा कि हमने अभी देखा है) 1 - S S अवशिष्टSStotal=SSresidual+SSregression 1-पाप2θ=क्योंकि2θआरआर2=एसएस प्रतिगमन1SSresidualSStotal1sin2θ=cos2θR क्योंकि2θ1-एसएस अवशिष्टR2=SSregressionSStotalcos2θ SS प्रतिगमन1SSresidualSStotalSSregressionSStotal यदि मॉडल में एक निरंतर शब्द शामिल है


अच्छा गणित और ग्राफ बनाने के प्रयासों के लिए +1 धन्यवाद !!
Haitao Du

4

के रूप में परिभाषित किया गया है चुकता नमूना सहसंबंध गुणांक: समतुल्य है, क्योंकि यह आसानी से सत्यापित किया जाता है: ( Verbeek देखें , §2.4)आर 2 = वी ( y मैं )R2

R2=V^(y^i)V^(yi)=1/(N1)i=1N(y^iy¯)21/(N1)i=1N(yiy¯)2=ESSTSS
वी(yमैं)=वी( y मैं)+वी(मैं)
r2(yi,y^i)=(i=1N(yiy¯)(y^iy¯))2(i=1N(yiy¯)2)(i=1N(y^iy¯)2)
V^(yi)=V^(y^i)+V^(ei)

क्या आप कुछ और विवरण जोड़ सकते हैं। मैं यह साबित करने की कोशिश कर रहा हूं, लेकिन बिना किसी सक्सेज के ...
समुद्र में एक बूढ़ा आदमी।
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.