और सहसंबंध गुणांक के बीच संबंध


39

मान लीजिए कि मेरे पास दो 1-आयामी सरणियाँ, और । प्रत्येक में 100 डेटा पॉइंट होते हैं। वास्तविक डेटा है, और मॉडल भविष्यवाणी है। इस स्थिति में, मान होगा: इस बीच, यह सहसंबंध गुणांक के वर्ग मान के बराबर होगा, अब अगर मैं दो स्वैप करता हूं: a_2 वास्तविक डेटा है, और a_1 मॉडल भविष्यवाणी है। समीकरण (2) से , क्योंकि सहसंबंध गुणांक परवाह नहीं करता है जो पहले आता है, दएक 2 एक 1 एक 2 आर 2 आर 2 = 1 - एस एस आर एसa1a2a1a2R2

R2=1SSresSStot  (1).
R2=(Correlation Coefficient)2(2).
a2a1(2)R2 मान समान होगा। हालांकि, समीकरण से (1) , SStot=i(yiy¯)2 , R2 मूल्य बदल जाएगा, क्योंकि SStot अगर हम स्विच बदल गया है y से a1 को a2 ; इस बीच, SSres=i(fiy¯)2 नहीं बदलता है।

मेरा सवाल है: ये एक दूसरे के विरोधाभास कैसे कर सकते हैं?

संपादित करें :

  1. मैं सोच रहा था कि, क्या इक में रिश्ता होगा। (२) अभी भी खड़ा है, अगर यह एक सरल रैखिक प्रतिगमन नहीं है, अर्थात, IV और DV के बीच संबंध रैखिक नहीं है (घातांक / लॉग हो सकता है)?

  2. क्या यह संबंध अभी भी खड़ा होगा, अगर भविष्यवाणी की त्रुटियों का योग शून्य के बराबर नहीं है?


मुझे यह प्रस्तुति बहुत उपयोगी और गैर तकनीकी
लगी

जवाबों:


19

यह सच है कि बदल जाएगा ... लेकिन आप इस तथ्य को भूल गए कि वर्गों का प्रतिगमन योग भी बदल जाएगा। तो आइए सरल प्रतिगमन मॉडल पर विचार करें और सहसंबंध गुणांक को , जहां मैंने उप-सूचकांक का उपयोग किया था इस तथ्य पर जोर दें कि स्वतंत्र चर है और निर्भर चर है। जाहिर है, अपरिवर्तित है यदि आप को साथ स्वैप करते हैं । हम आसानी से दिखा सकते हैं कि , जहां वर्गों का प्रतिगमन योग है और r 2 x y = S 2 x ySStot एक्सyएक्सवाईआर2 एक्स y एक्सवाईएसएसआरxy=एसवाईवाई(आर2 एक्स y )एसएसआरएक्सवाईएसवाईyएक्सवाईआर2 एक्स y =एसएसआरएक्सyrxy2=Sxy2SxxSyyxyxyrxy2xySSRxy=Syy(Rxy2)SSRxySyyवर्गों का कुल योग है जहां स्वतंत्र है और निर्भर चर है। इसलिए: जहां है वर्गों के संबंधित अवशिष्ट योग जहां स्वतंत्र है और निर्भर चर है। ध्यान दें कि इस मामले में, हमारे पास साथ (उदाहरण देखें (34) - ( 41) यहाँ ।) इसलिए:स्पष्ट रूप से ऊपर समीकरण संबंध में सममित हैxyएसएसएक्सyएक्सवाईएसएसएक्सy=b2 एक्स वाई एसएक्सएक्स=एसxy

Rxy2=SSRxySyy=SyySSExySyy,
SSExyxySSExy=bxy2Sxx R2 x y =Syy- S 2 x yb=SxySxx
Rxy2=SyySxy2Sxx2.SxxSyy=SyySxxSxy2Sxx.Syy.
xऔर । दूसरे शब्दों में:जब आप सरल प्रतिगमन मॉडल में साथ बदलते हैं, तो संक्षेप में, दोनों के अंश और भाजक एक तरह से बदल जाएंगे जिससेy
Rxy2=Ryx2.
xyRxy2=SSRxySyyRxy2=Ryx2.

आपको बहुत - बहुत धन्यवाद! मैंने देखा कि यह वह जगह हो सकती है जहां मैं गलत था: केवल खड़ा है अगर 1) मॉडल भविष्यवाणी एक सीधी रेखा है और 2) मॉडल भविष्यवाणी का मतलब नमूना बिंदुओं के माध्य के बराबर होता है। यदि DV और IV के बीच संबंध एक सीधी रेखा नहीं है, या भविष्यवाणी त्रुटियों का योग गैर-शून्य है, तो संबंध नहीं होगा। क्या आप मुझे बता सकते हैं कि क्या यह सही है? R2=r2
शॉन वांग

1
मैंने इस बारे में सोचा क्योंकि आप का उपयोग कर रहे हैं, जबकि मैं ओपी में पोस्ट किए गए समीकरण का उपयोग कर रहा था। ये दो समीकरण केवल एक दूसरे के समतुल्य हैं जब भविष्यवाणी त्रुटियों का योग शून्य होता है। इसलिए, मेरे ओपी में, नहीं बदलता है जबकि बदल जाता है, और इसलिए बदल जाता है। R2=SSreg/SStotSSres=i(fiy¯)2SStotR2
शॉन वांग

क्या आपके पास इस बात का संदर्भ है कि पी-वेरेट गॉसियंस के सामान्य मामले के लिए इसे कैसे काम करना है?
जेएमबी

26

निर्धारण के गुणांक की व्याख्या करने का एक तरीका यह है कि इसे देखे गए मानों और सज्जित मानों के बीच बीच चुकता पीयरसन सहसंबंध गुणांक के रूप में देखा ।R2yiy^i

देखे गए मान yi और फिट किए गए मान y ^ के बीच स्क्वेयर्ड पियर्सन सहसंबंध गुणांक से निर्धारण R2 के गुणांक को कैसे प्राप्त किया जाए, इसका पूरा प्रमाण निम्न लिंक के तहत पाया जा सकता है:

http://economictheoryblog.wordpress.com/2014/11/05/proof/

मेरी नजर में इसे समझना बहुत आसान होना चाहिए, बस सिंगल स्टेप्स को फॉलो करना चाहिए। मुझे लगता है कि यह समझना आवश्यक है कि वास्तव में दो प्रमुख आंकड़ों के बीच का रीयलटियन कैसे काम करता है।


6

केवल एक भविष्यवक्ता साथ सरल रैखिक प्रतिगमन के मामले में । लेकिन एक से अधिक भविष्यवाणियों के साथ कई रेखीय प्रतिगमन में भविष्यवाणियों और प्रतिक्रिया के बीच सहसंबंध की अवधारणा स्वचालित रूप से विस्तारित नहीं होती है। सूत्र मिलता है: R2=r2=Corr(x,y)2

R2=Corr(yestimated,yobserved)2

प्रतिक्रिया और सज्जित रैखिक मॉडल के बीच सहसंबंध का वर्ग।


5

@ स्टेट ने एक विस्तृत जवाब दिया है। अपने संक्षिप्त उत्तर में मैं कुछ अलग तरीके से दिखाऊंगा कि और बीच समानता और अंतर क्या है ।rr2

r , द्वारा या द्वारा का मानकीकृत प्रतिगमन गुणांक बीटा है और इस तरह, यह (पारस्परिक) प्रभाव आकार का एक माप है । जिसे सबसे स्पष्ट रूप से देखा जाता है जब चर द्विगुणित होते हैं। फिर , उदाहरण के लिए मतलब है कि 30% मामले एक चर में इसके मूल्य को विपरीत में बदल देंगे, जब दूसरा चर इसके मूल्य को विपरीत में बदल देगा।YXXYr.30

r2 , दूसरी ओर, कुल परिवर्तनशीलता में सह-परिवर्तनशीलता के अनुपात की अभिव्यक्ति है : । ध्यान दें कि यह दो अनुपातों का एक उत्पाद है, या, कहने के लिए अधिक सटीक, दो अनुपात (एक अनुपात> 1 हो सकता है)। यदि शिथिलता या प्रवृत्ति होने के लिए किसी भी अनुपात या अनुपात को शिथिल किया जाता है, तो "संयुक्त संभावना (प्रवृत्ति)" को व्यक्त करता है। दो अनुपातों (या अनुपात) के संयुक्त उत्पाद के लिए एक और और मान्य अभिव्यक्ति उनके ज्यामितीय माध्य, , जो बहुत ही ।r2=(covσxσy)2=|cov|σx2|cov|σy2r2proppropr

(दो अनुपात, गुणक, additive नहीं विचार है कि वे सहयोग पर जोर देना हैं और एक दूसरे के लिए क्षतिपूर्ति नहीं कर सकता, उनके साथ काम में। वे गुणक हो सकता है क्योंकि की भयावहता है पर निर्भर है दोनों परिमाण और और, अनुरूपता से, । आदेश अपने आप में एक उचित "साझा विचरण का अनुपात" लेकिन कन्वर्ट करने के लिए में - एक बार में दो बार विभाजित हो गया है , "पार विचरण", दोनों के साथ साझा करता ही माप इकाइयों और ," स्व- ", और साथ नहींcovσx2σy2covcovσx2σy2σxσy, "हाइब्रिड विचरण"; यही कारण है कि , नहीं , "साझा प्रसरण के अनुपात" के रूप में अधिक पर्याप्त है।r2r

तो, आप देखते हैं कि अर्थ की और संघ की मात्रा का एक उपाय के रूप में विभिन्न (दोनों वैध अर्थ), लेकिन अभी भी कोई रास्ता नहीं एक दूसरे के विरोध में इन गुणांक है। और दोनों समान हैं चाहे आप या भविष्यवाणी करते हैं ।rr2Y~XX~Y


आपको बहुत - बहुत धन्यवाद! मुझे आश्चर्य है कि क्या मैं गलत परिभाषा का उपयोग कर रहा हूं, कि की दो परिभाषाएं मौजूद हैं और वे एक दूसरे के बराबर नहीं हैं। क्या आप मुझे इस सवाल में मदद कर सकते हैं कि - अगर मैं अधिक सामान्यीकृत मामलों के बारे में सोच रहा हूं जहां मॉडल एक सरल रैखिक प्रतिगमन नहीं हो सकता है (घातांक हो सकता है) - क्या ओ में मेरी समीकरण अभी भी गणना के लिए सही है ? क्या यह एक अलग मात्रा है, जिसे भी कहा जाता है , लेकिन "निर्धारण के गुणांक" से अलग है? R2R2R2
शॉन वांग

निर्धारण या आर-स्क्वायर का गुणांक r ^ 2 की तुलना में एक व्यापक अवधारणा है जो केवल सरल रैखिक प्रतिगमन के बारे में है। कृपया विकिपीडिया en.wikipedia.org/wiki/Coefficient_of_determination पढ़ें ।
ttnphns

एक बार फिर धन्यवाद! वह मैं समझता हूं। मेरा प्रश्न है: अधिक जटिल प्रतिगमन के लिए, क्या मैं अभी भी निर्धारण के गुणांक प्राप्त करने के लिए r मान को वर्ग कर सकता हूं?
शॉन वांग

1
एक "जटिल प्रतिगमन" के लिए, आपको आर-स्क्वायर मिलता है, लेकिन आपको आर नहीं मिलता है।
ttnphns

1

मुझे लगता है कि आपसे गलती हो सकती है। यदि , मुझे लगता है कि आपके पास एक द्विभाजित मॉडल है: एक DV, एक IV। मुझे नहीं लगता कि यदि आप इन स्वैप करते हैं तो बदल जाएगा, और न ही यदि आप IV की भविष्यवाणियों को प्रतिस्थापित करते हैं DV जो IV पर आधारित हैं। यहाँ R में एक प्रदर्शन के लिए कोड है:R2=r2R2

x=rnorm(1000); y=rnorm(1000)              # store random data
summary(lm(y~x))                          # fit a linear regression model (a)
summary(lm(x~y))                          # swap variables and fit the opposite model (b)
z=lm(y~x)$fitted.values; summary(lm(y~z)) # substitute predictions for IV in model (a)

यदि आप एक बाईवेरेट मॉडल के साथ काम नहीं कर रहे हैं, तो DV की आपकी पसंद को प्रभावित करेगी ... जब तक कि आपके चर सभी समान रूप से सहसंबद्ध नहीं होते हैं, मुझे लगता है, लेकिन यह बहुत अपवाद नहीं है। यदि सभी चर में सहसंबंध की समान ताकत है और DV के विचरण के समान भागों को भी साझा करते हैं (जैसे [या शायद "अर्थात", ", यदि कुछ चर पूरी तरह समान हैं), तो आप इसे खोए बिना एक bivariar मॉडल में कम कर सकते हैं कोई भी जानकारी। चाहे आप करें या न करें, अभी भी नहीं बदलेगा।R2R2

अन्य सभी मामलों में, मैं दो से अधिक चरों के साथ सोच सकता हूं, जहां दृढ़ संकल्प का गुणांक है और किसी भी तरह का द्विभाजित सहसंबंध गुणांक है (जरूरी नहीं कि पियर्सन भी; जैसे, संभवतः भी एक स्पीयरमैन की )।R 2 r ρR2r2R2rρ


1
मैंने हाल ही में Theil रेखीय प्रतिगमन किया, फिर और गणना की । मैंने एक्सेल का उत्पादन देखा है रूल्स भी, और पहले तो मुझे इस पर हंसी आई, फिर धीरे-धीरे समझ में आया और यह मजाकिया रूप में बंद हो गया। तो की सामान्य परिभाषा सही है? क्या देता है। R2=0.1468SSR>SSTR2R2
कार्ल
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.