एक सहसंबंध अंतर्निहित अंतर्निहित धारणाओं और महत्व के प्रतिगमन ढलान परीक्षणों के बीच अंतर


21

मेरा सवाल एक अलग सवाल की टिप्पणियों में @whuber के साथ चर्चा से बाहर हो गया ।

विशेष रूप से, @whuber की टिप्पणी इस प्रकार थी:

एक कारण यह आपको आश्चर्यचकित कर सकता है कि एक सहसंबंध परीक्षण और एक प्रतिगमन ढलान परीक्षण अंतर्निहित धारणाएं अलग हैं - इसलिए जब हम समझते हैं कि सहसंबंध और ढलान वास्तव में एक ही चीज़ को माप रहे हैं, तो उनके पी-मान समान क्यों होना चाहिए? इससे पता चलता है कि कैसे ये मुद्दे गहराई से चलते हैं कि क्या और को संख्यात्मक रूप से बराबर होना चाहिए।βआरβ

इसके बारे में मेरी सोच मिली और मुझे कई तरह के दिलचस्प जवाब मिले। उदाहरण के लिए, मुझे यह प्रश्न " सहसंबंध गुणांक का मान " मिला, लेकिन यह नहीं देख सकता कि यह ऊपर की टिप्पणी को कैसे स्पष्ट करेगा।

मुझे एक सरल रेखीय प्रतिगमन में पियर्सन के और स्लोप के संबंधों के बारे में अधिक दिलचस्प जवाब मिले ( उदाहरण के लिए यहां और यहां देखें ) लेकिन उनमें से कोई भी जवाब नहीं देता है जो @whuber ने अपनी टिप्पणी में उल्लेख किया है (कम से कम स्पष्ट रूप से) मेरे लिए)।βआरβ

प्रश्न 1: एक सहसंबंध परीक्षण और एक प्रतिगमन ढलान परीक्षण अंतर्निहित धारणाएं क्या हैं?

मेरे दूसरे प्रश्न के लिए निम्नलिखित आउटपुट पर विचार करें R:

model <- lm(Employed ~ Population, data = longley)
summary(model)

Call:
lm(formula = Employed ~ Population, data = longley)

Residuals:
    Min      1Q  Median      3Q     Max 
-1.4362 -0.9740  0.2021  0.5531  1.9048 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)   8.3807     4.4224   1.895   0.0789 .  
Population    0.4849     0.0376  12.896 3.69e-09 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 1.013 on 14 degrees of freedom
Multiple R-squared:  0.9224,    Adjusted R-squared:  0.9168 
F-statistic: 166.3 on 1 and 14 DF,  p-value: 3.693e-09

और cor.test()फ़ंक्शन का आउटपुट :

with(longley, cor.test(Population, Employed))

    Pearson's product-moment correlation

data:  Population and Employed
t = 12.8956, df = 14, p-value = 3.693e-09
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 0.8869236 0.9864676
sample estimates:
      cor 
0.9603906 

जैसा कि lm()और cov.test()आउटपुट द्वारा देखा जा सकता है , पियर्सन के सहसंबंध गुणांक और ढलान का अनुमान ( ) क्रमशः भिन्न होता है, 0.96 बनाम 0.485, लेकिन टी-मूल्य और पी-मान समान हैं।β 1आरβ1

फिर मैंने यह भी देखने की कोशिश की कि क्या मैं और लिए t-value की गणना करने में सक्षम , जो कि और भिन्न होने के बावजूद समान हैं । और यही वह जगह है जहां मैं फंस जाता हूं, कम से कम :β 1 आर β 1 आरआरβ1आरβ1आर

ढलान की गणना ( एक सरल रेखीय प्रतीपगमन में के वर्गों का कुल रकम का प्रयोग करके) एक्स और वाई :β1एक्सy

x <- longley$Population; y <- longley$Employed
xbar <- mean(x); ybar <- mean(y)
ss.x <- sum((x-xbar)^2)
ss.y <- sum((y-ybar)^2)
ss.xy <- sum((x-xbar)*(y-ybar))

गणना कम से कम वर्गों, प्रतिगमन ढलान के अनुमान लगाने के (वहाँ में इस का प्रमाण है करावली के आर बुक 1 संस्करण , पेज 393):β1

b1 <- ss.xy/ss.x                        
b1
# [1] 0.4848781

लिए मानक त्रुटि की गणना करें :β1

ss.residual <- sum((y-model$fitted)^2)
n <- length(x) # SAMPLE SIZE
k <- length(model$coef) # NUMBER OF MODEL PARAMETER (i.e. b0 and b1)
df.residual <- n-k
ms.residual <- ss.residual/df.residual # RESIDUAL MEAN SQUARE
se.b1 <- sqrt(ms.residual/ss.x)
se.b1
# [1] 0.03760029

और के लिए टी मूल्य और पी-मूल्य :β1

t.b1 <- b1/se.b1
p.b1 <- 2*pt(-abs(t.b1), df=n-2)
t.b1
# [1] 12.89559
p.b1
# [1] 3.693245e-09

क्या मैं इस बिंदु पर पता नहीं है, और यह है प्रश्न 2 है, कैसे का उपयोग कर एक ही टी-मूल्य की गणना करने, के बजाय β 1 (शायद बच्चे चरणों में)?आरβ1

मुझे लगता है कि चूंकि cor.test()वैकल्पिक परिकल्पना है कि क्या सच सहसंबंध 0 के बराबर नहीं है ( cor.test()ऊपर आउटपुट देखें ), मैं "पीयरसन सहसंबंध गुणांक के मानक त्रुटि" द्वारा विभाजित Pearson सहसंबंध गुणांक तरह कुछ उम्मीद करेंगे । ऊपर)?! लेकिन वह मानक त्रुटि क्या होगी और क्यों?आरb1/se.b1

शायद यह एक सहसंबंध परीक्षण और एक प्रतिगमन ढलान परीक्षण अंतर्निहित अंतर्निहित धारणाओं के साथ कुछ करना है !

EDIT (27-Jul-2017): जबकि @whuber ने प्रश्न 1 (और आंशिक रूप से प्रश्न 2 , उनके उत्तर के तहत टिप्पणियां देखें) के लिए एक बहुत विस्तृत विवरण प्रदान किया, मैंने कुछ और खुदाई की और पाया कि ये दोनों पोस्ट ( यहाँ और यहाँ ) करते हैं एक विशिष्ट दिखाने के मानक त्रुटि के लिए , जो जवाब देने के लिए अच्छी तरह से काम करता है प्रश्न 2 , टी मान दिया पुन: पेश करने के लिए है कि आर :आरआर

r <- 0.9603906
# n <- 16
r.se <- sqrt((1-r^2)/(n-2))
r/r.se
# [1] 12.8956

2
यह एक ही परीक्षा या कम से कम समकक्ष परीक्षा है। यदि आप इस परिकल्पना को अस्वीकार करते हैं कि सहसंबंध शून्य नहीं है तो परीक्षण भी परिकल्पना को अस्वीकार करता है कि ढलान शून्य नहीं है।
माइकल आर। चेरिक

6
@ मिचेल राइट - लेकिन यहां कई संभावित मॉडल हैं, और वे हड़ताली रूप से अलग हैं। उनमें से एक सहसंबंध के लिए एक मानक मॉडल है, जिसमें से सबसे सरल यह है कि डेटा कुछ अज्ञात बिवरिअ सामान्य वितरण से एक नमूना है। एक अन्य की प्रतिगमन के लिए एक OLS मॉडल के कुछ संस्करण है के खिलाफ एक्स दो जायके --in, फिक्स्ड regressors और यादृच्छिक regressors। एक और एक्स और वाई की भूमिकाओं को उलट देता है । यदि आपको लगता है कि ये तुलनात्मक परिकल्पना परीक्षणों के लिए समान पी-मूल्यों का उत्पादन करना चाहिए, तो संभवतः यह केवल व्यापक परिचितता के माध्यम से है, लेकिन यह सहज ज्ञान युक्त नहीं है! Yएक्सएक्सY
whuber

1
@ जब देखा कि यह क्यू इतनी अच्छी तरह से उत्कीर्ण है, लेकिन एक संतोषजनक जवाब का अभाव है, मैंने एक इनाम शुरू किया है जो आज समाप्त हो गया है; अब यह अनुग्रह अवधि में है। एक नया उत्तर पोस्ट किया गया था और यह सह-संबंध-ढलान संगणना को अच्छी तरह से समझाता है, लेकिन दावा करता है कि आपके उद्धृत कथन के विपरीत मान्यताओं में कोई अंतर नहीं है। जब तक कोई दूसरा सामने नहीं आता, तब तक मेरा इनाम इस नए जवाब के लिए स्वचालित रूप से प्रदान किया जाएगा। यदि आप अपना स्वयं का उत्तर पोस्ट करने पर विचार करेंगे, तो मैं आपको बता रहा हूँ।
अमीबा का कहना है कि मोनिका

1
@amoeba धन्यवाद; मैंने बाउंटी पर ध्यान नहीं दिया था। जब मैंने इस सवाल को उछाला तो मैंने जो टिप्पणी लिखी थी, उसका एक आंशिक खाता मैंने पोस्ट किया है। मुझे आशा है कि यह आपके द्वारा सुझाई गई दिशा में कुछ प्रगति का प्रतिनिधित्व करता है।
whuber

जवाबों:


5

परिचय

यह उत्तर प्रश्नों के इस सेट के लिए अंतर्निहित प्रेरणा को संबोधित करता है:

एक सहसंबंध परीक्षण और एक प्रतिगमन ढलान परीक्षण अंतर्निहित धारणाएं क्या हैं?

प्रश्न में प्रदान की गई पृष्ठभूमि के प्रकाश में, हालांकि, मैं इस प्रश्न का थोड़ा विस्तार करने का सुझाव देना चाहता हूं: आइए हम सहसंबंध और प्रतिगमन के विभिन्न उद्देश्यों और अवधारणाओं का पता लगाएं ।

सहसंबंध आमतौर पर उन स्थितियों में होता है जहां

  • डेटा द्विभाजित हैं: ब्याज के दो अलग-अलग मूल्य प्रत्येक "विषय" या "अवलोकन" से जुड़े हैं।

  • डेटा अवलोकन योग्य हैं: कोई भी मान प्रयोगकर्ता द्वारा निर्धारित नहीं किया गया था। दोनों को देखा या मापा गया।

  • चर के बीच किसी तरह के संबंध की पहचान, परिमाण और परीक्षण करने में रुचि निहित है।

प्रतिगमन जहां उपयोग किया जाता है

  • डेटा द्विभाजित या बहुभिन्नरूपी हैं: ब्याज के दो से अधिक भिन्न मूल्य हो सकते हैं।

  • ब्याज समझने पर ध्यान केंद्रित करता है कि चर के सबसेट के बारे में क्या कहा जा सकता है - "आश्रित" चर या "प्रतिक्रियाएं" - जो दूसरे उपसेट के बारे में जाना जा सकता है, उसके आधार पर - "स्वतंत्र" चर या "प्रतिगामी।"

  • प्रयोगकर्ताओं द्वारा रजिस्टरों के विशिष्ट मूल्य निर्धारित किए गए हो सकते हैं।

इन भिन्न उद्देश्यों और स्थितियों के कारण अलग-अलग दृष्टिकोण होते हैं। क्योंकि यह धागा उनकी समानता के बारे में चिंतित है, आइए उस मामले पर ध्यान केंद्रित करें जहां वे सबसे समान हैं: द्विभाजित डेटा। या तो मामले में उन आंकड़ों को आमतौर पर एक यादृच्छिक चर बोध के रूप में तैयार किया जाएगा । आम तौर पर, विश्लेषण के दोनों रूप इस चर के अपेक्षाकृत सरल लक्षण चाहते हैं।(एक्स,Y)

सह - संबंध

मेरा मानना ​​है कि "सहसंबंध विश्लेषण" को कभी भी परिभाषित नहीं किया गया है। क्या इसे सहसंबंध गुणांक तक सीमित किया जाना चाहिए, या इसे पीसीए, क्लस्टर विश्लेषण और विश्लेषण के अन्य रूपों के रूप में अधिक व्यापक रूप से माना जा सकता है जो दो चर से संबंधित हैं? चाहे आपका दृष्टिकोण संकीर्ण रूप से प्रसारित या व्यापक हो, शायद आप इस बात से सहमत होंगे कि निम्नलिखित विवरण लागू होता है:

सहसंबंध एक विश्लेषण है जो के वितरण के बारे में धारणा बनाता है , या तो चर के विशेषाधिकार के बिना, और उस वितरण के बारे में अधिक विशिष्ट निष्कर्ष निकालने के लिए डेटा का उपयोग करता है।(एक्स,Y)

उदाहरण के लिए, आप यह मानकर शुरू कर सकते हैं में एक द्विभाजित सामान्य वितरण है और उस वितरण के किसी एक पैरामीटर का अनुमान लगाने के लिए डेटा के पियर्सन सहसंबंध गुणांक का उपयोग करें। यह सहसंबंध की सबसे संकीर्ण (और सबसे पुरानी) धारणाओं में से एक है।(एक्स,Y)

एक अन्य उदाहरण के रूप में, आप मान सकते हैं कि कोई वितरण हो सकता है और k "केंद्रों" की पहचान करने के लिए क्लस्टर विश्लेषण का उपयोग कर सकता है । एक टीका हो सकता है कि के वितरण का एक संकल्प की शुरुआत के रूप में ( एक्स , वाई ) unimodal द्विचर वितरण का मिश्रण है, प्रत्येक समूह के लिए एक में।(एक्स,Y)कश्मीर(एक्स,Y)

इन सभी दृष्टिकोणों में एक चीज सामान्य है और वाई का एक सममितीय उपचार : न तो दूसरे पर विशेषाधिकार प्राप्त है। दोनों बराबर भूमिका निभाते हैं।एक्सY

वापसी

प्रतिगमन एक स्पष्ट, सार्वभौमिक रूप से समझी गई परिभाषा प्राप्त करता है:

प्रतिगमन एक्स (रजिस्ट्रार) को दिए गए (प्रतिक्रिया) के सशर्त वितरण की विशेषता है ।Yएक्स

ऐतिहासिक रूप से, प्रतिगमन गैलटॉन की खोज करने के लिए अपनी जड़ों (सी। 1885) बताते हैं कि द्विचर सामान्य डेटा एक का आनंद रेखीय प्रतिगमन: की सशर्त उम्मीद वाई रैखिक कार्य है एक्स । विशेष सामान्य स्पेक्ट्रम के एक पोल पर साधारण कम से कम वर्गों (OLS) प्रतिगमन जहां की सशर्त वितरण है Y सामान्य माना जाता है ( β 0 + β 1 एक्स , σ 2 ) तय मापदंडों के लिए β 0 , β 1 , और σ(एक्स,Y)Yएक्सY(β0+β1एक्स,σ2)β0,β1,σ डेटा से अनुमान लगाया जाना है।

इस स्पेक्ट्रम के अत्यंत सामान्य छोर पर सामान्यीकृत रैखिक मॉडल, सामान्यीकृत योज्य मॉडल, और उनके इलके हैं जो ओएलएस के सभी पहलुओं को आराम देते हैं: अपेक्षा, विचरण और यहां तक ​​कि के सशर्त वितरण के आकार को गैर-भिन्न रूप से भिन्न करने की अनुमति दी जा सकती है। एक्स के साथ । यह अवधारणा जो इस सभी सामान्यीकरण से बचती है, वह यह है कि ब्याज यह समझने पर केंद्रित है कि Y , X पर कैसे निर्भर करता है । वह मौलिक विषमता अभी भी है।Yएक्सYएक्स

सहसंबंध और प्रतिगमन

एक बहुत ही विशेष स्थिति दोनों दृष्टिकोणों के लिए सामान्य है और अक्सर सामना किया जाता है: द्विभाजित सामान्य मॉडल। इस मॉडल में, डेटा का एक स्कैल्प्लॉट एक क्लासिक "फुटबॉल," अंडाकार, या सिगार आकार ग्रहण करेगा: डेटा अक्षीय रूप से कुल्हाड़ियों के एक ऑर्थोगोनल जोड़े के चारों ओर फैले हुए हैं।

  • एक सहसंबंध विश्लेषण इस रिश्ते की "ताकत" पर केंद्रित है, इस अर्थ में कि प्रमुख अक्ष के चारों ओर एक अपेक्षाकृत छोटा प्रसार "मजबूत" है।

  • जैसा कि ऊपर कहा गया है, एक्स पर वाई का प्रतिगमन (और, समान रूप से, पर एक्स का प्रतिगमन रेखीय है) : प्रतिक्रिया की सशर्त अपेक्षा , प्रतिगामी का एक रैखिक कार्य है।Yएक्सएक्सY

(यह इन दोनों विवरणों के बीच स्पष्ट ज्यामितीय अंतरों को इंगित करने योग्य है: वे अंतर्निहित सांख्यिकीय अंतरों को प्रकाशित करते हैं।)

पांच बीवरिएट सामान्य मापदंडों में से (दो साधन, दो फैलता है, और एक और जो दो चर के बीच निर्भरता को मापता है), एक सामान्य हित का है: पांचवां पैरामीटर, । यह सीधे (और बस) से संबंधित हैρ

  1. के गुणांक के प्रतिगमन में वाई पर एक्सएक्सYएक्स

  2. के गुणांक के प्रतिगमन में एक्स पर वाईYएक्सY

  3. दोनों में से किसी एक में सशर्त रूपांतर और ( 2 )(1)(2)

  4. एक फैलाने की कुल्हाड़ियों के आसपास ( एक्स , वाई के रूप में मापा जाता है)।(एक्स,Y)

एक्स और वाई की भूमिकाओं को भेद किए बिना एक सहसंबंध विश्लेषण पर केंद्रित है ।(4)एक्सY

एक प्रतिगमन विश्लेषण के संस्करणों पर केंद्रित है के माध्यम से ( 3 ) regressor और प्रतिक्रिया चर के चुनाव के लिए उपयुक्त।(1)(3)

एच0:ρ=0Yएक्सआरβ^

यह सामान्य अनुप्रयोग, जो पहले कोई भी सीखता है, यह पहचानना मुश्किल बना सकता है कि उनकी अवधारणाओं और उद्देश्यों में कितने अलग-अलग संबंध और प्रतिगमन हैं। यह केवल तब होता है जब हम उनके सामान्यीकरण के बारे में सीखते हैं कि अंतर्निहित अंतर सामने आते हैं। जीएएम को "सहसंबंध" के बारे में अधिक जानकारी देने के लिए बाध्य करना मुश्किल होगा, जैसे कि "प्रतिगमन" के रूप में क्लस्टर विश्लेषण को फ्रेम करना मुश्किल होगा। दो अलग-अलग उद्देश्यों के साथ प्रक्रियाओं के अलग-अलग परिवार हैं, जो उचित रूप से लागू होने पर प्रत्येक अपने आप में उपयोगी हैं।


आरβ^


आर

1
r(X,Y)आर

मैं कीड़े के इस कैन को कुछ समय के लिए छोड़ दूंगा :) :) आपकी टिप्पणी के लिए धन्यवाद @ शुभंकर!
स्टीफन

3

जैसा कि @ व्हिबर के उत्तर से पता चलता है कि कई मॉडल और तकनीकें हैं जो सहसंबंध की छतरी के नीचे आ सकती हैं, जिनके प्रतिगमन दुनिया में स्पष्ट एनालॉग नहीं हैं और इसके विपरीत। हालाँकि, बड़े और जब लोग इस बारे में सोचते हैं, तुलना और प्रतिगमन और सहसंबंध, वे वास्तव में एक ही गणितीय सिक्के के दो पक्षों (आमतौर पर एक रेखीय प्रतिगमन और एक पियर्सन सहसंबंध) पर विचार कर रहे हैं। क्या उन्हें विश्लेषण के दोनों परिवारों के बारे में व्यापक विचार करना चाहिए, यह एक अलग बहस का विषय है, और एक यह कि शोधकर्ताओं को कम से कम पहलवानी करनी चाहिए।

एक्सy(एक्स,y)

प्रतिगमन और सहसंबंध दोनों के इस संकीर्ण दृष्टिकोण में निम्नलिखित स्पष्टीकरणों को यह बताने में मदद करनी चाहिए कि उनके अनुमान, मानक त्रुटियां और पी मान एक दूसरे के अनिवार्य रूप से कैसे भिन्न हैं।

डेटाफ्रेम datहोने के साथ longleyऊपर संदर्भित डेटा सेट हमें कोर के लिए निम्नलिखित मिलता है। (यहाँ कुछ नया नहीं है जब तक कि आप ऊपर दिए गए सवाल पर नहीं गए और सीधे उत्तर पढ़ने के लिए चले गए):

> cor.test(dat$Employed, dat$Population)

    Pearson's product-moment correlation

data:  dat$Employed and dat$Population
t = 12.896, df = 14, p-value = 3.693e-09
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 0.8869236 0.9864676
sample estimates:
      cor 
0.9603906 

और रैखिक मॉडल के लिए निम्नलिखित (ऊपर भी समान):

> summary(lm(Employed~Population, data=dat))

Call:
lm(formula = Employed ~ Population, data = dat)

Residuals:
    Min      1Q  Median      3Q     Max 
-1.4362 -0.9740  0.2021  0.5531  1.9048 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)   8.3807     4.4224   1.895   0.0789 .  
Population    0.4849     0.0376  12.896 3.69e-09 ***
---
Signif. codes:  
0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 1.013 on 14 degrees of freedom
Multiple R-squared:  0.9224,    Adjusted R-squared:  0.9168 
F-statistic: 166.3 on 1 and 14 DF,  p-value: 3.693e-09

अब इस उत्तर के लिए नए घटक के लिए। सबसे पहले, Employedऔर Populationचर के दो नए मानकीकृत संस्करण बनाएं :

> dat$zEmployed<-scale(dat$Employed)
> dat$zPopulation<-scale(dat$Population)

दूसरा प्रतिगमन फिर से चलाएं:

> summary(lm(zEmployed~zPopulation, data=dat))

Call:
lm(formula = zEmployed ~ zPopulation, data = dat)

Residuals:
     Min       1Q   Median       3Q      Max 
-0.40894 -0.27733  0.05755  0.15748  0.54238 

Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept) -2.956e-15  7.211e-02     0.0        1    
zPopulation  9.604e-01  7.447e-02    12.9 3.69e-09 ***
---
Signif. codes:  
0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.2884 on 14 degrees of freedom
Multiple R-squared:  0.9224,    Adjusted R-squared:  0.9168 
F-statistic: 166.3 on 1 and 14 DF,  p-value: 3.693e-09

देखा! प्रतिगमन ढलान ऊपर से सहसंबंध गुणांक के बराबर है। प्रश्न 1 का उत्तर तो यह है कि दोनों परीक्षणों की धारणाएं अनिवार्य रूप से समान हैं:

  1. अवलोकनों की स्वतंत्रता
  2. बीच एक रैखिक संबंधएक्सy
  3. एन(0,σ2)
  4. त्रुटि शब्दों को समान रूप से प्रतिगमन लाइन के प्रत्येक अनुमानित मूल्य पर वितरित किया जाता है (यानी, त्रुटि भिन्नता की एकरूपता)

एक्सy

के लिए प्रश्न 2 , के प्रतिगमन ढलान ऊपर (आर कोड में निहित है - लेकिन एकमुश्त नीचे वर्णित) का इस्तेमाल किया सूत्र की मानक त्रुटि के साथ शुरू करते हैं:

=Σ(एक्समैं-एक्स¯)(Yमैं-Y¯)Σ(एक्समैं-एक्स¯)2

वीआर()एक्समैं=(एक्समैं-एक्स¯)Yमैं=(Yमैं-Y¯)

वीआर()=वीआर(Σ(एक्समैंYमैं)Σ(एक्समैं2))

उस सूत्र से आप निम्न, संघनित और अधिक उपयोगी अभिव्यक्ति प्राप्त कर सकते हैं ( चरण-दर-चरण के लिए यह लिंक देखें ):

वीआर()=σ2Σ(एक्समैं-एक्स¯)2
एस()=वीआर()=σ2Σ(एक्समैं-एक्स¯)2

σ2

मुझे लगता है कि यदि आप इस समीकरण को अनधिकृत और मानकीकृत (यानी, सहसंबंध) रैखिक मॉडल के लिए हल करते हैं, तो आपको अपने ढलानों के लिए समान पी और टी मान मिलेगा। दोनों परीक्षण सामान्य से कम वर्गों के अनुमान पर निर्भर हैं और एक ही धारणा बनाते हैं। व्यवहार में, कई शोधकर्ता सरल लीनियर प्रतिगमन मॉडल और सहसंबंध दोनों के लिए धारणा जाँच पर छोड़ देते हैं, हालांकि मुझे लगता है कि सहसंबंधों के लिए ऐसा करना और भी अधिक प्रचलित है क्योंकि कई लोग उन्हें सरल रेखीय प्रतिगमन के विशेष मामलों के रूप में नहीं पहचानते हैं। (नोट: यह अपनाने के लिए एक अच्छा अभ्यास नहीं है)


2
यह उत्तर प्रश्न में पुन: प्रस्तुत @whuber के उद्धरण को संबोधित नहीं करता है, जहां वह दावा करता है कि मान्यताएं अलग हैं। क्या आपके कहने का मतलब यह है कि यह कथन गलत था?
अमीबा का कहना है कि मोनिका

यदि आप इन समीकरणों का पालन करते हैं, तो एक पियरसन के सहसंबंध में एक साधारण रेखीय प्रतिगमन की एक ही मूल धारणा है। मैं इस पर अधिक स्पष्ट रूप से अपनी प्रतिक्रिया में संशोधन कर सकता हूं।
मैट बैरस्टेड

1
आपके उत्तर के लिए धन्यवाद! मुझे ज्ञात था कि सहसंबंध गुणांक मानकीकृत होने पर प्रतिगमन ढलान के बराबर होता है। यह मेरे प्रश्न में लिंक 3 और 4 में दिखाया गया था। मुझे आपके द्वारा सूचीबद्ध सामान्य मान्यताओं के बारे में भी पता था और इसीलिए @whuber की टिप्पणी ने मुझे इस प्रश्न के लिए प्रेरित किया। मुझे स्पष्ट रूप से कहा जाना चाहिए कि मैं किन धारणाओं से अवगत हूं - मेरी माफी।
स्टीफन

1
आरआरr <- 0.9603906; n <- 16; r/(sqrt((1-r^2)/(n-2))) # 12.8956

0

यहाँ परीक्षण के समतुल्य की व्याख्या है, यह भी दिखाया गया है कि कैसे r और b संबंधित हैं।

http://www.real-statistics.com/regression/hypothesis-testing-significance-regression-line-slope/

OLS करने के लिए, आपको https://en.wikipedia.org/wiki/Ordinary_least_squares#Assumations बनाना होगा

इसके अतिरिक्त, ओएलएस और क्रॉस को यादृच्छिक नमूने की धारणा की आवश्यकता होती है।

एक क्रॉस टेस्ट का निर्माण

हमारे पास (x, y) की जनसंख्या से "यादृच्छिक और पर्याप्त पर्याप्त नमूना" है।


0

प्रश्न २ के संबंध में

to1 के बजाय r का उपयोग करके समान टी-मान की गणना कैसे करें

टीआरएफआर

एफ=आर2/कश्मीर(1-आर2)/(n-कश्मीर)

कश्मीर=2n=टीपीमैंnटीरों

प्रतिबंध के साथ कि

... एफ अनुपात का उपयोग तब नहीं किया जा सकता है जब मॉडल में अवरोधन न हो

स्रोत: कई प्रतिगमन मॉडल में परिकल्पना परीक्षण


1
मैंने मूल पोस्ट पर वापस देखा कि आप किस प्रश्न का उत्तर दे सकते हैं। मुझे दो मिले, गिने गए 1 (मान्यताओं के बारे में) और 2 (एक टी-वैल्यू की गणना के बारे में), लेकिन न तो इस जवाब से पता लगता है। क्या आप हमें अधिक स्पष्ट रूप से बता सकते हैं कि आप किस प्रश्न का उत्तर दे रहे हैं?
whuber

1
आर

1
मुझे लगता है कि मैं समझता हूं, शायद मैं सामान्य के बजाय विशिष्ट मामले में सवाल का जवाब दे रहा था। मुझे लगता है कि इस सामान्य मामले पर विचार करने में सक्षम होने के लिए एक सामान्य अशक्त और वैकल्पिक परिकल्पना के संदर्भ में प्रश्न को बताने में सक्षम होना उपयोगी होगा, क्योंकि मैं ऐसा करने के लिए संघर्ष कर रहा हूं।
हैरी सालमन

मैं सहमत हूं: सहसंबंध और प्रतिगमन विश्लेषण के लिए स्पष्ट मॉडल और निर्णय मानदंड प्रदर्शित करने से उन्हें अलग पहचान बनाने में बहुत मदद मिलेगी। कभी-कभी एक अच्छे उत्तर में प्रश्न को रीफ्रैम करने या स्पष्ट करने की तुलना में थोड़ा अधिक होता है, और अक्सर सबसे अच्छे उत्तर प्रश्न के प्रभावी प्रतिबंधों से शुरू होते हैं, इसलिए उस दिशा में जाने से डरो मत।
whuber
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.